한국어 모델 성능을 평가하는 ‘오픈 Ko-LLM 리더보드’에 뉴 페이스가 등장했다. 명대우 마인즈앤컴퍼니 엔지니어가 업스테이지와 한국지능정보사회진흥원(NIA)이 공동으로 주최하는 12월 3주 순위에서 3위로 치고 올라왔다.
명대우 엔지니어의 모델은 ‘라마 2’를 기반으로 ‘직접 선호 최적화(DPO)’ 강화학습법을 적용한 매개변수 13억개(13B) 모델이다.
한국어 모델 성능을 평가하는 ‘오픈 Ko-LLM 리더보드’에 뉴 페이스가 등장했다. 명대우 마인즈앤컴퍼니 엔지니어가 업스테이지와 한국지능정보사회진흥원(NIA)이 공동으로 주최하는 12월 3주 순위에서 3위로 치고 올라왔다.
명대우 엔지니어의 모델은 ‘라마 2’를 기반으로 ‘직접 선호 최적화(DPO)’ 강화학습법을 적용한 매개변수 13억개(13B) 모델이다.