한국어전문가 레벨 평가서 최고 수준 점수
멀티모달 결합…시각추론 기술도 확보
추론모델 오픈소스 공개 계획도
네이버( NAVER )는 독자 기술을 활용, 추론 능력을 강화한 생성형 인공지능(AI) 모델 '하이퍼클로바X 씽크(HyperCLOVA X THINK)'의 개발을 완료했다고 30일 밝혔다. 네이버는 이날 모델의 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트를 발표했다.
추론 모델은 이른바 '생각하는 힘'이 강화된 AI다. 사용자가 질의를 입력하면 모델이 혼잣말하듯이 길게 생각해 답변을 내놓는다. 이 과정에서 복잡한 문제를 작은 단위로 나누는 능력, 적절한 도구나 함수를 선택하는 능력, 실수를 반추하고 교정하는 능력이 활용돼 정보의 정확도와 유용성이 커진다.

네이버는 추론 능력을 강화한 생성형 인공지능(AI) '하이퍼클로바X 씽크(HyperCLOVA X THINK)'의 개발을 완료하고 테크니컬 리포트를 공개했다. 네이버 제공
하이퍼클로바X 씽크는 추론 능력을 기반으로 언어에 대한 이해를 높은 수준으로 끌어올렸다. 네이버에 따르면 '코발트(KoBALT)-700' 벤치마크로 주요 거대언어모델(LLM)의 언어 능력을 측정한 결과, 하이퍼클로바X 씽크는 비슷한 규모의 국내 주요 추론모델이나 글로벌 최고 수준 오픈소스 모델보다 높은 점수를 기록했다.
이 벤치마크는 LLM의 한국어 이해도를 진단하기 위해 서울대 언어학과에서 설계했다. AI가 대화의 격률을 적절하게 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성됐다.
또 다른 대표적인 한국어 성능 평가 지표인 '해례(HAERAE)-Bench'에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다.
나아가 네이버는 하이퍼클로바X 씽크를 통해 언어뿐 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했다. 테크니컬 리포트에 따르면 HyperCLOVA X THINK는 'STEM(Science, Technology, Engineering, Mathematics)' 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 거쳐 정답을 맞혔다.
예를 들어 수능 생명과학 문제에서 그림으로 제시된 '생태계 천이 과정'과 '특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프'를 인식·분석하고 이를 관련 지식과 결합해 선택지 중 올바른 서술을 골라낸다.
성능 평가를 담당한 유강민 네이버클라우드 리더는 "이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다"면서 "이미 하이퍼클로바X 기반의 이미지, 영상, 음성 멀티모달 기술을 확보하고 있으므로 향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화해나갈 것"이라고 말했다.
네이버는 추론모델을 오픈소스로도 공개할 계획이다. 앞서 네이버가 지난 4월 공개한 오픈소스 경량 모델 '하이퍼클로바X 시드'는 한 달여 만에 50만 다운로드를 넘겼다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 두 가지 축으로 고도화하고 있으며, 이번 하이퍼클로바X 씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다"면서 "기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 말했다.
이명환 기자 lifehwan@asiae.co.kr
꼭 봐야할 주요뉴스
!["5천 원이면 저녁 배불리 먹겠네"…인터넷보다 싸다는 5K PRICE[가보니]](https://cwcontent.asiae.co.kr/asiaresize/93/2025090413094119652_1756958981.jpg)
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>