크래프톤 은 SK텔레콤 과 공동으로 개발한 7B(70억) 매개변수(파라미터) 규모의 추론 특화 인공지능(AI) 언어모델 3종을 공개했다고 28일 밝혔다. 이번에 공개된 모델들은 오픈팅커(OpenThinker)2·3와 에이스리즌(AceReason)3 등 총 3종이다.
이번에 공개한 모델들은 수학 문제 해결과 코드 개발에 특화된 소형 언어 모델(SLM)로, 크래프톤이 독자 개발한 학습 기법을 적용했다. 해당 모델은 이 기법을 바탕으로 수학 추론 벤치마크 'AIME 25'에서 성능 향상을 기록했다.
수학은 공간지각과 논리 추론 역량이 요구되는 영역으로, 게임을 포함한 고난도 추론 분야와 기술적 연관성이 있다는 게 양사의 설명이다.
크래프톤과 SKT는 언어 모델을 공동 개발하며 각각 학습 기법 개선과 인프라 구축을 담당했다.
구체적으로 크래프톤은 기존 모델의 취약점을 분석해 이를 개선하는 오답 복기 학습 기법을 자체 개발했다. 해당 기법은 틀린 문제의 정답을 찾아 오답과 비교해 학습하며 추론 정확도와 효율성을 동시에 높이는 학습 방식이다. SKT는 데이터 검증과 모델 학습의 인프라 구축을 맡아 모델의 품질과 안정성 확보를 담당했다.
김지원 SK텔레콤 AI모델랩장은 "양사의 기술로 고성능 언어 모델을 개발해 소버린 AI 전략 실현의 초석을 마련했다"면서 "앞으로도 긴밀한 협력을 통해 AI 기술 주권을 확보하는 데 지속적으로 기여할 것"이라고 전했다.
이강욱 크래프톤 딥러닝 본부장은 "이번 SKT와의 협업을 통해 글로벌 수준의 대형 언어 모델 개발 역량을 확인할 수 있었다"면서 "크래프톤은 독자적인 AI 기술력을 바탕으로 게임을 비롯한 다양한 산업 분야에 이를 적용해 나갈 계획"이라고 말했다.
크래프톤은 이번 언어 모델에 적용한 학습 기법을 게임 플레이 분석, 전략 판단 등 게임 특화형 AI 응용 기술 고도화에 활용할 계획이다. 동시에 다양한 규모의 LLM을 개발할 방침이다.
한편, 이번에 공개된 언어 모델은 글로벌 AI 오픈소스 플랫폼 '허깅페이스'(Hugging Face)를 통해 공개돼 누구나 자유롭게 활용할 수 있다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>