자체 개발 모델 카나나 패밀리 공개
"효율성 높은 모델로 사용자 가치 제공"
멀티모달, 이미지·영상 생성 모델도 선보여
카메라로 사물 비추고 AI와 실시간 대화
인공지능(AI) 기술 경쟁에서 다소 뒤처져 있던 카카오가 자체 개발한 AI 모델 10종을 공개했다. 크기별 거대언어모델(LLM)부터 이미지·영상 생성 모델까지 다양한 라인업을 갖췄다. 압도적인 모델 크기와 성능을 추구하기보다는 카카오 서비스에 최적화된 모델을 적용해 비용 효율성과 사용자 만족도를 높이겠다는 전략을 내세웠다.
카카오는 23일 경기 용인 AI 캠퍼스에서 열린 개발자 행사 ‘이프 카카오 2024(if kakao 2024)’ 둘째 날 행사에서 이 같은 계획을 발표했다.
카카오는 새로운 AI 브랜드인 ‘카나나’를 자체 개발 AI 모델명에도 적용했다. 카나나 패밀리는 ▲LLM 3종 ▲멀티모달 언어모델 3종 ▲이미지·영상 생성모델 2종 ▲음성 모델 2종 등 총 10종이다. 멀티모달은 텍스트, 이미지 등 다양한 유형의 데이터를 이해할 수 있는 모델이다.
LLM은 크기와 성능에 따라 ▲초경량 ‘카나나 나노’ ▲최적화 ‘카나나 에센스’ ▲플래그십 ‘카나나 플래그’로 나뉜다. 핵심 모델인 카나나 에센스는 높은 성능과 비용 효율성을 앞세웠다. 비슷한 크기의 글로벌 모델과 비교해 성능을 견줄 만하고 한국어 처리 실력은 확실한 우위를 나타냈다는 설명이다.
이들 모델의 특징으로는 ‘서비스 최적화’를 꼽았다. 이날 기조연설에 나선 김병학 카나나알파 성과리더는 "LLM은 좋은 성능, 비용 효율성, 서비스의 문제 해결 능력을 갖춰야 한다"며 "카나나 모델을 기반으로 이용자에게 직접적인 도움을 줄 수 있는 AI 서비스화를 앞두고 있다"고 말했다.
김병학 카나나알파 성과리더가 23일 경기 용인 AI 캠퍼스에서 열린 개발자 행사 ‘이프 카카오 2024(if kakao 2024)’ 둘째날 기조발표에 나섰다. [사진=카카오]
원본보기 아이콘카나나 모델은 카카오가 전날 공개한 대화형 초개인화 AI 비서 '카나나'를 비롯해 다양한 AI 서비스에 활용한다. 다만 서비스에 따라 카나나 모델 외에도 오픈소스 모델 등 외부 모델을 조합해 적용할 계획이다. 추론, 이해, 수학 등 각 요소에서 가장 좋은 결과를 내는 모델을 조합하거나, 같은 성능을 내는 모델 중에서도 비용이 낮은 것을 선택하는 방식이다. 전날 정신아 카카오 대표는 "수십 조 단위 자본 경쟁에서 모델 경쟁에 뒤처지지 않으면서도 가장 실용적인 해법으로 사용자 경험을 극대화하고자 한다"고 강조했다.
카카오는 또 멀티모달 언어모델인 ‘카나나-o’도 소개했다. 카나나-o는 텍스트 인식, 음성 인식 등 각 모델을 모듈식으로 결합해 사용하던 기존 구조에서 벗어나 여러 데이터를 통합·처리하는 게 특징이다. 다양한 형태의 데이터를 빠르게 이해하기 때문에 질문에 상관없이 평균 1.6초의 속도로 답변을 출력한다. 응답 속도가 빠른 만큼 궁금한 사물을 휴대폰 카메라로 비춰 AI와 실시간 대화하는 형태로 발전시킬 예정이다.
이미지와 영상 생성이 가능한 모델 2종은 텍스트부터 이미지, 개인 프로필 사진까지 다양한 입력을 처리하는 형태로 개발 중이다. 입력한 이미지를 바탕으로 영상을 생성하는 것을 넘어 간단한 마우스 조작으로 캐릭터의 움직임을 제어하는 등 풍부한 영상 콘텐츠를 제작할 수 있다고 밝혔다.
최유리 기자 yrchoi@asiae.co.kr
꼭 봐야할 주요뉴스
"정우성·문가비 아이, 혼외자 아닌 그냥 '아들'" ... 마스크영역<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>