"국산 AI 학습데이터 모은다"…정부, 민관 협력 공급기관 모집

AI 파운데이션 모델 개발에 활용할 데이터 확보 본격화
데이터 가공·서비스 우선권 등 인센티브 제공

"국산 AI 학습데이터 모은다"…정부, 민관 협력 공급기관 모집 원본보기 아이콘

과학기술정보통신부가 국산 인공지능(AI) 파운데이션 모델 개발을 위해 공공·민간 데이터 보유 기관을 대상으로 대규모 학습데이터 모집에 나선다고 23일 밝혔다.


과기정통부는 이날부터 7월 21일까지 '독자 AI 파운데이션 모델 프로젝트'의 일환으로 데이터 공급기관 공개 모집을 진행한다고 발표했다. 세계 최고 수준의 거대언어모델(LLM) 개발이 목표다.

이 프로젝트는 정부가 올해부터 본격 추진하는 AI 전략 사업이다. 향후 공모를 통해 선발될 개발팀에 GPU, 데이터, 인재 등 핵심 인프라를 집중 지원해 독자적인 초거대 AI 개발을 뒷받침한다는 구상이다.


데이터 공급기관은 유·무료 고품질 데이터를 보유한 공공·민간 기관이 대상이다. 최종 활용 여부는 개발팀 선발 이후 수요에 따라 협약으로 결정된다. 협약은 데이터 공급기관과 과기정통부 산하 한국지능정보사회진흥원(NIA)·한국데이터산업진흥원(K-Data), 개발팀 간 체결된다.


정부는 공급기관에 다양한 인센티브를 제공한다. 데이터 가공·전처리 비용을 지원하고, 유료 저작물의 경우 조건에 맞는 비용을 보전한다. 여기에 AI 서비스 우선 도입 기회, 데이터 바우처 등 정부 사업 가점, AI허브를 통한 유통·거래 지원 등도 검토 중이다.

김경만 과기정통부 인공지능기반정책관은 "고품질 데이터는 인공지능 성능을 결정짓는 핵심 요소"라며 "민관이 함께 만드는 데이터 협력 체계가 세계적 수준의 한국형 LLM 개발의 초석이 될 것"이라고 말했다.


정부는 공급기관 모집 이후 8월 중 개발팀을 선발하고, 수요 기반으로 데이터 협약을 체결할 예정이다. 데이터 제공 조건과 활용범위, 비용, 책임관계 등을 명확히 해 분쟁 소지를 최소화한다는 방침이다. 공급기관 신청은 이메일로 가능하며, 신청서와 데이터 제공 계획서, 사업자등록증 등 서류가 필요하다.





박유진 기자 genie@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>