비큐AI 가 강세다. 최적의 인공지능(AI) 학습 데이터인 '뉴스 데이터'를 보유하고 있다는 점이 주목받는 것으로 보인다.
비플라이소프트는 뉴스 저작권과 AI 기술을 기반으로 미디어 플랫폼 서비스를 제공하는 업체다. 언론사 저작권 신탁기관인 ‘한국언론진흥재단’과 저작권 유통 계약을 체결했다. 뉴스 저작권 유통, 미디어 빅데이터 분석, 개인 맞춤형 뉴스 서비스와 AI 학습용 데이터 등을 제공한다. 체계적 유통과 합법적 권리 확보를 기반으로 약 20년간 3000여개 이상의 국내 언론사 콘텐츠를 수집 및 공급하고 있다.
지면 뉴스를 디지털화하는 ‘아이루트’ 기술과 아이서퍼 플랫폼을 통해 축적한 방대한 뉴스 데이터를 알고리즘 훈련용으로 제공하는 ‘RDP Line’을 선보였다. 비플라이소프트는 국내 최대 규모의 미디어 얼라이언스를 통해 24시간 AI를 통한 실시간 데이터 라벨링 기술을 구축했다고 소개했다. 신문, 방송, 온라인뉴스, 잡지 등 다양한 미디어를 정제하고 가공해 국내 최대 대용량 AI 학습 데이터를 보유하고 있다고 덧붙였다. 네이버 뉴스라이브러리, 대한민국 신문 아카이브, 실시간 API 서비스 등 검증된 데이터 서비스를 제공한다.
비플라이소프트는 약 7억 건의 누적 기사뿐만 아니라 매일 생성되는 20만건의 기사를 확보하고 있다. LLM 학습에 적합한 2000자
내외로 구성된 문서인데다 정치, 경제, 문화, 예술 등 다양한 카테고리의 문서로 분야별 튜닝 데이터로 가치가 크다. 핵심 정보가 압축된 문서·논문, 도서 등과 달리 2000자의 짧은 분량에 핵심적인 내용을 담고 있다. 실시간으로 업데이트가 가능하다는 점도 비플라이소프트 만의 강점으로 꼽혔다. 데이터 신뢰성 측면에서도 뉴스를 능가하는 데이터 원천은 매우 적다고 비플라이소프트의 설명했다.
이건재 IBK투자증권 연구원은 "AI 학습용 데이터 시장이 본격 개화한다면 고품질의 뉴스 데이터를 공급하는 기업으로 부각 받을 가능성이 존재한다"고 설명했다.
AI가 발달할수록 데이터 가치가 커지고 있다. 챗GPT는 미국 뉴스 통신사 AP통신의 뉴스를 학습한다. 챗GPT 개발사 오픈AI와 AP통신은 뉴스 기사 사용 등에 관한 라이선스 계약을 체결했다. 라이선스 계약은 생성 AI를 학습하는 데 필요한 뉴스와 책 등 방대한 양의 정보를 둘러싼 저작권 논란이 제기되고 있기 때문으로 풀이된다.
마크 베니오프 세일즈포스 최고경영자(CEO)는 최근 스위스 다보스포럼 기간 인터뷰에서 "AI 기업이 기술 구축을 위해 지식재산권(IP)을 훔쳤다"며 "AI 기업은 콘텐츠 제작자를 공정하게 대우하기 위해 지불 방식을 표준화해야 한다"고 지적했다.
박형수 기자 parkhs@asiae.co.kr
꼭 봐야할 주요뉴스
조국, '尹 탄핵안' 표결 못해…"잠시 여러분 곁을 ... 마스크영역<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>