텍스트 입력하면 아나운서가 더빙…AI 목소리 인기

네이버 클로바더빙, 가입자 100만명 돌파

텍스트 입력하면 아나운서가 더빙…AI 목소리 인기 원본보기 아이콘


[아시아경제 최유리 기자] 텍스트만 입력하면 동영상 콘텐츠에 원하는 목소리를 입힐 수 있는 서비스가 인기를 끌고 있다. 인공지능(AI)이 문자를 인식한 후 음성으로 변환하는 기술을 입힌 서비스로 감정을 표현하는 기술까지 진화하고 있다.


4일 네이버에 따르면 AI 더빙 서비스 '클로버 더빙(CLOVA Dubbing)' 가입자가 100만명을 돌파했다. 지난 2020년 6월 가입자 10만 명을 달성한 이후 2년여 만에 10배로 증가한 것이다.

클로버 더빙은 텍스트 입력만으로 동영상 콘텐츠에 원하는 AI 보이스를 입힐 수 있는 네이버의 문자 음성 변환(Text-to-Speech) 서비스다. 음성합성 기술을 기반으로 다양한 AI 보이스를 제공한다.


현재 클로버 더빙에서는 193개에 이르는 보이스가 제공된다. 성별, 나이, 국적에 따른 여러 스타일의 보이스뿐만 아니라 리포터, 쇼핑호스트, 내레이션 등 구체적인 상황에 적합한 보이스도 각각 제공한다.


실제 클로버 더빙은 소상공인의 매장 및 상품 소개 영상, 스타트업 광고 영상, 개인 브이로그, 반려동물 영상 등 많은 콘텐츠에 사용되고 있다. 현재까지 누적 더빙 수 약 3300만건, 더빙 콘텐츠 다운로드 수 약 370만건을 기록했다.

스마트폰 녹음만으로 누구나 고품질의 커스텀 보이스를 만들 수 있는 '보이스 메이커(Voice Maker)'를 통해 제작된 일반 사용자의 AI 보이스도 빠르게 증가하고 있다.


현재 클로버 더빙에서 제공되는 AI 보이스 중 보이스 메이커를 통해 제작된 목소리는 100여개로 전체 보이스의 절반에 달한다. 일반 사용자들의 목소리가 클로버 더빙 내 AI 보이스의 다양성을 증가시키며 풍부한 더빙 선택지를 제공하고 있다는 설명이다.


클로버 더빙은 제공하는 AI 보이스 범위를 꾸준히 확장해나갈 계획이다. 최근 ‘영국식 영어’를 구사하는 4개의 신규 보이스를 추가해 총 10개의 영어 보이스를 갖추게 됐다.


'차분한', '친근한', '똑 부러지는' 등 현재 다양한 분위기의 보이스를 제공하고 있는 것에서 나아가, 하나의 보이스로 다른 감정들을 표현할 수 있는 기능도 추가할 계획이다.


김재민 네이버 클로바 CIC 책임리더는 "동영상 콘텐츠 제작 수요가 계속해서 증가하는 가운데 클로버 더빙은 세분화된 콘텐츠 제작 목적에 적합한 보이스들을 제공하며 사용자들의 호응을 얻을 수 있었다"며 "보이스 메이커를 통해 사용자가 목소리 제작에 직접 참여하는 AI 보이스 생태계를 구축해나가는 한편, 클로버 더빙의 AI 보이스들이 더빙 콘텐츠와 더불어 다양한 사업과 서비스에 활용될 수 있는 방안을 지속해서 고민할 것"이라고 말했다.




최유리 기자 yrchoi@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>