[NE 咖啡聊]Syntia:用AI将需时一个月的有声书制作缩短到1小时内
ShinTia代表 Oh Jinhwan 专访
面向全球市场的AI有声书自动制作服务
明年将在全球市场制作7.5万部有声书
在美国,每年出版的图书约400万册,其中被制作成有声书的只有2%,也就是约8万册。仅让配音员朗读一本300页的书就要花上三四天时间,制作完成一部有声书通常需要一个月。制作成本也要数百万韩元。因此,只有销售成绩得到验证的书才会被制作为有声书。Shyntia是一家利用大语言模型(LLM)基础的人工智能(AI)技术,试图革新这种低效有声书制作方式的初创公司。自2020年成立以来打磨的技术,有望在全球AI有声书市场正式开启的2025年大放异彩。
26日,Shyntia首席执行官 Oh Jinhwan表示:“有声书市场长期处于供给不足状态,存在巨大缺口”,“以美国市场为基准,目前有98%的图书没有被制作为有声书,我们正是以这些图书为目标。”Shyntia的AI技术可以在一小时内完成原本需要3~4周才能完成的有声书制作。它并非仅通过文本转语音(TTS)技术把文字简单转换成声音。AI会先通读全书并完成分析,然后再进行朗读。Oh代表解释称:“这是专门为有声书开发的技术,AI会自然地控制呼吸、强弱和情感表达发声”,“如果是有登场人物的小说,AI会生成与人物相匹配的声音。”
AI在阅读完书之后,会合成出最适合朗读的声音。考虑到每个人对不同声音的沉浸度不同,还可以为同一本书制作多个声音版本。对于作者创造的专有名词或虚构事物,则会先获取作者的发音信息,再将其应用到朗读声音中,使发音符合作者的原意。
Oh代表表示,应用这一解决方案后,任何人都可以以低成本制作高质量的有声书。Shyntia暂定的计费方式为每小时9.9美元。以制作一部10小时的有声书为例,只需支付99美元即可。Oh代表称:“我们将为因高昂制作成本而无法制作有声书的作者提供机会,也为读者提供更广泛、可通过聆听来消费内容的方式。”
曾在 ST Unitas 负责海外业务并共同创办全球韩语教育平台 eBridge World 等,在全球业务开发领域积累了专业经验的Oh代表,首先将美国和欧洲市场视为第一目标。虽然目前提供包括韩语在内的19种语言,但从大语言模型应用的成熟度来看,英语市场更适合率先切入。Oh代表表示:“在企业间交易(B2B)方面,大型出版社、有声书平台、音源平台、制作公司等潜在客户众多”,“就音源平台而言,如果AI有声书数量增加,订阅模式也将随之稳固下来。”
不过,竞争对手也并不弱。亚马逊、苹果、谷歌等全球企业已经进入这一市场。从明年起,这些企业利用AI制作的有声书预计将正式大规模涌入市场。全球企业利用AI技术将内容转换为有声书后,只通过自家平台进行分发。Shyntia认为,如果瞄准这一点发力,仍有机会。Oh代表指出:“全球企业采取的是垄断优质图书和作者并进行收益分配的封闭式模式,如果作者希望保持自主性,并将有声书上传到多种平台,这种模式就不适合”,“使用Shyntia的服务,可以以低价、自由地制作有声书,且作者可直接拥有所有权。”在他看来,即便全球企业拿走市场的50~60%,在剩余市场中仍有足够的成长空间。他表示:“我们的目标是在大型玩家占据的50%之外的市场中获得最高份额”,并预测“明年将通过我们的解决方案在全球范围内制作出7.5万部有声书”。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。