[NE 咖啡聊]Eyechemist以3D数字孪生瞄准合成数据市场
3D建模生成合成数据
不同于AI生成物 无同质化隐忧
降低咨询费用 减轻资金负担
在人工智能(AI)时代,竞争力取决于谁能掌握更多高质量数据。然而,仅依靠现实中收集的数据来训练AI存在局限性。Tesla首席执行官(CEO)Elon Musk表示,“在AI训练过程中,人类迄今为止积累的知识总量已经被消耗殆尽”,并提出“合成数据”作为解决方案。所谓合成数据,是通过计算机程序人为生成的数据,其中也包括生成式AI制作的图像和视频。但用AI生成合成数据时,如果反复学习相同模式的数据,AI的预测性能可能会下降,这是目前存在的问题。AiChemist为克服这一局限,开发了应用3D数字孪生技术的合成数据生成器“CEN”。
AiChemist代表 Jung Minuk 25日在接受《亚洲经济》采访时表示:“如果要把现有生成式AI制作的图像用作训练数据,就需要进行标注工作,但CEN在基于3D模型渲染图像的瞬间,就会自动完成数据清洗。”如果说传统生成式AI是对既有数据进行变形以生成新图像,那么CEN则是由用户通过3D建模直接实现所需场景。比如想生成港口图像时,并非简单地合成既有图像,而是会将附着在岩石上的苔藓等细节都精细地以3D方式实现。
这种技术的优势在于,甚至可以生成既有大数据中不存在的数据。Jung代表表示:“国防科学研究所曾请求我们提供约1000张‘夜间背景下的K2坦克’图像,但在既有数据中根本找不到K2的图像”,“于是我们利用3D数字孪生技术,以每秒10个的速度直接生成数据。”
目前,NVIDIA、Unity等全球企业也在运营3D合成数据生成平台。但这些平台是面向3D专家的系统,对数据工程师而言,进入门槛较高,Jung代表如此解释。他表示:“要高效利用海外平台,就必须对3D技术有深入理解,而CEN在设计之初就考虑到让数据工程师也能更加直观地使用。”
AiChemist在降低数据生产平台准入门槛的同时,也着力于节约成本。Jung代表表示:“仅NVIDIA的‘Omniverse’平台年使用费就高达约2000万韩元”,“一般合成数据平台的咨询费用也很高,而CEN则通过让客户在数据生成后,连同验证过程都可自行完成,从而减轻成本负担。”
AiChemist目前的目标是优先在韩国国内合成数据市场扩大份额。以去年为基准,韩国国内数据市场规模为1.4万亿韩元,其中合成数据的占比估计已上升至40%。Jung代表表示:“从今年起,将扩大企业与政府间交易(B2G)业务规模,进一步做大营收”,“从长期来看,我们的目标是与全球信息技术(IT)企业合作,直接提供CEN平台。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。