生成式人工智能(AI)竞争正从大规模语言模型(LLM)扩展到能够理解物理环境并预测行为结果的“世界模型”。
当地时间3日,在西班牙巴塞罗那菲拉格兰维亚展览中心举行的“世界移动通信大会(MWC)2026”上,荣耀的机器人正在进行步行演示。2026.3.3 记者 Kang Jinhyung
View original image2日,全球大型科技公司和人工智能企业判断,世界模型是迈向通用人工智能(AGI)的踏脚石,正纷纷投入相关研究开发(R&D)。世界模型是一种理解现实世界物理法则并预测动态情境变化的技术。与侧重对话、理解语言和图像的LLM不同,世界模型能够理解全新环境和非结构化数据,并进行自主判断。因此,它被视为不依赖预先输入的规则或受限数据、能自主行动的“物理AI”实现的核心技术。
近期,谷歌DeepMind将能够通过文本生成3D虚拟环境的通用世界模型“Genie 3”与谷歌街景的真实图像连接。借此,可以基于真实地点构建一个AI智能体和机器人能够相互作用的模拟环境。
英伟达也通过“Cosmos”模型生成用于机器人和自动驾驶AI学习的虚拟环境。通过理解物理环境的“Cosmos Reason”和控制行为的“Cosmos Policy”等模块,可以生成训练物理AI所需的合成数据。
在韩国国内,NC AI作为国防科学研究所物理AI国家项目的承接方参与其中,主导世界模型的开发。这是一项将构建大规模高精度三维虚拟世界的技术诀窍与自有3D生成AI技术相融合的战略。Naver也开发了以首尔为基础的城市级生成模型“首尔世界模型”,从而确保对现实时空的高精度还原。
谷歌DeepMind首席技术官(CTO)Koray Kavukcuoglu表示:“世界模型是通往AGI的重要组成部分,我们需要的不是只‘看视频就理解’,而是能够理解运动规律和物理法则、从而模拟现实世界的模型”,并解释称:“在高层次推理领域,必须同时考虑真实物理世界与文本信息来作出决策。”
软件政策研究所发布的报告《世界模型:理解现实的AI进化》建议,韩国应利用自身在制造业的优势,将数据资产化,并按产业领域有针对性地培育世界模型。报告称:“应系统性地收集高密度生产现场产生的物理行为数据,构建‘面向世界模型的制造数据集’,并在国内优势领域打造专门化的世界模型,以确保在全球竞争中取得优势。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。