继LLM之后…理解现实世界的“世界模型”竞争白热化

by Lee Eunseo

Published 02 Jun.2026 07:45(KST)

生成式人工智能（AI）竞争正从大规模语言模型（LLM）扩展到能够理解物理环境并预测行为结果的“世界模型”。

当地时间3日，在西班牙巴塞罗那菲拉格兰维亚展览中心举行的“世界移动通信大会（MWC）2026”上，荣耀的机器人正在进行步行演示。2026.3.3 记者 Kang Jinhyung

2日，全球大型科技公司和人工智能企业判断，世界模型是迈向通用人工智能（AGI）的踏脚石，正纷纷投入相关研究开发（R&D）。世界模型是一种理解现实世界物理法则并预测动态情境变化的技术。与侧重对话、理解语言和图像的LLM不同，世界模型能够理解全新环境和非结构化数据，并进行自主判断。因此，它被视为不依赖预先输入的规则或受限数据、能自主行动的“物理AI”实现的核心技术。

近期，谷歌DeepMind将能够通过文本生成3D虚拟环境的通用世界模型“Genie 3”与谷歌街景的真实图像连接。借此，可以基于真实地点构建一个AI智能体和机器人能够相互作用的模拟环境。

英伟达也通过“Cosmos”模型生成用于机器人和自动驾驶AI学习的虚拟环境。通过理解物理环境的“Cosmos Reason”和控制行为的“Cosmos Policy”等模块，可以生成训练物理AI所需的合成数据。

在韩国国内，NC AI作为国防科学研究所物理AI国家项目的承接方参与其中，主导世界模型的开发。这是一项将构建大规模高精度三维虚拟世界的技术诀窍与自有3D生成AI技术相融合的战略。Naver也开发了以首尔为基础的城市级生成模型“首尔世界模型”，从而确保对现实时空的高精度还原。

谷歌DeepMind首席技术官（CTO）Koray Kavukcuoglu表示：“世界模型是通往AGI的重要组成部分，我们需要的不是只‘看视频就理解’，而是能够理解运动规律和物理法则、从而模拟现实世界的模型”，并解释称：“在高层次推理领域，必须同时考虑真实物理世界与文本信息来作出决策。”

必读新闻

“提前获知总统演讲内容下注”……Trump亲信获利1.5亿韩元

软件政策研究所发布的报告《世界模型：理解现实的AI进化》建议，韩国应利用自身在制造业的优势，将数据资产化，并按产业领域有针对性地培育世界模型。报告称：“应系统性地收集高密度生产现场产生的物理行为数据，构建‘面向世界模型的制造数据集’，并在国内优势领域打造专门化的世界模型，以确保在全球竞争中取得优势。”

한글 기사 보기

本报道由人工智能(AI)翻译技术生成。

继LLM之后…理解现实世界的“世界模型”竞争白热化

必读新闻

不容错过的热点