[科技Talk]当AI开始做梦会怎样

by Lim Juhyeong

Published 09 Jul.2023 07:30(KST)

Updated 20 Dec.2023 10:40(KST)

open/close

英初创开发“世界模型”引关注
通过“清醒梦”提升学习能力的AI
人与机器的学习方式愈发相似

人类在睡眠时做的梦，被认为是具备自我意识的高等生物所独有的能力。狗、猫等哺乳动物，以及章鱼等部分高智商生物也会做梦，但据悉，能够做又长又清晰梦境的物种，只有人类。

那么，高度发达的人工智能（AI）也能做梦吗？如果有一天AI真的可以“做梦”，又会对技术产生怎样的影响呢？

英国自动驾驶技术企业 Wave 开发的世界模型 Gaia-1 的运行画面。该视频并非真实行车场景，而是由人工智能生成的影像。Wave 提供

上月21日（当地时间），英国自动驾驶技术开发初创企业Wayve推出了一种全新的AI类型——“世界模型”。Wayve的世界模型名为“GAIA”，用户输入指令后，它就会将相关内容以视频形式呈现出来。

乍一看，GAIA与最近流行的生成式AI并无太大差别。某种程度上确实如此：GAIA本身是将多种图像、视频生成AI整合而成的模型。

不过，GAIA与众不同之处在于，它是专门为自动驾驶汽车打造的模型。此外，它能将指令转化为极为具体的画面，这一点也形成了差异化。就像驾驶员以第一人称视角做一场栩栩如生的梦一样。甚至还能根据指令切换视频中的昼夜时间，环顾周围景色，甚至改变同一段视频的视角。

通过 Gaia-1，自动驾驶人工智能可以生成并学习大量行驶场景情景。图片由 Wavye 提供

观看过GAIA模型演示的人评价称，这就像是“AI在做的梦”。严格来说，更接近于人类能够主动控制梦境环境的“清醒梦”。

Wayve创始人、以计算机视觉AI权威著称的Alex Kendall也预言，通过GAIA模型，AI的性能将再次实现飞跃。

那么，“会做梦的AI”为何重要？Kendall强调，通过GAIA，AI可以不断自主学习各种情境，进行模拟，并理解自身行为。对于像自动驾驶这样存在大量“现实变量”介入的场景，这种能力极为关键。

自动驾驶技术面临的最大障碍是安全问题。有人和车辆通行的道路充满各种变量，而以目前的技术水平，AI很难对无法预料的情况做出主动应对。因此，必须将各种驾驶场景数据化并用于训练，但传统的机器学习方式存在明显局限。

如果借助GAIA模型，让AI在“虚拟环境”中不断遭遇各种情况并掌握不同的情境模式，那么训练所需的成本和时间就会大幅缩减。

人在做梦的睡眠阶段——快速眼动（REM）睡眠期间，大脑处于高度活跃状态，并对一天中接受到的各种刺激进行整理。

从这一点看，GAIA模型的功能与人类做梦颇为相似。我们至今仍不知道包括人类在内的多种高等脊椎动物“为什么”会做梦，但却大致了解梦对生物“产生怎样的作用”。

当人进入开始做梦的“快速眼动睡眠（REM睡眠）”阶段时，身体几乎所有机能都处于休眠状态，但大脑活动却更加活跃。因此，学界有观点认为，梦是“处于休息状态的人类在无意识中调节大脑功能的一种方式”。

实际上，2021年美国塔夫茨大学研究团队提出一项假说：快速眼动睡眠可能是修复“大脑过度拟合（overfitting）状态”的过程。人类在清醒时不断接受大量刺激，这些刺激会作为“数据”保存在大脑中。

然而，当某类数据量过多或过少，导致出现“过度拟合”状态时，大脑功能就会出现异常。梦通过将现实中接受到的刺激进行随机重组并呈现给大脑，从而缓解这种过度拟合。

令人惊讶的是，“过度拟合”在AI中也十分常见。当某类数据输入过多时，AI会对特定模式产生“过度自信”；而当数据过少，又会对情境产生混淆。Wayve的GAIA模型通过向AI呈现由既有训练数据混合生成的虚拟场景，从而调节自动驾驶AI的行为。

美国电动汽车企业特斯拉的自动驾驶开发部门也构建了类似的基于生成式人工智能的视频测量模型。推特提供

参与世界模型开发竞赛的企业并非只有Wayve。正在研发自动驾驶服务“全自动驾驶（Full Self-Driving）”的特斯拉，也已着手开发与GAIA类似的模型。

此外，Kendall预言，世界模型不仅会在自动驾驶领域掀起波澜，在机器人领域也将产生巨大影响。由于可以将长期困扰机器人开发的视觉感知问题——即计算机视觉数据——整合进世界模型，因此有望实现更快速、更低成本的AI训练。

从这一发展趋势来看，AI的机器学习与人类智能正日益相似。正如人类通过做梦来整理大脑接收到的刺激数据一样，计算机也已经开始通过各种生成模型，探索能够自主优化自身性能的方法。

本报道由人工智能(AI)翻译技术生成。