人工智能行业关注的递归式自我改进人工智能
瞄准突破大型语言模型局限的“性能改进自动化”
AlphaGo之父创办的企业吸引天文数字般投资金

编者注从人工智能、半导体、通信到生物,这些对我们的生活至关重要却又十分陌生的技术话题,我们将以通俗易懂的方式进行解读。

爱因斯坦测试。


这是谷歌DeepMind掌门人Demis Hassabis首席执行官今年2月提出的“通用人工智能”的条件。就像爱因斯坦在1915年通过思想实验建立“相对论”一样,这项测试要求人工智能在没有先验知识的情况下,也能自行构建出同样的理论。


今年2月出席印度“人工智能峰会”的谷歌DeepMind首席执行官Demis Hassabis。他在会上提出,将“爱因斯坦测试”作为人工智能的下一个目标。YouTube截图供图

今年2月出席印度“人工智能峰会”的谷歌DeepMind首席执行官Demis Hassabis。他在会上提出,将“爱因斯坦测试”作为人工智能的下一个目标。YouTube截图供图

View original image

如今的大型语言模型人工智能虽然很聪明,但实际上,大型语言模型无异于在参加开卷考试。开发者从事先加工好的高质量数据中提取答案并加以组合,最终给出回复。它像是无所不知的“万事通”,但真正的创造性思维却无从谈起。那么,人工智能若想真正具备人类水平的智能,还需要什么?当前人工智能领跑者们正将“递归式自我改进”视为答案。


无需训练也能通过试错找到答案的人工智能


递归式自我改进(Recursive Self-Improvement,RSI)是指通过试错自行领悟解决问题的方法,并进一步改进自身的人工智能。


假设人类科学家向人工智能抛出一道特定编程难题。递归式自我改进会在用于解题的虚拟环境中部署大量人工智能代理,每个代理都尝试不同的解题方式。尽管大多数会失败,但也会出现正确答案。随后,“监督者人工智能”会选出最理想的最终成果,并以此为基础进一步改进自己。从外部看,这几乎像是人工智能在制造人工智能。


英伟达基于ARM的Vera中央处理器。与以往重视存储半导体与人工智能加速器之间数据交换的大型语言模型不同,递归式自我改进使作为驱动人工智能代理必需核心的中央处理器成为最重要的硬件。英伟达供图

英伟达基于ARM的Vera中央处理器。与以往重视存储半导体与人工智能加速器之间数据交换的大型语言模型不同,递归式自我改进使作为驱动人工智能代理必需核心的中央处理器成为最重要的硬件。英伟达供图

View original image

OpenAI、谷歌DeepMind、Anthropic等大型人工智能企业,已将递归式自我改进视为下一阶段的竞争战场。Anthropic联合创始人Jack Clark上月初在其社交媒体平台X上发文称:“我认为,到2028年之前,递归式自我改进实现的可能性超过60%。”他还表示,“一个由人工智能自行创造自身的世界将会到来。”OpenAI也制定了内部路线图,计划到2028年3月前“打造完全自动化的人工智能研究员”。


已陷入死胡同的大型语言模型替代方案


人工智能领跑者之所以投资递归式自我改进,原因非常明确。如果人工智能能够自行创造自身,就能节省极其庞大的研发费用。不仅如此,人工智能的自我改进工作还可以借助更强大的超级计算机不断加速。通过将人类原本需要数年完成的编码工作压缩到短短数秒内,其性能有望实现爆发式提升。


不过,递归式自我改进最大的优势,在于无限的学习机会和通用性。大型语言模型的弱点在于数据限制。它必须先将高质量的人类数据加工成“教材”进行预训练,才能发挥应有性能。而且,要让人工智能适配特定任务,还必须逐一进行名为“微调”的额外调整。递归式自我改进即便不依赖数据,也能实现无限学习;即使先验知识,也就是数据,受到限制,性能也不会骤降。正如Hassabis首席执行官所言,它能够在所有产业、学术等领域展现“爱因斯坦级智能”。


天文数字般的投资已在涌入……“关于根本性智能的问题”


不过,递归式自我改进仍是一个刚刚开始进入实质性研究阶段的领域。以往的大型语言模型离不开用于承载海量数据集的存储半导体,而从必须处理人工智能代理的递归式自我改进开始,中央处理器、数据输入输出等此前相对薄弱的领域也需要加大投资。这意味着,即便对大型科技企业而言,这仍是一个陌生领域。


在欧洲历史上获得最大规模种子投资的David Silver教授,任教于伦敦大学学院。他曾在DeepMind主导开发AlphaGo、AlphaZero等自主学习型人工智能,为RSI奠定基础。David Silver个人主页供图

在欧洲历史上获得最大规模种子投资的David Silver教授,任教于伦敦大学学院。他曾在DeepMind主导开发AlphaGo、AlphaZero等自主学习型人工智能,为RSI奠定基础。David Silver个人主页供图

View original image

正因如此,已有一些初创企业选择果断放弃大型科技企业正在商业化的大型语言模型,转而重仓投入递归式自我改进研究。其中最具代表性的,是前DeepMind研究员、伦敦大学学院教授David Silver近期创立的Ineffable Intelligence。这家公司在成立同时,便从全球最大规模的风险投资机构获得11亿美元投资,企业估值达到51亿美元。连尚未公布完整产品路线图的公司都能吸引巨额资金涌入,足见市场对递归式自我改进的期待之高。


被誉为递归式自我改进鼻祖级成果AlphaGo和AlphaZero之父的Silver教授主张,真正可能改变人类文明的通用人工智能候选者不是大型语言模型,而是递归式自我改进。Silver教授在Ineffable Intelligence成立当天发布的声明中强调:“能够生成语言、视频和源代码的人工智能,现在已经足够多了,优秀的人才也会继续改进它们。”但他同时指出:“我们必须正面回应关于‘智能’这一概念的根本性问题。”



他还补充称:“(递归式自我改进)失败的概率极高,但一旦成功,其带来的收益将难以想象。”他表示,这将实现一种不依赖人类数据、能够持续自主获取知识与技能的超高速学习能力。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。