全部企业中的90%,人工智能相关成本增加
中国MiniMax的“M3”等轻量化模型成为趋势

原本期待通过引入人工智能获得大幅收益的企业,反而因人工智能代理(助手)使用量激增,面临巨大的成本负担。人工智能企业则通过开发在保持高性能的同时降低运行成本和电力消耗的轻量化人工智能模型,来应对企业需求。


对比中国代表性人工智能创业公司“MiniMax”最新人工智能模型与全球人工智能企业Anthropic的Claude Opus 4.8的帖子。文中强调,两者在查找漏洞方面性能相同,但成本更低。X截图供图

对比中国代表性人工智能创业公司“MiniMax”最新人工智能模型与全球人工智能企业Anthropic的Claude Opus 4.8的帖子。文中强调,两者在查找漏洞方面性能相同,但成本更低。X截图供图

View original image

9日,美国咨询公司贝恩公司在《人工智能预算在增加,但利润却并非如此的原因》报告中表示:“对全球951家企业的调查结果显示,37%的企业原本试图将人工智能相关成本削减11%至20%,但实际仅降至0%至10%。”报告还称,反而有90%的企业正在增加人工智能相关支出。


美国市场调查机构高德纳也预计,到2030年,人工智能的推理成本将较当前下降90%以上,但企业和个人需要支付的人工智能相关费用仍将增加。原因在于,人工智能不再停留于简单问答,而是进化为人工智能代理后,单次任务所消耗的令牌使用量将增加。高德纳解释称:“虽然令牌单价正在快速下降,但使用量增长速度已经超过这一降幅。面向高性能人工智能的基础设施仍然属于有限资源,因此成本压力将持续存在。”


意识到这一情况的人工智能企业已投入轻量化竞争。中国代表性人工智能创业公司“MiniMax”于本月1日发布最新人工智能模型“M3”。M3在提供编码代理及业务自动化功能的同时,成本仅为美国主要闭源人工智能模型的5%至10%。与此同时,它在评估软件工程能力的“SWE Bench Pro”中取得59%的成绩,甚至超过谷歌生成式人工智能模型Gemini 3.1 Pro。美国半导体企业“Sima AI”则正专注于扩大基于低功耗芯片的物理人工智能市场。Sima AI的机器学习系统级芯片“Modalix”被设计为即使在低于10瓦的低功耗环境下,也能处理大语言模型等任务。


韩国国内人工智能行业也对人工智能轻量化表现出关注。人工智能创业公司Nota开发了人工智能模型轻量化平台“Netspresso”。通过Netspresso,可以根据企业环境高效优化大型且复杂的人工智能模型。Nota计划基于Netspresso技术构建智能交通状况监测系统。



韩国国内人工智能创业公司ActionPower也正以人工智能手写应用程序“Daglo”为基础,推进模型轻量化及推理优化工作。凭借10多年积累的语音和文本数据竞争力,该公司可根据图形处理器和神经网络处理器等硬件特性,对推理结构进行优化。ActionPower方面表示:“轻量化模型可降低对高规格图形处理器的依赖,因此即便在基于企业内网封闭网络的本地部署人工智能环境中,也能高效利用。”并称,“今后还将正式进军基于超轻量化人工智能模型的端侧人工智能市场。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点