Anthropic将此前一直推迟公开的顶级人工智能模型面向普通用户推出。
当地时间9日,Anthropic表示将发布新人工智能模型“Claude Fable 5”和安全特化模型“Claude Mythos 5”。Fable 5面向普通用户,Mythos 5则仅限通过安全验证的机构有限提供。
两款模型的基础实际上几乎相同,但提供方式不同。Fable 5在滥用风险较高的领域设置了安全装置。若收到可能被用于恶意黑客攻击的网络安全相关提问,Fable 5不会直接作答,而是由此前的顶级模型“Opus 4.8”代为处理,并会将这一情况告知用户。
Anthropic表示,为了实现安全且快速的发布,公司对相关装置采取了较为保守的设定。因此,正常请求也可能被拦截,但实际触发比例不到全部会话的5%。这类限制不仅适用于网络安全,也适用于可能被用于生物武器等用途的生物学、化学相关提问。疑似试图无授权“蒸馏”竞争人工智能模型功能的请求,也被纳入限制对象。
不设限制的Mythos 5仅通过安全协作体“Project Glasswing”向经过验证的机构提供。因此,已知参与该项目的三星电子、SK海力士、SK电讯、韩国互联网振兴院等机构,也有可能获得Mythos 5的访问权限。
Anthropic还制定了新政策,将Fable、Mythos模型产生的数据保存30天。这些数据将被用于阻止新的攻击,或甄别误报案例。
新模型的性能高于此前公开的“Mythos Preview”。在衡量网络安全能力的“ExploitBench”中,Mythos 5取得78%。这一成绩高于OpenAI GPT-5.5的34%、Anthropic Opus 4.8的40%以及Mythos Preview的69%。
在评估各领域博士级智能的“人类最后考试”中,在不使用工具的条件下,该模型取得59%,高于此前Mythos Preview的56.8%。在评估终端环境编码能力的“Terminal-Bench 2.1”中,该模型也取得88%,领先于GPT-5.5的83.4%。
在通用编码性能方面也取得高分。Fable 5在“SWE-Bench Pro”中取得80.3%,而GPT-5.5为58.6%,谷歌Gemini 3.1 Pro为54.2%。在评估知识型工作能力的“GDPval-AA”中,Fable 5也以1932分超过GPT-5.5和Gemini 3.1 Pro。
Fable 5自当天起可供使用。至本月22日为止,将在不额外收费的情况下向现有付费订阅用户提供。此后则需另行付费才能使用。Anthropic表示,待服务器容量充足 확보后,计划再将Fable 5重新纳入现有订阅方案。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。