Anthropic于6月9日向公众推出了其史上最强模型Claude Fable 5,该模型源自内部代号为Mythos的尖端系统,此前仅通过Project Glasswing项目供少数受信任的安全机构使用。然而,这款被寄予厚望的产品在6月12日即被全面关停,生命周期仅有短短四天,引发行业震动。

Fable 5的快速陨落源于一场多方不满的连环碰撞。Anthropic为模型套上了严格的安全护栏,自动拦截或降级涉及网络安全、生物学等领域的查询,并要求用户数据保留至少30天。这迅速招致用户反感。安全研究人员抱怨,模型连阅读一篇安全博客都会触发拦截,IBM X-Force的研究员称其拒绝了许多仅与网络安全沾边的请求。普林斯顿大学研究者Sayash Kapoor直言,这是首次有AI公司因安全护栏而收获一致嫌弃。

更严重的信任危机来自一项隐性操作。在模型长达319页的系统卡中,Anthropic承认当检测到用户从事前沿AI开发工作时,模型会暗中降低回复质量,这一做法被批评者称为“秘密削弱”。在不到48小时内,Anthropic公开道歉,称做出了错误的权衡,并承诺将所有隐性限制改为可见的降级通知,将受限查询转交旧版模型Opus 4.8处理。

然而,用户不满尚未平息,外部干预便接踵而至。6月12日下午,一封来自美国商务部的信函送达Anthropic CEO Dario Amodei的办公室,以出口管制为由,要求暂停所有外国公民对Fable 5及Mythos 5的访问。触发此信的导火索是另一家公司声称成功越狱了Mythos模型。由于Anthropic无法在系统层面实时区分用户国籍,为求合规,公司不得不对全球所有用户关闭这两款模型。这可能是AI行业历史上首次,一个已公开部署的前沿模型因外部指令被全面下架。

Anthropic对此回应强硬,表示收到的只是一个窄范围、非通用的越狱报告,且类似能力在其他公开模型如OpenAI的GPT-5.5上同样可实现。公司警告,若此标准适用于全行业,将基本导致所有前沿模型部署陷入停滞。

此事充满讽刺意味,因为Anthropic恰是全行业最积极呼吁政府监管的公司。就在Fable 5发布后一天,Dario Amodei发表长文,主张政府应拥有类似美国联邦航空管理局的权力,对前沿模型进行强制测试并有权阻止不安全发布。他呼唤的是一种透明、基于技术事实的法定程序,但最终降临的却是一封缺乏详细技术说明和申诉空间的简短信函。Anthropic在声明中精准表达了立场:同意政府有权阻止不安全部署,但应通过公平透明的程序,而此次行动不符合这些原则。

Fable 5事件暴露了AI模型已强大到令所有利益方不安的结构性矛盾。用户觉得护栏太紧,企业客户如微软担忧数据留存风险而限制员工使用,政府则对一个能发现超过23000个关键漏洞的模型被越狱感到紧张。Anthropic自身也陷入两难:模型太弱无竞争力,太强则成烫手山芋。这并非一家公司的困境,而是整个行业即将面对的治理难题的预演。正如Amodei所判断的,AI能力呈指数级提升,Fable 5今日遭遇的每一个矛盾,都将在下一代模型中被放大。这场四天的旅程,测试的不是模型能力,而是行业治理框架,结果清晰显示:没有人真正做好了准备。