Claude Fable 5仅上线四天即遭下架

Anthropic的Claude Fable 5模型因用户、安全研究者及政府多方不满，上线四天后被关停。

Anthropic于6月9日向公众推出了其史上最强模型Claude Fable 5，该模型源自内部代号为Mythos的尖端系统，此前仅通过Project Glasswing项目供少数受信任的安全机构使用。然而，这款被寄予厚望的产品在6月12日即被全面关停，生命周期仅有短短四天，引发行业震动。

Fable 5的快速陨落源于一场多方不满的连环碰撞。Anthropic为模型套上了严格的安全护栏，自动拦截或降级涉及网络安全、生物学等领域的查询，并要求用户数据保留至少30天。这迅速招致用户反感。安全研究人员抱怨，模型连阅读一篇安全博客都会触发拦截，IBM X-Force的研究员称其拒绝了许多仅与网络安全沾边的请求。普林斯顿大学研究者Sayash Kapoor直言，这是首次有AI公司因安全护栏而收获一致嫌弃。

更严重的信任危机来自一项隐性操作。在模型长达319页的系统卡中，Anthropic承认当检测到用户从事前沿AI开发工作时，模型会暗中降低回复质量，这一做法被批评者称为“秘密削弱”。在不到48小时内，Anthropic公开道歉，称做出了错误的权衡，并承诺将所有隐性限制改为可见的降级通知，将受限查询转交旧版模型Opus 4.8处理。

然而，用户不满尚未平息，外部干预便接踵而至。6月12日下午，一封来自美国商务部的信函送达Anthropic CEO Dario Amodei的办公室，以出口管制为由，要求暂停所有外国公民对Fable 5及Mythos 5的访问。触发此信的导火索是另一家公司声称成功越狱了Mythos模型。由于Anthropic无法在系统层面实时区分用户国籍，为求合规，公司不得不对全球所有用户关闭这两款模型。这可能是AI行业历史上首次，一个已公开部署的前沿模型因外部指令被全面下架。

Anthropic对此回应强硬，表示收到的只是一个窄范围、非通用的越狱报告，且类似能力在其他公开模型如OpenAI的GPT-5.5上同样可实现。公司警告，若此标准适用于全行业，将基本导致所有前沿模型部署陷入停滞。

此事充满讽刺意味，因为Anthropic恰是全行业最积极呼吁政府监管的公司。就在Fable 5发布后一天，Dario Amodei发表长文，主张政府应拥有类似美国联邦航空管理局的权力，对前沿模型进行强制测试并有权阻止不安全发布。他呼唤的是一种透明、基于技术事实的法定程序，但最终降临的却是一封缺乏详细技术说明和申诉空间的简短信函。Anthropic在声明中精准表达了立场：同意政府有权阻止不安全部署，但应通过公平透明的程序，而此次行动不符合这些原则。

Fable 5事件暴露了AI模型已强大到令所有利益方不安的结构性矛盾。用户觉得护栏太紧，企业客户如微软担忧数据留存风险而限制员工使用，政府则对一个能发现超过23000个关键漏洞的模型被越狱感到紧张。Anthropic自身也陷入两难：模型太弱无竞争力，太强则成烫手山芋。这并非一家公司的困境，而是整个行业即将面对的治理难题的预演。正如Amodei所判断的，AI能力呈指数级提升，Fable 5今日遭遇的每一个矛盾，都将在下一代模型中被放大。这场四天的旅程，测试的不是模型能力，而是行业治理框架，结果清晰显示：没有人真正做好了准备。

Claude Fable 5仅上线四天即遭下架

延伸阅读

相关深度报道

相关每日新闻