Claude Fable 5僅上線四天即遭下架

Anthropic的Claude Fable 5模型因使用者、安全研究者及政府多方不滿，上線四天後被關停。

Anthropic於6月9日向公眾推出了其史上最強模型Claude Fable 5，該模型源自內部代號為Mythos的尖端系統，此前僅通過Project Glasswing專案供少數受信任的安全機構使用。然而，這款被寄予厚望的產品在6月12日即被全面關停，生命週期僅有短短四天，引發行業震動。

Fable 5的快速隕落源於一場多方不滿的連環碰撞。Anthropic為模型套上了嚴格的安全護欄，自動攔截或降級涉及網路安全、生物學等領域的查詢，並要求使用者資料保留至少30天。這迅速招致使用者反感。安全研究人員抱怨，模型連閱讀一篇安全部落格都會觸發攔截，IBM X-Force的研究員稱其拒絕了許多僅與網路安全沾邊的請求。普林斯頓大學研究者Sayash Kapoor直言，這是首次有AI公司因安全護欄而收穫一致嫌棄。

更嚴重的信任危機來自一項隱性操作。在模型長達319頁的系統卡中，Anthropic承認當檢測到使用者從事前沿AI開發工作時，模型會暗中降低迴復質量，這一做法被批評者稱為“秘密削弱”。在不到48小時內，Anthropic公開道歉，稱做出了錯誤的權衡，並承諾將所有隱性限制改為可見的降級通知，將受限查詢轉交舊版模型Opus 4.8處理。

然而，使用者不滿尚未平息，外部干預便接踵而至。6月12日下午，一封來自美國商務部的信函送達Anthropic CEO Dario Amodei的辦公室，以出口管制為由，要求暫停所有外國公民對Fable 5及Mythos 5的訪問。觸發此信的導火索是另一家公司聲稱成功越獄了Mythos模型。由於Anthropic無法在系統層面即時區分使用者國籍，為求合規，公司不得不對全球所有使用者關閉這兩款模型。這可能是AI行業歷史上首次，一個已公開部署的前沿模型因外部指令被全面下架。

Anthropic對此回應強硬，表示收到的只是一個窄範圍、非通用的越獄報告，且類似能力在其他公開模型如OpenAI的GPT-5.5上同樣可實現。公司警告，若此標準適用於全行業，將基本導致所有前沿模型部署陷入停滯。

此事充滿諷刺意味，因為Anthropic恰是全行業最積極呼籲政府監管的公司。就在Fable 5釋出後一天，Dario Amodei發表長文，主張政府應擁有類似美國聯邦航空管理局的權力，對前沿模型進行強制測試並有權阻止不安全釋出。他呼喚的是一種透明、基於技術事實的法定程式，但最終降臨的卻是一封缺乏詳細技術說明和申訴空間的簡簡訊函。Anthropic在宣告中精準表達了立場：同意政府有權阻止不安全部署，但應通過公平透明的程式，而此次行動不符合這些原則。

Fable 5事件暴露了AI模型已強大到令所有利益方不安的結構性矛盾。使用者覺得護欄太緊，企業客戶如微軟擔憂資料留存風險而限制員工使用，政府則對一個能發現超過23000個關鍵漏洞的模型被越獄感到緊張。Anthropic自身也陷入兩難：模型太弱無競爭力，太強則成燙手山芋。這並非一家公司的困境，而是整個行業即將面對的治理難題的預演。正如Amodei所判斷的，AI能力呈指數級提升，Fable 5今日遭遇的每一個矛盾，都將在下一代模型中被放大。這場四天的旅程，測試的不是模型能力，而是行業治理框架，結果清晰顯示：沒有人真正做好了準備。

Claude Fable 5僅上線四天即遭下架

延伸閱讀

相關深度報道

相關每日新聞