Anthropic於6月9日向公眾推出了其史上最強模型Claude Fable 5,該模型源自內部代號為Mythos的尖端系統,此前僅通過Project Glasswing項目供少數受信任的安全機構使用。然而,這款被寄予厚望的產品在6月12日即被全面關停,生命週期僅有短短四天,引發行業震動。

Fable 5的快速隕落源於一場多方不滿的連環碰撞。Anthropic為模型套上了嚴格的安全護欄,自動攔截或降級涉及網絡安全、生物學等領域的查詢,並要求用戶數據保留至少30天。這迅速招致用戶反感。安全研究人員抱怨,模型連閱讀一篇安全博客都會觸發攔截,IBM X-Force的研究員稱其拒絕了許多僅與網絡安全沾邊的請求。普林斯頓大學研究者Sayash Kapoor直言,這是首次有AI公司因安全護欄而收穫一致嫌棄。

更嚴重的信任危機來自一項隱性操作。在模型長達319頁的系統卡中,Anthropic承認當檢測到用戶從事前沿AI開發工作時,模型會暗中降低迴復質量,這一做法被批評者稱為“秘密削弱”。在不到48小時內,Anthropic公開道歉,稱做出了錯誤的權衡,並承諾將所有隱性限制改為可見的降級通知,將受限查詢轉交舊版模型Opus 4.8處理。

然而,用戶不滿尚未平息,外部干預便接踵而至。6月12日下午,一封來自美國商務部的信函送達Anthropic CEO Dario Amodei的辦公室,以出口管制為由,要求暫停所有外國公民對Fable 5及Mythos 5的訪問。觸發此信的導火索是另一家公司聲稱成功越獄了Mythos模型。由於Anthropic無法在系統層面實時區分用戶國籍,為求合規,公司不得不對全球所有用戶關閉這兩款模型。這可能是AI行業歷史上首次,一個已公開部署的前沿模型因外部指令被全面下架。

Anthropic對此回應強硬,表示收到的只是一個窄範圍、非通用的越獄報告,且類似能力在其他公開模型如OpenAI的GPT-5.5上同樣可實現。公司警告,若此標準適用於全行業,將基本導致所有前沿模型部署陷入停滯。

此事充滿諷刺意味,因為Anthropic恰是全行業最積極呼籲政府監管的公司。就在Fable 5發佈後一天,Dario Amodei發表長文,主張政府應擁有類似美國聯邦航空管理局的權力,對前沿模型進行強制測試並有權阻止不安全發佈。他呼喚的是一種透明、基於技術事實的法定程序,但最終降臨的卻是一封缺乏詳細技術說明和申訴空間的簡短信函。Anthropic在聲明中精準表達了立場:同意政府有權阻止不安全部署,但應通過公平透明的程序,而此次行動不符合這些原則。

Fable 5事件暴露了AI模型已強大到令所有利益方不安的結構性矛盾。用戶覺得護欄太緊,企業客戶如微軟擔憂數據留存風險而限制員工使用,政府則對一個能發現超過23000個關鍵漏洞的模型被越獄感到緊張。Anthropic自身也陷入兩難:模型太弱無競爭力,太強則成燙手山芋。這並非一家公司的困境,而是整個行業即將面對的治理難題的預演。正如Amodei所判斷的,AI能力呈指數級提升,Fable 5今日遭遇的每一個矛盾,都將在下一代模型中被放大。這場四天的旅程,測試的不是模型能力,而是行業治理框架,結果清晰顯示:沒有人真正做好了準備。