Anthropic 釋出 Claude Fable 5，最強模型首度向公眾開放

Anthropic釋出首個面向公眾的Mythos級模型Claude Fable 5，並設定安全護欄限制高風險領域回答。

人工智慧公司 Anthropic 在週二邁出了重要一步，正式向公眾釋出了 Claude Fable 5。這是其內部最強大的 Mythos 模型系列中，首個可供普通使用者使用的版本。此舉緊隨該公司近期對 AI 發展過快所發出的警告，顯示出其在技術能力與安全風險之間尋求平衡的謹慎姿態。

Fable 5 的核心優勢在於軟體工程、知識型工作和視覺處理。然而，與許多追求通用能力的模型不同，Anthropic 為其設定了硬性的安全限制。當用戶提出涉及網路安全、生物學、化學等高危領域的請求時，模型會主動遮蔽回答，並自動切換至更早的 Claude Opus 4.8 模型來處理。Anthropic 表示，這種情況相對罕見，早期資料顯示至少 95% 的 Fable 會話完全由其自身響應完成。

此次釋出並非一蹴而就。今年四月，Mythos 模型僅以預覽版形式向少數合作伙伴開放，原因正是對網路安全隱患的擔憂。上週，Anthropic 才將訪問許可權擴大至 15 個國家的數百家機構，且主要聚焦於管理關鍵基礎設施的組織。如今，通過 Claude API 和基於使用量的企業計劃，這項技術的某個版本終於面向所有人開放。

在定價和訪問策略上，Anthropic 也採取了分階段的方式。從即日起至 6 月 22 日，Fable 5 將免費包含在 Pro、Max、Team 等訂閱計劃中。但從 6 月 23 日起，該模型將從這些計劃中移除，後續使用需消耗積分，公司計劃儘快將其恢復為標準訂閱功能。其 API 定價為每百萬輸入 tokens 10 美元，每百萬輸出 tokens 50 美元，是 Opus 4.8 價格的兩倍。這一高昂成本本身就可能成為廣泛使用的一種門檻，尤其是在許多企業正對 AI 開支日益不滿的背景下。

為了應對潛在風險，Anthropic 在釋出前進行了嚴格的安全測試。公司聲稱，他們進行了內部紅隊演練，在超過 1000 小時的測試中未發現任何通用的越獄方法，外部紅隊組織也未能找到此類漏洞。儘管如此，Anthropic 仍承認存在新型攻擊的可能性。因此，伴隨 Fable 5 和 Mythos 5 的釋出，公司推出了一項可能成為行業先例的政策：對所有流量強制實施 30 天的資料留存，即使企業此前簽有零留存協議。Anthropic 強調，這些資料不會用於模型訓練，僅用於“防禦複雜和新型攻擊”以及“識別和減少誤報”。

在第三方評測中，Fable 5 的能力獲得了初步認可。分析公司 Hex 表示，Fable 是首個在其核心分析基準測試中達到 90% 成績的模型，在複雜、長時間的分析任務上展現出強大的判斷力和對細微差別的關注。AI 程式設計平台 Base44 則指出，Fable 在“一次性生成完整應用”和工具呼叫方面表現更佳。

Fable 5 的推出正值 Anthropic 準備進入公開市場之際，與 OpenAI 和馬斯克的 SpaceX 等公司步調一致。就在不久前，該公司還聯合呼籲全球主要 AI 實驗室為前沿 AI 發展建立一個協調的“剎車機制”，並警告系統可能很快實現無需人類干預的遞迴自我改進。從這個角度看，Claude Fable 5 的釋出不僅是技術的展示，更是 Anthropic 對其“負責任擴充套件”理念的一次公開實踐。

Anthropic 釋出 Claude Fable 5，最強模型首度向公眾開放

延伸閱讀

相關深度報道

相關每日新聞