人工智能公司 Anthropic 在週二邁出了重要一步,正式向公眾發佈了 Claude Fable 5。這是其內部最強大的 Mythos 模型系列中,首個可供普通用戶使用的版本。此舉緊隨該公司近期對 AI 發展過快所發出的警告,顯示出其在技術能力與安全風險之間尋求平衡的謹慎姿態。

Fable 5 的核心優勢在於軟件工程、知識型工作和視覺處理。然而,與許多追求通用能力的模型不同,Anthropic 為其設置了硬性的安全限制。當用戶提出涉及網絡安全、生物學、化學等高危領域的請求時,模型會主動屏蔽回答,並自動切換至更早的 Claude Opus 4.8 模型來處理。Anthropic 表示,這種情況相對罕見,早期數據顯示至少 95% 的 Fable 會話完全由其自身響應完成。

此次發佈並非一蹴而就。今年四月,Mythos 模型僅以預覽版形式向少數合作伙伴開放,原因正是對網絡安全隱患的擔憂。上週,Anthropic 才將訪問權限擴大至 15 個國家的數百家機構,且主要聚焦於管理關鍵基礎設施的組織。如今,通過 Claude API 和基於使用量的企業計劃,這項技術的某個版本終於面向所有人開放。

在定價和訪問策略上,Anthropic 也採取了分階段的方式。從即日起至 6 月 22 日,Fable 5 將免費包含在 Pro、Max、Team 等訂閱計劃中。但從 6 月 23 日起,該模型將從這些計劃中移除,後續使用需消耗積分,公司計劃儘快將其恢復為標準訂閱功能。其 API 定價為每百萬輸入 tokens 10 美元,每百萬輸出 tokens 50 美元,是 Opus 4.8 價格的兩倍。這一高昂成本本身就可能成為廣泛使用的一種門檻,尤其是在許多企業正對 AI 開支日益不滿的背景下。

為了應對潛在風險,Anthropic 在發佈前進行了嚴格的安全測試。公司聲稱,他們進行了內部紅隊演練,在超過 1000 小時的測試中未發現任何通用的越獄方法,外部紅隊組織也未能找到此類漏洞。儘管如此,Anthropic 仍承認存在新型攻擊的可能性。因此,伴隨 Fable 5 和 Mythos 5 的發佈,公司推出了一項可能成為行業先例的政策:對所有流量強制實施 30 天的數據留存,即使企業此前簽有零留存協議。Anthropic 強調,這些數據不會用於模型訓練,僅用於“防禦複雜和新型攻擊”以及“識別和減少誤報”。

在第三方評測中,Fable 5 的能力獲得了初步認可。分析公司 Hex 表示,Fable 是首個在其核心分析基準測試中達到 90% 成績的模型,在複雜、長時間的分析任務上展現出強大的判斷力和對細微差別的關注。AI 編程平臺 Base44 則指出,Fable 在“一次性生成完整應用”和工具調用方面表現更佳。

Fable 5 的推出正值 Anthropic 準備進入公開市場之際,與 OpenAI馬斯克SpaceX 等公司步調一致。就在不久前,該公司還聯合呼籲全球主要 AI 實驗室為前沿 AI 發展建立一個協調的“剎車機制”,並警告系統可能很快實現無需人類干預的遞歸自我改進。從這個角度看,Claude Fable 5 的發佈不僅是技術的展示,更是 Anthropic 對其“負責任擴展”理念的一次公開實踐。