人工智能公司 Anthropic 在周二迈出了重要一步,正式向公众发布了 Claude Fable 5。这是其内部最强大的 Mythos 模型系列中,首个可供普通用户使用的版本。此举紧随该公司近期对 AI 发展过快所发出的警告,显示出其在技术能力与安全风险之间寻求平衡的谨慎姿态。
Fable 5 的核心优势在于软件工程、知识型工作和视觉处理。然而,与许多追求通用能力的模型不同,Anthropic 为其设置了硬性的安全限制。当用户提出涉及网络安全、生物学、化学等高危领域的请求时,模型会主动屏蔽回答,并自动切换至更早的 Claude Opus 4.8 模型来处理。Anthropic 表示,这种情况相对罕见,早期数据显示至少 95% 的 Fable 会话完全由其自身响应完成。
此次发布并非一蹴而就。今年四月,Mythos 模型仅以预览版形式向少数合作伙伴开放,原因正是对网络安全隐患的担忧。上周,Anthropic 才将访问权限扩大至 15 个国家的数百家机构,且主要聚焦于管理关键基础设施的组织。如今,通过 Claude API 和基于使用量的企业计划,这项技术的某个版本终于面向所有人开放。
在定价和访问策略上,Anthropic 也采取了分阶段的方式。从即日起至 6 月 22 日,Fable 5 将免费包含在 Pro、Max、Team 等订阅计划中。但从 6 月 23 日起,该模型将从这些计划中移除,后续使用需消耗积分,公司计划尽快将其恢复为标准订阅功能。其 API 定价为每百万输入 tokens 10 美元,每百万输出 tokens 50 美元,是 Opus 4.8 价格的两倍。这一高昂成本本身就可能成为广泛使用的一种门槛,尤其是在许多企业正对 AI 开支日益不满的背景下。
为了应对潜在风险,Anthropic 在发布前进行了严格的安全测试。公司声称,他们进行了内部红队演练,在超过 1000 小时的测试中未发现任何通用的越狱方法,外部红队组织也未能找到此类漏洞。尽管如此,Anthropic 仍承认存在新型攻击的可能性。因此,伴随 Fable 5 和 Mythos 5 的发布,公司推出了一项可能成为行业先例的政策:对所有流量强制实施 30 天的数据留存,即使企业此前签有零留存协议。Anthropic 强调,这些数据不会用于模型训练,仅用于“防御复杂和新型攻击”以及“识别和减少误报”。
在第三方评测中,Fable 5 的能力获得了初步认可。分析公司 Hex 表示,Fable 是首个在其核心分析基准测试中达到 90% 成绩的模型,在复杂、长时间的分析任务上展现出强大的判断力和对细微差别的关注。AI 编程平台 Base44 则指出,Fable 在“一次性生成完整应用”和工具调用方面表现更佳。
Fable 5 的推出正值 Anthropic 准备进入公开市场之际,与 OpenAI 和马斯克的 SpaceX 等公司步调一致。就在不久前,该公司还联合呼吁全球主要 AI 实验室为前沿 AI 发展建立一个协调的“刹车机制”,并警告系统可能很快实现无需人类干预的递归自我改进。从这个角度看,Claude Fable 5 的发布不仅是技术的展示,更是 Anthropic 对其“负责任扩展”理念的一次公开实践。