Anthropic 发布 Claude Fable 5，最强模型首度向公众开放

Anthropic发布首个面向公众的Mythos级模型Claude Fable 5，并设置安全护栏限制高风险领域回答。

人工智能公司 Anthropic 在周二迈出了重要一步，正式向公众发布了 Claude Fable 5。这是其内部最强大的 Mythos 模型系列中，首个可供普通用户使用的版本。此举紧随该公司近期对 AI 发展过快所发出的警告，显示出其在技术能力与安全风险之间寻求平衡的谨慎姿态。

Fable 5 的核心优势在于软件工程、知识型工作和视觉处理。然而，与许多追求通用能力的模型不同，Anthropic 为其设置了硬性的安全限制。当用户提出涉及网络安全、生物学、化学等高危领域的请求时，模型会主动屏蔽回答，并自动切换至更早的 Claude Opus 4.8 模型来处理。Anthropic 表示，这种情况相对罕见，早期数据显示至少 95% 的 Fable 会话完全由其自身响应完成。

此次发布并非一蹴而就。今年四月，Mythos 模型仅以预览版形式向少数合作伙伴开放，原因正是对网络安全隐患的担忧。上周，Anthropic 才将访问权限扩大至 15 个国家的数百家机构，且主要聚焦于管理关键基础设施的组织。如今，通过 Claude API 和基于使用量的企业计划，这项技术的某个版本终于面向所有人开放。

在定价和访问策略上，Anthropic 也采取了分阶段的方式。从即日起至 6 月 22 日，Fable 5 将免费包含在 Pro、Max、Team 等订阅计划中。但从 6 月 23 日起，该模型将从这些计划中移除，后续使用需消耗积分，公司计划尽快将其恢复为标准订阅功能。其 API 定价为每百万输入 tokens 10 美元，每百万输出 tokens 50 美元，是 Opus 4.8 价格的两倍。这一高昂成本本身就可能成为广泛使用的一种门槛，尤其是在许多企业正对 AI 开支日益不满的背景下。

为了应对潜在风险，Anthropic 在发布前进行了严格的安全测试。公司声称，他们进行了内部红队演练，在超过 1000 小时的测试中未发现任何通用的越狱方法，外部红队组织也未能找到此类漏洞。尽管如此，Anthropic 仍承认存在新型攻击的可能性。因此，伴随 Fable 5 和 Mythos 5 的发布，公司推出了一项可能成为行业先例的政策：对所有流量强制实施 30 天的数据留存，即使企业此前签有零留存协议。Anthropic 强调，这些数据不会用于模型训练，仅用于“防御复杂和新型攻击”以及“识别和减少误报”。

在第三方评测中，Fable 5 的能力获得了初步认可。分析公司 Hex 表示，Fable 是首个在其核心分析基准测试中达到 90% 成绩的模型，在复杂、长时间的分析任务上展现出强大的判断力和对细微差别的关注。AI 编程平台 Base44 则指出，Fable 在“一次性生成完整应用”和工具调用方面表现更佳。

Fable 5 的推出正值 Anthropic 准备进入公开市场之际，与 OpenAI 和马斯克的 SpaceX 等公司步调一致。就在不久前，该公司还联合呼吁全球主要 AI 实验室为前沿 AI 发展建立一个协调的“刹车机制”，并警告系统可能很快实现无需人类干预的递归自我改进。从这个角度看，Claude Fable 5 的发布不仅是技术的展示，更是 Anthropic 对其“负责任扩展”理念的一次公开实践。

Anthropic 发布 Claude Fable 5，最强模型首度向公众开放

延伸阅读

相关深度报道

相关每日新闻