人工智能公司Anthropic刚刚遭遇了一场突如其来的监管风暴。当地时间6月12日,该公司公开披露,美国政府以国家安全为由发布出口管制指令,要求立即暂停所有外国国民对Fable 5Mythos 5两款新模型的访问权限,连Anthropic自己的外籍员工也不例外。这一指令迫使公司必须马上停用这两个新系列模型,以确保所有客户都符合规定。

Anthropic在声明中透露,政府信函于当日下午5点21分送达,但并未具体说明国家安全方面的担忧细节。据披露,政府方面声称已获悉一种能够绕过或“越狱”Fable 5的方法。然而,Anthropic在审查相关技术演示后发现,该方法仅被用于识别少数此前已知的轻微漏洞,这些漏洞看起来相对简单,且其他公开可用的模型同样能在不借助绕过手段的情况下发现它们。

这一事件的时间点颇具戏剧性。就在不久前,Anthropic刚刚向全球倡议建立一套AI政策机制,转眼间监管的重拳就砸向了自己。公司强调,在Fable发布前的数周里,已与美国政府、英国AISI以及多个私营第三方组织合作,共投入数千小时对模型的安全防护机制进行红队测试。测试结果表明,Fable的安全措施比任何先前部署的模型都更为有效,目前尚未有测试人员找到一种通用的越狱方法——即能够广泛绕过安全防护、解除多种网络功能限制的越狱方式。

Anthropic还表示,尚未收到任何有关新模型可能导致危害性后果的、非通用性潜在越狱漏洞的披露。因此,虽然公司正在遵照政府的法律指令暂停访问,但明确表达了不认同的态度。公司认为,仅因发现一种潜在的、范围有限的越狱漏洞就召回一款已面向数亿用户部署的商业产品,这一标准若在整个行业实施,将实质上叫停所有前沿模型提供商的新模型部署。

Anthropic进一步建议,政府应在一项透明、公正、明确且以技术事实为依据的法定程序框架内阻止不安全的部署,而此次行动并未遵循上述原则。公司将此次监管与模型封禁事件定性为一次误会,目前正在全力争取尽快恢复访问权限。

从更广视角看,此事凸显了AI行业在高速发展与安全监管之间的紧张关系。一方面,各国政府对前沿模型可能带来的国家安全风险日益警惕,出口管制和访问限制成为新工具;另一方面,企业则担忧缺乏透明程序的突然封禁会抑制创新,甚至形成任意干预的先例。Anthropic此次遭遇,可能成为未来AI监管框架讨论中的一个标志性案例,其最终解决方式将受到行业密切关注。