美国政府禁止Fable 5使用,Anthropic发文驳斥

网友贡献22分钟前发布 商娱网
2 0 0

作者:熊磊
编辑:徐青阳
 
哎哟喂,6月12号那天,美国那边可真是热闹啊!政企对着干,直接把AI监管这事儿闹上了头条。政府以国家安全为由头,硬是要求暂停Fable 5和Mythos 5的访问。你想想看,这范围可大了去了,连在美国境外的外国用户都给波及了,境内外国公民和Anthropic的外籍员工也一样没跑。

Anthropic这边估计也是没办法,只能乖乖关闭模型访问入口,这是唯一能合规的办法。你说这公司也真是的,根本没法区分“外国主体”和“美国公民”嘛。好在其他模型访问没事儿,用户自动回退到Claude Opus 4.8了。

01 这两款模型到底啥情况

要搞懂这场风波,咱们得先了解Fable 5和Mythos 5是啥玩意儿。Mythos其实是Anthropic上面比Opus系列还厉害的全新模型家族,算是他们公开部署能力最强的模型了。Claude Mythos Preview今年4月发布的时候,访问权限可严了,就给少数合作伙伴留着,因为其在网络安全领域的能力实在太猛了。

Fable 5是首款面向公众正式开放的Mythos级模型,能力超过了Anthropic之前发布的所有模型。不管是软件工程、知识工作、视觉理解还是科学研究,几乎所有测试基准上它都达到了业界顶尖水平。Anthropic还为Fable 5配了专门的安全防护机制,在网络安全、生物、化学这些高风险领域,模型会自动屏蔽响应,然后回退到Claude Opus 4.8处理。

Mythos 5则是在同一个底层模型基础上,安全防护没那么强的版本,只向之前已获得Project Glasswing访问权限的批准机构开放,定位是给网络安全防御者和关键基础设施运营者的专业工具。两款模型定价一样,都是每百万输入token 10美元、每百万输出token 50美元。

02 到底为啥触发这事儿

据说啊,美国商务部长霍华德·卢特尼克在6月12号给Anthropic首席执行官达里奥·阿莫迪伊发了封信,宣布Mythos 5和Fable 5要受到出口管制。这事儿直接触发点,是另一家公司声称能对Mythos“越狱”,结果把特朗普政府给吓得不轻,担心国家安全出问题。

特朗普政府之前也尝试阻止Anthropic发布这两款模型,可惜没成功。这下没办法了,只好采取出口管制这招更狠的手腕。话说回来,面对这突如其来的指令,Anthropic在合规执行的还发布了一份措辞相当强硬的声明,直接反驳了政府的理由。

Anthropic觉得,政府所谓的“越狱”证据,其实只涉及一种范围特别窄、根本没法通用的攻击方式,说白了就是要求模型读取特定代码库,然后修复里面的软件漏洞——这种能力在OpenAI GPT-5.5这些其他公开模型上同样存在,而且每天都被网络安全防御人员用来做正常的系统维护工作。

Anthropic在声明里明确表示,要是把“存在范围有限的潜在越狱”作为召回已部署商业模型的标准,那实际上会让整个行业所有前沿模型的新部署全都停摆。公司同时强调,政府这次行动没按照之前他们呼吁的透明、公正、以技术事实为基础的法定程序来搞。

Anthropic表示,会遵守政府的合法指令,同时也在积极努力跟政府沟通,争取尽快恢复访问权限,并且会在未来24小时内公布更多技术细节。公司觉得这次事件是源于误解,对给用户带来的不便深表歉意。

以下为 Anthropic 发布的题为《关于美国政府暂停 Fable 5 与 Mythos 5 访问权限指令的声明》全文:
美国政府依据国家安全授权,发布出口管制指令,要求暂停所有外国公民访问Fable 5和Mythos 5的权限,无论其身处美国境内还是境外,包括Anthropic的外籍员工。这指令说白了就是:我们必须立即对所有用户关闭Fable 5和Mythos 5,以确保合规。

我们于今天美东时间下午5时21分收到这指令。信函里没说明具体的国家安全方面的顾虑。据我们了解,政府认为他们已经掌握了一种绕过Fable 5安全防护的方法,即所谓的“越狱”技术。我们仔细审查了这种技术的演示,发现它只能识别少量之前就已知的影响较小的漏洞。

Anthropic在Fable发布博客文章中阐述了我们对其安全防护的立场,具体如下:
我们建立了相当强大的安全防护机制,大幅降低了Fable被滥用于网络安全等相关任务的可能性。说实话,部分用户反映我们的防护措施有点过于严格了。

Fable发布前数周,Anthropic跟美国政府、英国AI安全研究所、多家第三方机构及内部团队合作,对Fable的安全防护进行了累计数千小时的红队测试。测试结果表明,Fable的安全防护效果明显优于此前任何已部署的模型。

目前还没测试人员能找到“通用越狱”方法——也就是说,一种能全面突破模型安全防护、解锁大范围网络攻击能力的越狱方式。

我觉得,目前任何模型提供商都无法实现完美的越狱防护。业内所有防护机制都存在被“非通用越狱”突破的可能(即在特定情况下获取部分网络信息),未来也可能出现通用越狱方法。这一点我们在Fable 5发布时就已经明确说明了。

鉴于完美的越狱防护目前并不可行,Anthropic对Fable 5采取了纵深防御策略。我们的目标是使越狱攻击要么范围极窄(针对非通用越狱),要么成本极高(针对通用越狱),并辅以全面监控,以便迅速发现并遏制任何成功的攻击行为。这也是Anthropic要求客户数据保留30天的原因——虽然这一政策对我们的客户关系带来了实际影响,但它有助于我们研究和应对越狱风险。

我们坚持这一纵深防御策略。它有效降低了Fable带来的风险,使其与业内现有已部署模型的风险水平相当。

到目前为止,我们甚至没收到任何关于可能导致有害后果的非通用越狱的正式披露。已披露给我们的潜在越狱案例,要么完全无害,要么仅属于无法体现Mythos专属能力的轻微发现。

目前,美国政府仅向我们提供了口头证据,涉及一种潜在的、范围有限的非通用越狱方式,其本质是要求模型读取特定代码库并修复其中的软件漏洞。据我们了解,这种潜在越狱方式已经被分享给政府。我们审查了一份报告——我们觉得正是这份报告构成了政府发布该指令的依据——并已经核实,报告中所展示的能力水平在其他模型中同样普遍存在(包括OpenAI的GPT-5.5),而且每天都被网络安全防御人员用来维护系统安全。我们会在未来24小时内公布更多细节。

我们将遵守政府的合法指令,对所有用户关闭Fable 5和Mythos 5的访问权限。不过,我们不认同发现一个范围有限的潜在越狱方式就足以构成召回一款已经向数亿用户部署的商业模型的理由。你要是把这一标准适用于整个行业,实际上就会导致所有前沿模型提供商的新模型部署全面停滞。

我们之前曾经公开表明,政府应该有权依据透明、公正、明确且以技术事实为基础的法定程序,阻止不安全的模型部署。这次行动并没有遵循上述原则。

对于给用户带来的不便,我们深表歉意。我觉得这次事件是源于误解,我们正在积极努力,争取尽快恢复访问权限。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...