Anthropic 表示,在美國政府發布出口管制指令,要求限制外國人存取其兩款最先進模型後,公司已暫停相關模型服務。
Anthropic 說明,於美東時間 6 月 12 日下午 5 時 21 分接獲美國政府指令。根據其引述的「國家安全主管機關」說法,政府要求禁止外國人存取 Claude Fable 5 及 Mythos 5,包括位於美國境內、境外,以及 Anthropic 內部持有外國國籍的員工。
Anthropic 指出,為遵循政府命令,公司必須停止所有客戶對上述兩款模型的存取。不過,其他模型服務,包括 Claude Opus 4.8,則不受影響。
Anthropic 於 6 月 9 日開始向 Pro 、 Max 及 Enterprise 用戶部署 Fable 5,原定 Enterprise 用戶部署時程持續至 6 月 22 日。然而,該模型開放使用僅數日後,即因政府命令而停止提供服務。
根據 Anthropic 說法,Fable 5 可視為加入安全防護機制的 Mythos 5 版本。兩者採用相同底層模型架構,差別在於 Mythos 5 不會針對敏感的網路安全、生物及化學領域查詢進行限制,也不會降級改以 Claude Opus 4.8 回應,因此僅提供給少數機構使用,包括政府單位及關鍵基礎設施供應商。
英國 AI 及線上安全大臣 Kanishka Narayan 表示,此事件凸顯技術主權的重要性,並呼籲英國政府投入 11 億英鎊發展自主 AI 晶片能力。
Anthropic 認為,政府命令可能與近期有關 Fable 5 遭越獄 (jailbreak) 的消息有關。不過該公司表示,在檢視研究人員公開展示內容後,僅發現少數已知漏洞,而這些問題在其他公開模型中同樣存在,並非必須突破特殊安全防護才能利用。
Anthropic 表示,不認同因發現一種可能的越獄方法,而要求召回已部署至大量用戶的商用模型。該公司認為,若此標準被廣泛套用於整個產業,可能對先進 AI 模型的部署與發展造成重大阻礙。
Anthropic 進一步指出,目前業界尚未發展出能完全防範越獄攻擊的技術方案。現有防護措施仍可能遭特定越獄技術繞過,進而解除部分功能限制,且未來也不排除出現更通用的越獄手法。
基於上述風險,Anthropic 採取深度防禦策略,希望降低越獄成功機率並提高攻擊成本。同時透過監控機制快速偵測異常行為,以阻止潛在攻擊活動。 Anthropic 也表示,這是公司調整政策、要求所有 Fable 系列模型客戶資料保留 30 天的重要原因之一,以利研究與防範越獄及其他攻擊行為。
