Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?
AI 新創 Anthropic 近期開發了一款名為 Claude Mythos 的全新 AI 通用模型,但因其功能過於強大,該公司宣布還不會向外界發布此一技術。取而代之的是,Anthropic 透過一項名為「Glasswing」的資安計畫,僅將 Mythos Preview(預覽版)開放給包括蘋果、亞馬遜與微軟等超過 40 家致力於維護關鍵基礎設施的特定企業進行測試。
為什麼 Anthropic 要製造一個「太危險」的模型?
Anthropic 根據內部測試指出,Mythos 能在極短的時間內,自主發現數千個高風險的零日漏洞,攻擊範圍幾乎涵蓋了當前所有主流的作業系統和網頁瀏覽器。更關鍵的是,這些能力不需要專業資安背景即可啟動。
當中最引人注目的,是該模型找出了一個隱藏在重視安全的開源作業系統 OpenBSD 中長達 27 年的缺陷,以及一個在知名影音處理框架 FFmpeg 中、過去經歷五百萬次自動化掃描測試都未能察覺的 16 年陳年漏洞。
Anthropic 表示,AI 的寫程式能力已達一定水準,而在發現和利用軟體漏洞方面,其能力可以超越絕大多數人類,僅次於經驗最豐富的開發者。Anthropic 近期承認 Opus 4.6 在開發有效漏洞利用程式碼方面表現不佳,成功率幾乎為零,而 Mythos Preview 的漏洞利用成功率高達 72.4%。《The Register》形容,Mythos 就是一個能「產生」零日漏洞的 AI 模型。
不過更讓網路安全專家不安的,不只漏洞發現數量,而是 Mythos 展現出了一種極其危險的新型攻擊潛力。過去,單一的微小漏洞或許不足以造成致命威脅,但 Mythos 具備將多個不起眼漏洞串聯起來的能力,形成一種新型攻擊。
例如,它能夠自主編寫複雜的 JIT 堆積噴灑程式碼,成功逃脫瀏覽器與作業系統的沙盒限制,甚至在無需人為介入的情況下,串聯多個漏洞以獲取作業系統的最高管理員權限。這種能力大幅縮減漏洞發現與被利用之間的時間差,削弱了現有的防禦機制。Anthropic 研究人員表示,背後主因是 Mythos 擁有更進階的推理能力。
「由於 Claude Mythos Preview 的網路安全特性,我們不打算將其公開發布,」Anthropic 前沿紅隊網路安全負責人 Newton Cheng 接受《VentureBeat》採訪時表示,「鑑於 AI 的發展速度,這類能力很快就會擴散,甚至可能超出那些致力於安全部署 AI 的機構與企業所能掌控的範圍。這將對經濟、公共安全與國家安全造成嚴重影響。」
進一步來說,Anthropic 其實在論證,他們開發的這款工具功能強大,足以重塑網路安全格局,而唯一負責任的做法就是限制其使用範圍,同時給予防禦者先機。
Mythos 可能危險,但也能用於造福人類
儘管 Mythos 具備高度風險,它同樣也有正面應用價值。Cisco 資安與信任長 Anthony Grieco 表示,其團隊已利用該模型在硬體與軟體中發現並修補漏洞,其速度與規模「過去難以想像」。他認為,這代表資安防護正出現「根本性的轉變」,也顯示傳統強化系統的方法已不再足夠。
Anthropic 則指出,長期目標是讓 Mythos 等級的模型能在大規模情境下開放使用,但前提是必須建立完善的資安防護機制,以偵測並阻擋其最具風險的輸出。
《SiliconANGLE》表示,如果這些防護機制能被建立並驗證,Mythos 對軟體開發者的價值將相當顯著。在衡量程式能力的 SWE-bench Verified 測試中,Mythos 解題率達 93.9%,明顯高於 Claude Opus 4.6 的 80.8%;在難度更高的 SWE-bench Pro 上,Mythos 也達到 77.8% 的準確率,相較之下 Opus 4.6 僅為 53.4%。
知名開發者 Simon Willison 表示,他意識到這可能是一場席捲整個產業的「資安清算時刻」,甚至可能需要投入大量時間資源,才能提前應對即將出現的大量漏洞風險。Glasswing 計畫也反映出這樣的緊迫性,包含提供 1 億美元的使用額度,以及 400 萬美元捐款給開源資安組織。
其他企業能做些什麼?
儘管 Anthropic 不打算將 Mythos Preview 對外開放,但對多數防禦方而言,現在仍有許多可立即採取的行動。
Anthropic 建議,企業可以先善用現有的前沿模型,例如 Claude Opus 4.6,強化漏洞偵測能力。其實際測試顯示,即使是公開可用的模型,也已能在開源專案、Web 應用、加密函式庫甚至 Linux 核心中找出大量高風險漏洞。雖然這些模型在漏洞利用生成上仍有限,但及早導入這些工具並建立流程與操作經驗,將有助於未來銜接更強大的模型能力。
隨著漏洞發現速度大幅提升,企業也必須同步調整防禦節奏,因為修補(patch)與更新部署的時間窗口必須進一步壓縮。Anthropic 建議推動自動更新機制、將含有安全修補的依賴更新視為緊急事項,以及讓修補能在不中斷服務的情況下完成。同時,企業也應重新檢視漏洞揭露政策與應變策略,特別是在面對大量、甚至來自 AI 的漏洞通報時,是否具備足夠的處理能力。
此外,AI 不只可用於找漏洞,也能全面提升資安作業效率,包括協助漏洞分級、去重、撰寫重現步驟、提出初步修補建議,甚至分析雲端設定錯誤與加速舊系統升級。隨著漏洞數量與攻擊頻率同步增加,傳統依賴人力的事件回應模式將難以負荷,企業需要導入自動化流程,讓模型協助進行警示分流、事件摘要、調查追蹤,甚至在事件發生時即時生成分析報告。
整體而言,資安產業正面臨一個關鍵轉折。Anthropic 認為,過去二十年來,攻防模式雖持續演進,但本質仍大致相同;然而,當語言模型能大規模自動發現並利用漏洞時,這個相對穩定的平衡將被打破。未來的挑戰不只是工具升級,而是整個資安體系需要重新設計,Mythos 所展現的能力,很可能只是開端,而不是終點。
【推薦閱讀】
◆ 開發產出暴增 10 倍的代價:AI 程式碼湧現,企業如何防堵資安與技術債漏洞?
*本文開放合作夥伴轉載,資料來源:《The Wall Street Journal》、《The New York Times》、Anthropic 1、Anthropic 2、《Simon Willison》、《Platformer》、《SiliconANGLE》、《The Register》,首圖來源:Anthropic