Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方
今年 4 月,Anthropic 發布新 AI 模型 Mythos,但因擔心能力過於強大,可能遭到惡意人士濫用,目前僅開放約 40 家合作企業測試。Anthropic 執行長 Dario Amodei 本週更警告,Mythos 已在各類軟體中發現數萬個潛在漏洞,而產業可能只剩下 6 至 12 個月的修補窗口期。
在已獲授權測試的合作夥伴中,Mozilla Firefox 安全團隊公開了其與 Anthropic 的合作,提供了部分 AI 資安工具實戰紀錄,也直接揭示了 AI 技術的能耐與現實侷限。
修補漏洞從 31 個變 423 個,中間發生什麼事?
今年 2 月,Anthropic 就已將一批透過 Claude 模型在 Firefox 中發現的漏洞通報給 Mozilla。Mozilla 在修復這批問題後,以自有模糊測試基礎設施為底,建構了一套代理式漏洞掃描框架,後續並在框架中導入 Claude Mythos Preview 等模型,展開大規模掃描。
結果相當顯著,2026 年 4 月,Firefox 共修補了 423 個安全漏洞,相比 2025 年同期的 31 個,成長了 13 倍。這 423 個修補中,271 個由 Claude Mythos Preview 發現,41 個來自外部研究員通報,其餘 111 個則由其他內部方式發現,包括使用 Mythos 以外模型的代理框架,以及傳統模糊測試技術。在 271 個 Mythos 發現的漏洞中,180 個被評定為高嚴重性,80 個為中等嚴重性,11 個為低嚴重性。
Mozilla 研究員坦言,這場轉變來得出乎意料地快。「很難形容這個局面在幾個月內對我們改變了多少,」研究團隊在公開文章中寫道。他們將這一轉折歸因於兩個因素:模型能力的大幅躍升,以及他們自身在引導、擴展與堆疊模型技術上的進步。
挖出沉睡 15 至 20 年的漏洞,連沙箱都沒能倖免
在 Mythos 協助下,Mozilla 發現的漏洞不僅數量驚人,品質也大幅提升。Mozilla 表示,在此之前,AI 漏洞查找工具存在許多嚴重缺陷,導致安全團隊被大量誤報和低品質回報淹沒,但最新一代工具已經取得突破性進展。
Mozilla 公開了其中 12 個具代表性的案例,涵蓋多個不同的瀏覽器子系統。其中包括一個存在 15 年、由 HTML 元素觸發的錯誤,以及一個潛伏 20 年的 XSLT 漏洞,皆在長期模糊測試下從未被察覺。
尤其值得關注的是多個沙箱漏洞。根據《TechCrunch》,要找到這類漏洞,模型必須先為瀏覽器撰寫一個受感染的修補程式,再用這段新程式碼攻擊瀏覽器最安全的核心層,是一個需要創造力與高度精準度的多步驟任務。
為了找出這些漏洞,Mozilla 曾祭出漏洞獎勵計畫,然而,即便提出最高可獲得 2 萬美元的高額獎勵,Mozilla 工程師 Grinstead 表示,Mythos 找出的沙箱漏洞數量,仍遠超過過去人類研究人員的成果。他向《TechCrunch》表示:「我們確實曾收到這類漏洞回報,但數量遠不及這種方法所能找到的規模。」
AI 能找漏洞,但還不能自己修
儘管 Mythos 在發現漏洞上表現突出,Mozilla 團隊也指出了一個現實限制:AI 目前仍無法真正自動修復問題。
《TechCrunch》報導,Mozilla 的做法是請 AI 為每個漏洞生成修補程式碼,但這些程式碼通常無法直接部署,而是作為人類工程師的參考樣本。Grinstead 表示官方文章中討論的每一個漏洞,都是由一位工程師撰寫修補程式、一位工程師負責審查而成,「我們還沒找到可以自動化的方法。」
根據 Mozilla,在 4 月共修補的 423 個漏洞中,有逾百人參與了撰寫修補程式、審查程式碼、測試修復成果與管理發布流程等工作。這反映出目前 AI coding 與 AI agent 發展的一個重要現實:AI 很擅長大規模探索與發現問題,但在需要高度可靠性、可維護性與系統整合能力的修復階段,人類工程師仍不可或缺。
但另一更深層的問題在於,AI 找漏洞的速度,可能正在超越人類修補漏洞的能力,全球軟體產業可能將進入「漏洞供給爆炸」的新時代。而目前的工程文化、review 流程與安全團隊規模,未必跟得上這種速度。
這也意味著,AI coding 的下一場競爭,或許不再是誰能生成更多程式碼,而是誰能在 AI 發現漏洞後,更快完成修補、驗證與部署。Mythos 所揭露的,已不只是 AI coding 的新能力,而是整個軟體產業攻防節奏正在被重新改寫。
Mozilla 透過自身經驗指出,任何軟體開發團隊都可以立即使用現有的代理框架搭配現代模型來尋找漏洞,不需要等待更好的工具,並建議從簡單的提示開始,觀察後再迭代。「你會找到漏洞,而且你會為自己做好準備,以便在新模型出現時立即加以利用。」其下一步計畫是將漏洞掃描整合進 CI 系統,在程式碼提交時即時掃描,預期效果與現有的檔案式掃描相當甚至更好。
【推薦閱讀】
◆ Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?
*本文開放合作夥伴轉載,資料來源:《TechCrunch》、Mozilla、《CNBC》、Anthropic,首圖來源:Anthropic