Anthropic 不敢全面公開的 AI：Claude Mythos 為何正在重寫網路安全規則？

AI 新創 Anthropic 近期開發了一款名為 Claude Mythos 的全新 AI 通用模型，但因其功能過於強大，該公司宣布還不會向外界發布此一技術。取而代之的是，Anthropic 透過一項名為「Glasswing」的資安計畫，僅將 Mythos Preview（預覽版）開放給包括蘋果、亞馬遜與微軟等超過 40 家致力於維護關鍵基礎設施的特定企業進行測試。

為什麼 Anthropic 要製造一個「太危險」的模型？

Anthropic 根據內部測試指出，Mythos 能在極短的時間內，自主發現數千個高風險的零日漏洞，攻擊範圍幾乎涵蓋了當前所有主流的作業系統和網頁瀏覽器。更關鍵的是，這些能力不需要專業資安背景即可啟動。

當中最引人注目的，是該模型找出了一個隱藏在重視安全的開源作業系統 OpenBSD 中長達 27 年的缺陷，以及一個在知名影音處理框架 FFmpeg 中、過去經歷五百萬次自動化掃描測試都未能察覺的 16 年陳年漏洞。

Anthropic 表示，AI 的寫程式能力已達一定水準，而在發現和利用軟體漏洞方面，其能力可以超越絕大多數人類，僅次於經驗最豐富的開發者。Anthropic 近期承認 Opus 4.6 在開發有效漏洞利用程式碼方面表現不佳，成功率幾乎為零，而 Mythos Preview 的漏洞利用成功率高達 72.4%。《The Register》形容，Mythos 就是一個能「產生」零日漏洞的 AI 模型。

不過更讓網路安全專家不安的，不只漏洞發現數量，而是 Mythos 展現出了一種極其危險的新型攻擊潛力。過去，單一的微小漏洞或許不足以造成致命威脅，但 Mythos 具備將多個不起眼漏洞串聯起來的能力，形成一種新型攻擊。

例如，它能夠自主編寫複雜的 JIT 堆積噴灑程式碼，成功逃脫瀏覽器與作業系統的沙盒限制，甚至在無需人為介入的情況下，串聯多個漏洞以獲取作業系統的最高管理員權限。這種能力大幅縮減漏洞發現與被利用之間的時間差，削弱了現有的防禦機制。Anthropic 研究人員表示，背後主因是 Mythos 擁有更進階的推理能力。

「由於 Claude Mythos Preview 的網路安全特性，我們不打算將其公開發布，」Anthropic 前沿紅隊網路安全負責人 Newton Cheng 接受《VentureBeat》採訪時表示，「鑑於 AI 的發展速度，這類能力很快就會擴散，甚至可能超出那些致力於安全部署 AI 的機構與企業所能掌控的範圍。這將對經濟、公共安全與國家安全造成嚴重影響。」

進一步來說，Anthropic 其實在論證，他們開發的這款工具功能強大，足以重塑網路安全格局，而唯一負責任的做法就是限制其使用範圍，同時給予防禦者先機。

Mythos 可能危險，但也能用於造福人類

儘管 Mythos 具備高度風險，它同樣也有正面應用價值。Cisco 資安與信任長 Anthony Grieco 表示，其團隊已利用該模型在硬體與軟體中發現並修補漏洞，其速度與規模「過去難以想像」。他認為，這代表資安防護正出現「根本性的轉變」，也顯示傳統強化系統的方法已不再足夠。

Anthropic 則指出，長期目標是讓 Mythos 等級的模型能在大規模情境下開放使用，但前提是必須建立完善的資安防護機制，以偵測並阻擋其最具風險的輸出。

《SiliconANGLE》表示，如果這些防護機制能被建立並驗證，Mythos 對軟體開發者的價值將相當顯著。在衡量程式能力的 SWE-bench Verified 測試中，Mythos 解題率達 93.9%，明顯高於 Claude Opus 4.6 的 80.8%；在難度更高的 SWE-bench Pro 上，Mythos 也達到 77.8% 的準確率，相較之下 Opus 4.6 僅為 53.4%。

知名開發者 Simon Willison 表示，他意識到這可能是一場席捲整個產業的「資安清算時刻」，甚至可能需要投入大量時間資源，才能提前應對即將出現的大量漏洞風險。Glasswing 計畫也反映出這樣的緊迫性，包含提供 1 億美元的使用額度，以及 400 萬美元捐款給開源資安組織。

其他企業能做些什麼？

儘管 Anthropic 不打算將 Mythos Preview 對外開放，但對多數防禦方而言，現在仍有許多可立即採取的行動。

Anthropic 建議，企業可以先善用現有的前沿模型，例如 Claude Opus 4.6，強化漏洞偵測能力。其實際測試顯示，即使是公開可用的模型，也已能在開源專案、Web 應用、加密函式庫甚至 Linux 核心中找出大量高風險漏洞。雖然這些模型在漏洞利用生成上仍有限，但及早導入這些工具並建立流程與操作經驗，將有助於未來銜接更強大的模型能力。

隨著漏洞發現速度大幅提升，企業也必須同步調整防禦節奏，因為修補（patch）與更新部署的時間窗口必須進一步壓縮。Anthropic 建議推動自動更新機制、將含有安全修補的依賴更新視為緊急事項，以及讓修補能在不中斷服務的情況下完成。同時，企業也應重新檢視漏洞揭露政策與應變策略，特別是在面對大量、甚至來自 AI 的漏洞通報時，是否具備足夠的處理能力。

此外，AI 不只可用於找漏洞，也能全面提升資安作業效率，包括協助漏洞分級、去重、撰寫重現步驟、提出初步修補建議，甚至分析雲端設定錯誤與加速舊系統升級。隨著漏洞數量與攻擊頻率同步增加，傳統依賴人力的事件回應模式將難以負荷，企業需要導入自動化流程，讓模型協助進行警示分流、事件摘要、調查追蹤，甚至在事件發生時即時生成分析報告。

整體而言，資安產業正面臨一個關鍵轉折。Anthropic 認為，過去二十年來，攻防模式雖持續演進，但本質仍大致相同；然而，當語言模型能大規模自動發現並利用漏洞時，這個相對穩定的平衡將被打破。未來的挑戰不只是工具升級，而是整個資安體系需要重新設計，Mythos 所展現的能力，很可能只是開端，而不是終點。

【推薦閱讀】
◆ 開發產出暴增 10 倍的代價：AI 程式碼湧現，企業如何防堵資安與技術債漏洞？
◆ AI 的第二個 10 億用戶怎麼來？a16z 點出信任高牆，解析可信任中介的三大結構關鍵
◆ AI 原生企業崛起：為什麼 Jack Dorsey、祖克柏都在重寫公司架構設計？

＊本文開放合作夥伴轉載，資料來源：《The Wall Street Journal》、《The New York Times》、Anthropic 1、Anthropic 2、《Simon Willison》、《Platformer》、《SiliconANGLE》、《The Register》，首圖來源：Anthropic

加入『 TechOrange 官方 LINE 好友』掌握最新科技資訊！

請更新您的瀏覽器

理財

TechOrange 科技報橘

為什麼 Anthropic 要製造一個「太危險」的模型？

Mythos 可能危險，但也能用於造福人類

其他企業能做些什麼？

更多理財相關文章

記憶體價格失控又一受害者 GoPro首度示警無法持續經營

快訊/百萬國民高息ETF 00919成分股調整出爐！18進18出

黃仁勳親為Arm站台執行長曝「14年前青澀合照」

狂砸3137億！巴菲特「爆買這檔AI巨頭」持股衝破1兆　震撼華爾街

文組也能進輝達！1職缺年薪最高649萬、可遠距上班　應徵條件曝光

英特爾陳立武也感謝台灣，回顧 40 年前應李國鼎之邀參與矽島繁榮發展

請更新您的瀏覽器啟用Javascript

Anthropic 不敢全面公開的 AI：Claude Mythos 為何正在重寫網路安全規則？

TechOrange 科技報橘

為什麼 Anthropic 要製造一個「太危險」的模型？

Mythos 可能危險，但也能用於造福人類

其他企業能做些什麼？

更多理財相關文章

記憶體價格失控又一受害者 GoPro首度示警無法持續經營

快訊/百萬國民高息ETF 00919成分股調整出爐！18進18出

黃仁勳親為Arm站台 執行長曝「14年前青澀合照」

狂砸3137億！巴菲特「爆買這檔AI巨頭」持股衝破1兆 震撼華爾街

文組也能進輝達！1職缺年薪最高649萬、可遠距上班 應徵條件曝光

英特爾陳立武也感謝台灣，回顧 40 年前應李國鼎之邀參與矽島繁榮發展

請更新您的瀏覽器

黃仁勳親為Arm站台執行長曝「14年前青澀合照」

狂砸3137億！巴菲特「爆買這檔AI巨頭」持股衝破1兆　震撼華爾街

文組也能進輝達！1職缺年薪最高649萬、可遠距上班　應徵條件曝光