Anthropic 發表更「誠實」新模型 Opus 4.8,還想打造 AI 代理軍團作業系統
AI 新創 Anthropic 在美國時間週四同一天連續投下兩枚震撼彈:一手完成新一輪鉅額融資、成為全球估值最高的 AI 新創公司,另一手則發表最新旗艦模型 Claude Opus 4.8。值得關注的是,這次新模型主打的不是更強的運算能力,而是「更誠實」。而這個組合,正好說明了 Anthropic 的整套策略。
估值反超 OpenAI,記憶體與晶片廠成新股東
根據《implicator.ai》報導,Anthropic 已完成 650 億美元融資,投後估值達 9,650 億美元,超越了 OpenAI 先前約 7,300 億美元的估值,成為全球最有價值的 AI 新創。這輪估值約為 Anthropic 三個月前 3,800 億美元的 2.5 倍。
根據《紐約時報》,本輪由 Greenoaks Capital、Sequoia Capital、Altimeter Capital 與 Dragoneer Investment Group 等投資人領投。值得注意的是新進股東名單。Anthropic 引進了 Samsung、Micron 與 SK Hynix,也就是它最需要產能的記憶體與晶片供應商。《Reuters》日前報導,Anthropic 為了因應市場對 Claude 的龐大需求,已不得不在尖峰時段實施使用限制。
41 天推出新版 Opus,Anthropic 押注「誠實 AI」
《TechCrunch》報導,Opus 4.8 在 Opus 4.7 推出後僅 41 天就登場,比 Anthropic 平常的更新節奏快上許多。報導指出,這次的快速改版,可能與部分使用者對 Opus 4.7 反應冷淡有關,同一期間 OpenAI 的 Codex 與 Google 的 Gemini Flash 也都有重要更新,墊高了 Anthropic 跟上腳步的壓力。
這次升級的重點,落在模型如何處理錯誤或不確定的資料。Anthropic 表示,AI 模型普遍會在證據薄弱時就妄下結論、自信宣稱有進展,而 Opus 4.8 的誠實度提升正是針對這個問題。
Anthropic 指出,早期測試者發現新模型「更傾向標示自己工作中的不確定之處,也更不會做出沒有根據的宣稱」。一則來自 Bridgewater 員工的見證則說,這次升級最大的差別,在於「Opus 4.8 會主動標示分析輸入與輸出的問題,這是其他模型經常漏掉、只能留給使用者自己抓的部分」。
從數據來看,在 Anthropic 的「程式碼摘要誠實度」測試中,Opus 4.8 有 3.7% 的機率未能向使用者標示重要問題,相較之下,Claude Mythos Preview 為 27.6%,較舊的 Sonnet 4.6 則更高。它也是首個在「未經批判就回報有瑕疵結果」項目上拿到零分的 Claude 模型;而源自約 2,600 次模擬調查的「失準分數」,則從 Opus 4.7 的 2.5 降到約 1.9,效果上與能力更強的 Mythos 打平。Anthropic 並表示,Opus 4.8 讓自身程式碼瑕疵未被指出的機率,大約是 Opus 4.7 的四分之一。
在原始能力上,Opus 4.8 的進步較為溫和。Anthropic 也將該模型定調為「一次雖然小但確實的改進」。它在較難的 SWE-bench Pro 程式測試拿下 69.2%,僅略高於先前的 64.3%;在數學方面,於 USAMO 2026 取得 96.7%,則勝過前一代的 69.3%。另外,新版還加入「努力程度控制(effort control)」,可在速度與深度之間取捨。
不過,儘管誠實度提升,Opus 4.8 在部分安全性指標上仍有待改善。《implicator.ai》指出,這些誠實度宣稱大多是 Anthropic 自行評測的結果,輔以英國 AI Security Institute 與 Andon Labs 的評估,其中的關鍵數字非外部稽核。此外,系統卡指出 Opus 4.8 比 Opus 4.7 更容易受到提示注入(prompt injection)攻擊:在開啟延伸思考時,AI 資安公司 Gray Swan 的紅隊測得 9.6% 的攻擊成功率,前一代則為 6.0%,而 Anthropic 表示其部署的防護在實務上可縮小此差距。
不只是模型升級:Anthropic 想做「多代理 AI 作業系統」
更值得關注的,是 Anthropic 同步推出、以研究預覽形式開放的 Dynamic Workflows(動態工作流)。《TechCrunch》報導,這套系統用來協助 Opus 這類較大型的模型,管理橫跨數百個平行子代理的複雜任務。
Anthropic 在文章中說明,「搭配 Opus 4.8 的 Claude Code,現在可以從啟動到合併,完成跨越數十萬行程式碼的整個程式庫規模遷移,並以既有的測試套件作為標準。」
換句話說,當 OpenAI 與 Google 把焦點放在 AI 代理工具時,Anthropic 押注的似乎是另一條路:讓一群 AI 代理協同工作,從聊天機器人供應商,進一步朝「多代理 AI 作業系統」邁進。綜合來看,Anthropic 似乎在賭一件事:企業願意為一個可靠到能放手無人值守的模型付更多錢,勝過為一個最強、卻基於安全因素暫不普遍開放的模型付費。
Mythos 即將解禁,市場聲勢同步走高
至於先前因資安疑慮而延後推出的更強模型,也有了新進展。《TechCrunch》報導,Anthropic 在這次發表中暗示,一旦必要防護完成,Mythos 的預覽期可能很快結束,該公司寫道「我們正快速推進這些防護措施的開發,預計在未來數週內,能將 Mythos 等級的模型帶給所有客戶」。
Anthropic 曾形容 Mythos「在使用者指示下,能在每一個主要作業系統與每一個主要網頁瀏覽器中辨識並利用漏洞」,因此今年 4 月起,僅透過名為 Project Glasswing 的計畫,開放給少數科技與華爾街公司。Anthropic 當時也表示,計劃與美國及盟友政府合作,把 Project Glasswing 擴展到更多夥伴,並打算讓類似 Mythos 的模型更廣泛開放,但未提供確切時程。
支撐這波聲勢的,是 Anthropic 在市場上的實際成長。《紐約時報》、《Bloomberg》與《implicator.ai》均提到,Anthropic 表示其「營收執行率」本月已跨過 470 億美元,主要由代理式程式工具 Claude Code 帶動。《紐約時報》指出,Anthropic 自去年 11 月強化程式編寫技術以來,已有數百家企業付費採用該軟體,使這項技術成為一門穩健的生意。
【推薦閱讀】
◆ 當企業開始管理 15 萬個 AI 代理:Google Cloud 高層解析 AI Agent 導入三大支柱
*本文開放合作夥伴轉載,資料來源:《TechCrunch》、《Simon Willison》、《Bloomberg》、《New York Times》、《The Deep View》、《PCWorld》、《implicator. ai》、Anthropic,首圖來源:Anthropic