請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Anthropic 發表新 AI 模型 Claude Opus 4.7,攻向「可控 AI」新戰場

TechOrange 科技報橘

更新於 04月17日12:17 • 發布於 04月17日04:17 • 廖紹伶

Anthropic 推出最新通用 AI 模型 Claude Opus 4.7。表面上看,這是一次例行的旗艦模型升級;但若對照 Anthropic 近日才公開、卻暫不對外全面釋出的 Mythos Preview,就會發現這次發表真正想回答的問題,不只是模型有沒有更強,而是模型夠不夠可控。

根據 Anthropic 官方說法,Opus 4.7 在進階軟體工程、長時間任務執行、指令遵循與高解析視覺理解上,都較前代 Opus 4.6 有明顯提升,尤其更擅長處理過去仍需高度人工監督的複雜編碼工作。

Anthropic 也特別強調,這款模型雖然不如 Mythos Preview 那麼強大,卻是公司用來測試新一代資安防護機制與模型治理方式的第一個公開版本。這讓 Opus 4.7 的定位,不只是更強的 Claude,而是 Anthropic 在「高能力模型如何安全商業化」這條路上的一次壓力測試。

如果把近期幾家前沿模型公司的動作放在一起看,會更清楚這個趨勢。過去市場總把焦點放在基準測試排名、誰分數更高、誰能力更全面;但從 Anthropic 的 Mythos Preview,到 OpenAI 的 GPT-5.4-Cyber,再到這次的 Opus 4.7,產業重心正逐漸從能力邊界,轉向能力如何被控制、部署與授權。也就是說,AI 競賽已不再只是模型軍備競賽,而是開始進入「可控 AI」的新戰場。

微幅領先 OpenAI、Google,而非全面式碾壓

從基準測試成績來看,Anthropic 確實有理由把 Opus 4.7 包裝成新一代高階商用模型。根據 Anthropic 官方資料,Opus 4.7 在 GDPval-AA、Finance Agent 等知識工作與金融分析評測上表現突出,也在視覺推理、長任務一致性與多模態能力上較 Opus 4.6 進一步提升。

《VentureBeat》整理 Anthropic 公布的資料指出,Opus 4.7 在多個關鍵評測上小幅領先 OpenAI 的 GPT-5.4 與 Google 的 Gemini 3.1 Pro,尤其在代理式編碼、長任務自主執行與金融分析這類需要可靠性與持久性的場景中,展現出較強優勢。

不過,《VentureBeat》也提醒,這並不是一場全面碾壓的勝利。以 agentic search、多語問答與部分終端機編碼場景來看,GPT-5.4 或 Gemini 3.1 Pro 仍在部分指標上維持領先。這代表 Opus 4.7 的市場定位,不是全能型冠軍,而是一款更偏向「可靠執行者」的模型。換句話說,它強的地方不只是生成答案,而是更適合那些需要模型長時間穩定工作、自己查核輸出、並減少人類來回修正成本的工作流程。

從更強,走向更可靠

這也是 Anthropic 這次最想突顯的能力變化。根據 Anthropic 說法,Opus 4.7 的一個關鍵升級,是它更懂得在回覆前先驗證自己的輸出。Anthropic 用「rigor」來形容這種特質,也就是模型不只是完成任務,而是會自己設計額外步驟,確認答案或程式碼是否可靠,再把結果交還給使用者。

《VentureBeat》認為,這種自我驗證能力,正是 Anthropic 試圖解決代理式 AI 常見問題的核心:當模型被要求長時間自主工作時,真正的瓶頸往往不是它能不能做,而是它會不會在錯誤路徑上一路跑下去。

若從企業導入角度看,這點的重要性或許高過基準測試分數本身。因為在真實工作環境中,企業需要的不是一個偶爾很驚豔、但常常需要人工重新修正產出的模型,而是一個能在較長流程中維持穩定、在模糊任務中少犯錯、能更像可靠同事的系統。

根據 Anthropic,Intuit、Replit、Notion 等早期測試者的回饋,幾乎都在強調同一件事:Opus 4.7 的進步,不只是能力更強,而是更值得信任。Notion 就提到,模型在多步驟工作流程中的表現提升 14%,同時工具呼叫錯誤大減;Replit 則形容它「更像一個更好的 coworker」。

Anthropic 開始把「成本可控性」做進模型裡

除了可靠性,Anthropic 也同步把「成本可管理性」納入產品設計。Anthropic 在官方公告中宣布,Opus 4.7 新增 xhigh effort 等級,讓使用者可以在 high 與 max 之間,選擇更細緻的推理深度。

同時 Anthropic 也在 API 平台推出「任務預算(task budgets)」公測版,讓開發者可以為長時間代理任務設定 token 預算,控制模型在單一任務上的資源消耗。這顯示 Anthropic 已不再只把模型視為能力產品,而是視為一項需要被管理的企業基礎設施。

企業應該升級到 Opus 4.7 嗎?

Anthropic 也在官方文件中提醒,Opus 4.7 使用了更新的 tokenizer,可能導致同樣輸入轉成 1.0 到 1.35 倍不等的 token;再加上高 effort 模式下模型會「思考更多」,輸出 token 也可能提高。也就是說,雖然定價維持與 Opus 4.6 相同,仍是每百萬 input token 5 美元、output token 25 美元,但企業實際帳單不一定會維持原狀。

圖片來源:Anthropic

此外,Anthropic 也提醒 Opus 4.7 雖然是 Opus 4.6 的直接升級版,但由於它更嚴格遵循指令,過去為較舊模型設計、語氣較鬆散的 prompt,現在可能反而產生過度僵硬或出乎預期的結果。

這些都是《VentureBeat》特別提醒企業不要急著「整包升級」到 Opus 4.7 的原因。因此,若企業原本已在生產環境中使用 Opus 4.6,最理想的做法不是直接替換,而是分階段導入,重新調整 prompt、重新測試成本與拒答邊界,確認它在自己的工作流中真的能帶來淨效益。

AI 競爭邏輯已經變了

Opus 4.7 的另一層意義,還在於它扮演了舊模型與 Mythos 之間的「中介模型」。《The Verge》就點出,Anthropic 自己坦承這款模型其實並沒有推進公司的「能力前沿」,因為 Mythos Preview 在所有相關評測上都更強。換句話說,Anthropic 現在已明確把「產品前沿」與「能力前沿」拆開處理。最強的模型不一定先上市;能上市的模型,則必須先通過治理、授權與風險控制的考驗。

若從這個角度看,Opus 4.7 的真正對手,未必只是 GPT-5.4 或 Gemini 3.1 Pro,而是各家公司各自提出的高能力模型如何安全部署方案。

Anthropic 現在的答案,是建立一個介於一般商用模型與高風險前沿模型之間的 airlock(氣閘艙),也就是一種分層、限權、可驗證的過渡區。根據《implicator.ai》的分析,Opus 4.7 就像這個 airlock 的外層艙門:一方面向市場提供足夠強大的公開模型,另一方面又替更高風險的 Mythos 類模型試跑新的防護與驗證制度。

對企業來說,這意味著未來選模型時,不能只看能力表現,還要看供應商如何設計授權制度、風險控管與營運護欄。

【推薦閱讀】

Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?

當 AI「硬回答」反而害企業虧錢?Appier 拆解企業 AI 導入挑戰提 4 大解法

微軟悄悄研發「類 OpenClaw」功能:Copilot 走向全自主運作,爭奪企業 AI 主導權

*本文開放合作夥伴轉載,資料來源:Anthropic《VentureBeat》《implicator.ai》《CNBC》《The Verge》,首圖來源:Anthropic

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

台股割韭菜!金居爆1.1億違約交割 今年最大筆

EBC 東森新聞
02

為什麼高手常在上漲時減碼?實現帳面獲利,也是一種紀律

商周財富網
03

快訊/當沖翻車?今年最大條!金居驚爆1.1億元違約交割

三立新聞網
04

〈美股早盤〉美伊談判預期與財報支撐 主要指數走高

anue鉅亨網
05

台積電股價漲不動?專家曝台股三大變化:投資人不能再沿用舊框架

風傳媒
06

00981A創掛牌新高「3個月暴衝36%」!網封經理人為瑤池金母 揭密陳釧瑤超狂來歷

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...