Claude Opus 4.8 新模型登場，Mythos 等級模型數週內接力推出

Anthropic 28 日推出新款模型 Claude Opus 4.8，已在所有平台開放使用，收費價格與前一版 Claude Opus 4.7 推出時相同水準。

Claude Opus 4.8 一如預期，帶來堪稱業界領先水準的基準測試表現，同時也特別著重於模型如何處理不良或不確定的資料。Anthropic 在官方部落格文章提到，早期測試人員發現這款模型「更傾向於主動標示工作中的不確定之處，並且比較不會做出沒有依據的論斷」。

參與早期測試的一名橋水（Bridgewater）員工分享心得表示，這次模型升級最大差異在於「Claude Opus 4.8 傾向主動標記分析過程輸入和輸出的問題，這是其他模型通常會忽略、並讓用戶自行去發現的部分。」

▲ Claude Opus 4.8 基準測試表現。

伴隨新模型的發表，Anthropic 同時推出一項名為 Dynamic Workflows 的功能，目前處於研究預覽階段，目的在於協助像 Claude Opus 這類大型模型，管理橫跨數百個平行 subagent 的複雜任務。

「Claude Code 搭配 Claude Opus 4.8，現在能以既有的測試套件作為標準，從專案啟動到合併程式碼，執行涵蓋數十萬行程式碼之程式碼庫規模的整體遷移作業」，Anthropic 在官方部落格文章裡說明。

Claude Opus 4.8 距離前一版 Claude Opus 4.7 發表僅經過 41 天，對 Anthropic 而言，模型升級節奏似乎比過去更快，而目前最新版本的 Claude Sonnet 和 Claude Haiku 分別推出約 3 個月和 7 個月。這次模型迅速迭代，可能與 Claude Opus 4.7 受到用戶冷淡迴響有關，他們對這款模型的表現感到失望。

這段期間適逢 OpenAI Codex 和 Google Gemini Flash 模型的重大更新，帶給 Anthropic 的壓力進一步加重。

繼上個月初步測試 Claude Mythos 預覽版引發網路安全方面的疑慮，Anthropic 目前繼續扣留最先進的 Claude Mythos 模型。不過 Anthropic 暗示，一旦必要的防護機制完成後，Claude Mythos 的預覽階段可能很快將會結束。

「我們在開發這些防護機制方面迅速推進，預期能在未來數週內，將 Claude Mythos 等級的模型提供給我們所有客戶」，Anthropic 表示。

（圖片來源：Anthropic）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

請更新您的瀏覽器

理財

科技新報

更多理財相關文章

等不到客人！華信航空高花、中花載客率慘淡　董座：7月前申請停飛

證交所出手！10檔個股遭「抓去關」力積電也入列

台股站上45000點　中經院：留意修正風險

快訊／台啤尬燒酒！5大韓企爭相獻寶　黃仁勳：「將忙到不可思議」

力積電飆高大翻車！兇手是「這群人」 52萬股東遭割韭菜

財產狂破3億日圓卻裝窮當小職員！日本隱形富豪死不退休暗藏驚人洋蔥

請更新您的瀏覽器啟用Javascript

Claude Opus 4.8 新模型登場，Mythos 等級模型數週內接力推出

科技新報

更多理財相關文章

等不到客人！華信航空高花、中花載客率慘淡 董座：7月前申請停飛

證交所出手！10檔個股遭「抓去關」 力積電也入列

台股站上45000點 中經院：留意修正風險

快訊／台啤尬燒酒！5大韓企爭相獻寶 黃仁勳：「將忙到不可思議」