請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

世界上最強大的編碼模型降臨,Anthropic 發表 Claude 4 系列新模型

科技新報

更新於 05月23日10:04 • 發布於 05月23日05:59

Anthropic 首屆開發者大會「Code with Claude」22 日於美國舊金山舉行,正式發表全新 Claude 4 系列模型,包括 Claude Opus 4 和 Claude Sonnet 4,為編碼、高階推理及 AI 代理(AI agent)設下全新標準。

Claude Opus 4 和 Claude Sonnet 4 均為混合模型,提供近乎即時的回應、以及延伸思考 2 種模式。

Anthropic 稱 Claude Opus 4 是世界上最強大的編碼模型,在基準測試 SWE-bench(72.5%)與 Terminal-bench(43.2%)領先群雄,可對複雜、長時間運行的編碼任務和代理任務提供卓越表現。

Claude Opus 4 的記憶能力大幅領先其他模型,當開發者對 Claude 提供本機檔案存取權限時,Claude Opus 4 能夠建立並維持記憶檔案、儲存關鍵資訊,進而確認長期任務的處理意識、連貫性及代理任務效能。

Claude Sonnet 4 則是Claude 3.7 Sonnet 重大升級,提供更優異的程式設計和推理能力,能夠精準遵循提示指令。隨著 Claude Sonnet 4 推出,GitHub 表示它在代理場景表現出色,將扮演驅動 GitHub Copilot 編碼代理的關鍵角色。

Anthropic 為 Claude 4 引進「思考摘要」,利用較小模型濃縮冗長的思考過程,這個機制只需要大約 5% 思考過程所花費的時間。

▲ Claude 4 在基準測試 SWE-bench Verified 處於領先地位。

▲ Claude 4 在編碼、推理、多模態功能和代理任務表現出色。

Anthropic 表示,Claude Pro / Max / Team / Enterprise 方案均能使用這 2 款模型和延伸思考功能,Claude Sonnet 4 甚至對免費用戶開放使用。

這 2 款模型已經上架 Anthropic API、Amazon Bedrock 及 Google Cloud Vertex AI,收費沿用先前 Claude Opus 和 Claude Sonnet 系列的價格:Claude Opus 4 每百萬個輸入/輸出詞元(token)收費 15 / 75 美元,Claude Sonnet 4 每百萬個輸入/輸出詞元則收費 3 / 15 美元,是前者的五分之一。

(圖片來源:Anthropic

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0