請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

地表最強編碼AI!Anthropic發布Claude 4模型:可自主運行7小時,懂玩寶可夢還幫你寫攻略

數位時代

更新於 2025年05月23日03:09 • 發布於 2025年05月23日02:45

重點一 :AI 公司 Anthropic 發布全新 Claude Opus 4 及 Sonnet 4 模型,Opus 4 專為長時間複雜自主任務設計,編碼能力獲重大提升。

重點二 :新模型引入記憶功能與「擴展思考與工具使用」能力,可處理更深層次邏輯任務,並能與外部工具交錯運作以提升效能。

重點三 :GitHub 宣布其 Copilot 新一代編碼代理將採用 Sonnet 4 模型,顯示 Anthropic 技術已獲業界高度肯定。

人工智慧新創公司 Anthropic 於本週四宣布推出其最新、功能最強大的 AI 模型系列:Claude Opus 4 與 Claude Sonnet 4。此次發布標誌著 Anthropic 在去年六月以來專注於中階 Sonnet 系列後,重返大型模型發布的行列。

其中,Opus 4 被譽為該公司迄今最強的編碼模型,專為能自主運行數小時的複雜、長期任務而設計,旨在滿足市場對代理型 AI 應用日益增長的需求。

Anthropic 的 Claude 關係主管 Alex Albert (亞歷克斯·艾伯特) 指出,Opus 4 的高智能特性將完美契合這股代理型應用的浪潮。

長效記憶與智能進化:幫打寶可夢同時寫攻略

Anthropic 的 Claude AI 模型系列包含 Haiku、Sonnet 和 Opus 三種不同「規模」的型號,旨在於價格、速度和能力之間取得平衡。Haiku 為最輕巧、成本最低但能力也最基礎的選項;Sonnet 則為兼顧成本與效能的中階選擇;Opus 系列向來是規模最大、運行速度較慢,但上下文理解深度與邏輯處理能力最強的頂級模型。

為克服長時間運作的限制,本次發布的 Claude Opus 4 及 Sonnet 4 模型皆內建記憶功能,允許其在長時間會話中利用外部文件儲存關鍵資訊,如同人類在長時間工作時做筆記一般。

此外,兩種 Claude 4 模型都引入了名為「擴展思考與工具使用」的全新測試版功能,允許模型在模擬推理與使用網頁搜索等外部工具之間交替運作,進一步提升其解決複雜問題的效率與準確性。

Albert 表示,Claude Opus 4 在記憶能力方面顯著優於先前所有模型。當開發者建構的應用程式賦予 Claude 存取本機檔案的權限時,Opus 4 便能建立並維護用以儲存關鍵資訊的「記憶檔案」(memory files),進一步提升長期代理任務的執行效能。 例如 Opus 4 能一邊進行《寶可夢》(Pokémon) 遊戲,一邊創建「導航指南」(Navigation Guide)。相較之下,早期 Claude 模型通常僅能維持一至兩小時的連貫性。

日本科技服務集團 Rakuten (樂天) 亦驗證了 Claude 在一項要求嚴苛的開源重構任務中,能獨立運行七小時並維持穩定效能。

基準測試評分超群!獲GitHub納入編碼代理基礎模型

Anthropic 宣稱 Opus 4 在編碼任務的行業基準測試中處於領先地位,於 SWE-bench (SWE-bench) 達到72.5% 的評分,在 Terminal-bench (Terminal-bench) 則獲得43.2% 的成績,並稱其為「全球最佳編碼模型」。

值得注意的是, GitHub 已宣布將採用 Sonnet 4 作為其新一代 GitHub Copilot 編碼代理的基礎模型,主要考量其在「代理場景」中的優異表現。

Sonnet 4 在 SWE-bench 獲得72.7% 的高分,同時保持比 Opus 4 更快的反應時間。因此,GitHub 選擇與 Anthropic 合作,而非其母公司 Microsoft 緊密合作的 OpenAI 模型,可以說間接證明了 Anthropic 技術的競爭力。

laude 4 模型在 SWE-bench Verified(真實軟體工程任務效能基準)上處於領先地位。

儘管新模型在減少「獎勵駭客行為」(如未經授權操作或過度輸出)方面已降低約80%,但 Albert 承認, 人工代碼審查在任何產品代碼發布中仍至關重要 ,AI 的非確定性本質為開發者帶來了新的挑戰與機遇,強調開發者仍需要調整對可靠性的看法。

Claude Opus 4 的定價為每百萬輸入 tokens 收費15美元(約為新台幣450元),輸出則為75美元(約為新台幣2250元);Sonnet 4 的價格則維持在輸入3美元(約為新台幣90元)與輸出15美元(約為新台幣450元)。

兩款模型已可透過 Anthropic API、Amazon Bedrock 及 Google Cloud Vertex AI 存取。Sonnet 4 仍對免費使用者開放,Opus 4 則需付費訂閱。同時,經過數月預覽測試的 Claude Code 編碼環境也正式推出,並整合至 VS Code 與 JetBrains IDEs。

延伸閱讀:輝達槓Anthropic!稱中國「活龍蝦+假孕肚」走私GPU太荒唐:黃仁勳為何不挺AI擴散規則?
大學念理工才吃香?失業率Top10科系揭曉:物理、電腦工程、商設⋯為何比文組還慘?

資料來源:arstechnicaanthropic

本文初稿為AI編撰,整理.編輯/ 李先泰

延伸閱讀

Google Veo 3 有多強?影片生成品質「逼真到令人不安」:懂配音的AI,將翻轉影視產業?
Z世代正放下鍵盤,拿起工具!不會被AI取代、有做就有錢:有哪些超夯藍領工作?
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

黃仁勳後悔賣輝達股票為父母買奔馳 稱這是世上最貴的車

anue鉅亨網
02

證券大老過世! 證交所前總座朱富春逝世享壽77歲 多家企業重訊公告證實

太報
03

不用學位,年薪破300萬!黃仁勳預言未來4職業「大爆發」:寫程式非唯一出路

風傳媒
04

移工中1200萬!新春10款刮刮樂中獎率一次看

NOWNEWS今日新聞
05

台積電VIP換了?傳魏哲家向蘋果提震撼要求

NOWNEWS今日新聞
06

金馬年換新鈔全攻略!2/9起跑「僅5個營業日」 拿到做「1」動作旺整年

三立新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...