請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

Anthropic 領先優勢告急?GPT-5.4 整合多步驟工作流,OpenAI 劍指高階知識工作市場

TechOrange 科技報橘

更新於 03月06日15:18 • 發布於 03月06日07:14 • 李昀蔚

OpenAI 近日推出 GPT-5.4,不只強調在推理、編碼以及專業工作上的進展,更首度具備「原生電腦操作能力」。

《The Verge》指出,GPT-5.4 可以代表使用者操作電腦,並在不同應用程式之間完成任務,這意味著 OpenAI 想推進的不只是更會回答問題的聊天模型,而是更接近能在軟體與網路環境中執行複雜工作的 AI Agent。這次更新,也被視為 OpenAI 在職場 AI 競賽中的一次重大突破。

為滿足不同層級的需求,這次更新共釋出三種版本:包含一般通用標準版、擅長延長思考與多步驟推理的「GPT-5.4 Thinking」,以及專為極端複雜且高負載任務設計的「GPT-5.4 Pro」模型。

涵蓋 Excel、文件、跨工具操作,GPT-5.4 瞄準知識工作場景

《The Verge》指出,GPT-5.4 最關鍵的突破,在於它是 OpenAI 首個具備「原生電腦操作」(native computer use)能力的通用模型。這代表 GPT-5.4 不再侷限於對話框內的文字生成,而是能代替使用者實際操作電腦,並跨越不同應用程式執行任務。

更具體地說,GPT-5.4 能夠編寫程式碼來操作電腦,並根據螢幕截圖直接發出鍵盤與滑鼠指令。這種原生內建的能力,也意味著開發者在建立自動化流程時,不再需要依賴外掛式的特製代理框架,進一步降低系統整合的複雜度。

為了讓這項能力真正落地,OpenAI 也同步將 GPT-5.4 導入 API、開發者工具 Codex 與 ChatGPT。這凸顯出這次更新已不只是單一產品的功能強化,而是同時面向開發者與一般使用者的整體生態佈局。為了支撐這個生態系,OpenAI 也在 API 與 Codex 中導入高達 100 萬 token 的上下文視窗,讓 AI 代理能在更長的時間跨度中規劃、執行與驗證任務,而不必依賴傳統的檢索式變通方案。

在具體工作場景上,這樣的轉變也已經開始浮現。《Axios》報導,OpenAI 這次除了更新模型,也推出了能讓 ChatGPT 直接在 Excel 與 Google Sheets 中工作的工具。報導指出,OpenAI 將 GPT-5.4 描述為一個更少出錯、更有效率且更適合起草文件的模型。同時,OpenAI 也表示,GPT-5.4 可以用更少的嘗試次數與更少的來回修改來建立檔案,並以更少的 token 解決問題。

此外,GPT-5.4 是與 Microsoft Excel、Google Sheets 的 financial plugins 一起推出,讓這次更新更明確對準知識工作與專業工作場景。這次更新,之所以被視為 OpenAI 在職場 AI 競賽中的一次重大突破,是因為 OpenAI 同步推出可以讓 ChatGPT 直接在 Excel 與 Google Sheets 中工作的工具,直接對 Google 與 Anthropic 施壓。

對 Anthropic 直接出手,GPT-5.4 正面卡位高階知識工作

在快速演進的 AI 功能競賽中,GPT-5.4 的推出讓 OpenAI 得以持續對 Google 與 Anthropic 施壓,特別是在競爭激烈的工作場域。

過去,Anthropic 在企業客戶領域一直占上風,但 OpenAI 這次把 Excel、Google Sheets、文件起草和多步驟工作流全部整合進 GPT-5.4,展現搶占整個企業工作市場的企圖心。

為了深化這項佈局,OpenAI 不僅引進 FactSet、MSCI、Third Bridge 與 Moody’s 等重量級金融數據合作夥伴,試圖將市場資訊與企業內部數據整合進單一工作流,更針對高階知識工作推出可重複使用的「Skills」功能,專門自動處理財報預覽、現金流折現分析(DCF)與投資備忘錄起草等任務。

這項直攻高階知識工作的策略在效能數據上得到印證:在針對初階投資銀行分析師的試算表建模內部基準測試中,GPT-5.4 的平均得分高達 87.5%,遠勝過前一代的 68.4%。此外,GPT-5.4 也在專門評估投行、顧問與企業法務等長期專業任務的 APEX-Agents 基準測試中奪下榜首。

這項直攻高階知識工作的策略,也同時引發市場對傳統 SaaS 軟體與金融數據供應商可能被取代的擔憂,更與 Anthropic 先前推出的金融服務解決方案與 Cowork 外掛形成了正面對決。正因如此,《Fortune》形容 GPT-5.4 是 OpenAI 迄今最強的企業工作模型,同時也是「對 Anthropic 的直接出手」。

GPT-5.4 更接近 AI Agent 平台,但仍要面對 Google 與 Anthropic 夾擊

因此,GPT-5.4 不只是一個「新版本模型」,更是 OpenAI 所描繪「代理化未來」(Agentic Future)的一環,也就是由一組 AI 代理在背景自動運作、完成複雜工作。從這樣的產品設計可以看出,AI 的角色正從「單次回應的聊天機器人」,轉向能夠維持狀態(keeping state)、編排多種工具,並執行多步驟工作流(multi-step workflows)的獨立系統。

GPT-5.4 確實讓 OpenAI 更接近「工作代理」與 AI Agent 平台的方向。OpenAI 指出,GPT-5.4 在網頁瀏覽器操作、工具與 API 調用上都有提升,也更能在多輪互動中持續搜尋多個來源,找出最相關的資訊,更引入原生電腦操作、高達 100 萬 token 的 context window,以及重新設計的 tool-calling system。這些升級都顯示,OpenAI 正把模型從單純的問答工具,推向更能執行複雜任務的工作型 AI。

不過,這場競爭還沒有定局。《The Next Web》指出,GPT-5.4 雖然在桌面電腦操作與專業知識工作任務上看起來占有優勢,但 Google 的 Gemini 3.1 Pro 仍在抽象推理能力的評估上領先,且具備更大的上下文視窗與更低的價格。因此,GPT-5.4 是否真的能擋下 Anthropic 與 Google,仍然沒有定論。

GPT-5.4 確實展現更完整的 Agent 能力,也清楚顯示 OpenAI 正持續朝電腦操作與專業工作應用深入,究竟 OpenAI 能不能靠這一步突破競爭重圍,仍有待市場驗證。

*本文開放合作夥伴轉載,參考資料:《The Verge》《Axios》《VentureBeat》《Fortune》《The Next Web》OpenAI,首圖來源:OpenAI

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

荷莫茲海峽封鎖重創航運 印度咖啡恐流失西亞80%市場

中央通訊社
02

24萬股東哭暈了! 國家隊本周倒貨「這檔」綠能股420萬股

CTWANT
03

資金出逃! 大賣空本尊看空輝達反抄底「這兩檔」

CTWANT
04

1大廠繳不出財報「股票恐淪壁紙」 最快這天下市

太報
05

中國10項涉台措施 經濟部:台灣按照自己目標走

中央通訊社
06

美伊談判破局  台指期站上新高、台股靜待台積電法說登場

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...