理財

OpenAI推出最新AI代理Deep Research!這是什麼?厲害在哪?

數位時代
更新於 02月04日10:01 • 發布於 02月03日08:28

OpenAI於2月2日推出一款名為「Deep Research」的AI代理(AI Agent),專為從事知識密集工作的科研人員、學者與專業研究者設計,能夠快速瀏覽大量資料,進行深度分析、提取關鍵資訊,並提供更精確的研究建議。OpenAI在官方文章中表示,Deep Research能幫助用戶在數十分鐘內完成原本需要花費數小時的複雜任務。

Deep Research怎麼使用?限制是什麼?

廣告(請繼續閱讀本文)

在實際應用情境,OpenAI舉例,包含串流媒體平台上的競爭分析、最佳通勤自行車的個人化報告,或是讓AI分析過去3年零售業市場的轉變。使用者只要在ChatGPT的輸入欄位,選擇Deep Research查詢,告訴ChatGPT需要的內容,或是附加檔案或電子表格,ChatGPT就會自動查找和分析大量文章、期刊、研究報告等,創建研究分析師級別的報告。

目前,ChatGPT Pro使用者已經能使用Deep Research,每月限制100次查詢,接著會推出Plus與Team方案的服務,目標約再一個月能讓Plus用戶使用Deep Research,其次為Enterprise方案。

Deep Research由GPT-o3模型支援,厲害在哪?

廣告(請繼續閱讀本文)

Deep Research由OpenAI的GPT-o3模型支援,OpenAI宣稱該版本針對網路瀏覽和數據分析進行了優化,能夠利用推理來搜索、解釋和分析網路上的大量文本、圖像和PDF檔,並根據資訊需求進行調整。

此外,Deep Research使用「端到端強化學習」(end-to-end reinforcement learning)技術, 懂得規劃和執行多步驟,以找到所需的數據,並在必要時回溯或汲取即時資訊也能使用python工具繪製和運算圖表,將生成的圖表嵌入其回應中。

OpenAI也將Deep Research與自家GPT-4o比較,在針對特定領域、需要多筆資料交叉比對,講求深度與細節性的調查,Deep Research能夠更切合指示,整合多項資料來源,並以表格形式呈現。

在包括逾100項學術領域、超過3,000個專家級問題的「Humanity's Last Exam」中,Deep Research達到26.6%的準確率。根據OpenAI的數據,Deep Research不只領先自家的GPT-o1(9.1%),也超越包含DeepSeek-R1(9.4%)和Gemini Thinking(6.2%)等競品的表現。其中,與GPT-o1模型相比,Deep Research最大的進步出現在化學、人文和社會科學以及數學方面。

延伸閱讀:OpenAI推o3-mini反擊DeepSeek,免費用戶也能用!特色、效能一次看

從Operator到Deep Research,搶占2025年AI代理落地商機

OpenAI近期擴展了其在AI代理領域的布局,不僅推出了Deep Research,上個月也推出名為「Operator」的AI代理,能夠自動完成像是預約餐聽、預訂航班和住宿、下單購物等多種日常任務。

AI看似真的從副駕駛轉而擁有更多自主行動能力,但OpenAI也坦承,目前Deep Research有其局限性,根據內部評估,它有時會在回答中產生幻覺或做出錯誤的推斷,或是難以區分權威訊息和謠言。此外,Deep Research產生的報告和引文中可能存在輕微的格式錯誤,並且生成結果的耗時較長,大約需要5~30分鐘不等的時間。

儘管如此,對OpenAI來說,AI代理的進程拖延不得,因為僅僅1個多月以前,Google發布同樣名為Deep Research、功能也相似的產品;同樣地,微軟、Anthropic和其它新創公司也已經推出了自己的AI代理。OpenAI執行長奧特曼(Sam Altman)在年初時表示,2025年可能看到第一批AI代理加入工作流程,從Operator到Deep Research,顯然OpenAI正在加緊腳步搶占先機。

延伸閱讀:DeepSeek會造成什麼影響?從秦始皇焚書到驅逐低端人口,揭開中共AI戰略布局

資料來源:OpenAIBloomberg紐約時報

延伸閱讀

OpenAI執行長發文:首批AI Agent今年問世,長遠目標是實現「超級AI」
Google發布Gemini 2.0!AI助手Astra大升級:可聽懂晶晶體、看圖辨位⋯還能兼電玩教練?
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章