OpenAI 近日發佈一款名為Operator的人工智能代理,目前以「研究預覽」形式推出。根據官方網誌,此工具可透過內建瀏覽器「訪問網頁並執行任務」,具備打字、點擊和滾動功能,專為每月訂閱費 200 美元的ChatGPT Pro用戶提供,初期僅在美國推出。
結合 GPT-4o 技術與強化學習
Operator 使用一種名為「Computer-Using Agent」的型號,結合 GPT-4o 的視覺功能和強化學習的高階推理能力,實現對圖形使用者介面的互動。OpenAI 表示,Operator 能夠「觀看」(透過截圖)和「互動」(模擬鍵盤和滑鼠操作),無需額外 API 整合即可直接在網頁上執行操作。
自我校正與用戶安全保護
Operator 具有自我校正功能,當遇到問題時會讓用戶接管,並在敏感操作(如輸入登錄憑據或發送電子郵件)時請求用戶確認。此外,Operator 被設計為拒絕執行有害請求,並能阻擋不被允許的內容。
解決真實需求
OpenAI 宣布正與 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和 Uber 等企業合作,確保 Operator 符合真實世界的需求和既定規範。不過,公司也提醒用戶,目前該工具仍存在操作上的局限,例如處理複雜介面(如製作簡報或管理行程)的能力尚未完善。
未來發展方向
OpenAI 計劃未來將 Operator 推廣至 Plus、Team 和 Enterprise 用戶,並將其功能整合到 ChatGPT 平台中。這標誌著 OpenAI 在實現人工智能全面實用化方面邁出新的一步。
NewMobileLife 網站:https://www.newmobilelife.com
Facebook:https://www.facebook.com/jetsoiphone