OpenAI 秘密硬體「Gumdrop」曝光! 全力衝刺音訊模型,要讓 AI 介面從螢幕轉向「一支筆」
《The Information》報導,OpenAI 正在加速研發一種專為優化音訊生成任務的 AI 模型,預計在 2026 年第一季推出。這款模型採用全新架構,目標是生成比現有模型更自然、更具情感表達力的語音,並能更好地達成使用者與 AI 之間的即時雙向互動。
值得注意的是,新音訊模型將具備在使用者說話時同步回應與更流暢處理中斷的能力,這些能力是目前的模型所無法企及的。這款模型的研發也被視為 OpenAI 進入消費電子市場的關鍵前置準備,最終目標是要支撐未來預計推出、以音訊為核心的個人裝置(audio-first personal device)。
AI 硬體輪廓浮現:與 Jony Ive 合作,「AI 筆」成為可能形式
OpenAI 進入消費電子市場的過程並非單打獨鬥。先前 OpenAI 已與前 Apple 設計長 Jony Ive 展開深度合作,並在 2025 年 5 月以 65 億美元收購 Jony Ive 創立的設計公司 io Products,目的就是為了開發一系列「AI 驅動的硬體家族」。
這項合作的核心願景是重新定義人機互動,希望能創造讓人感到 「快樂、充實、平和且減輕焦慮」 的裝置。Jony Ive 目的是想透過「音訊優先」的設計,糾正過去電子產品過度讓人分心與成癮的「錯誤」,並降低使用者的數位疏離感。
《Digit.in》報導,OpenAI 預計推出的這款代號為 「Gumdrop」 的硬體產品,可能跳脫傳統智慧型手機或耳機的範疇,是一款類似「AI 筆」或「隨身音訊裝置」(to-go audio device) 的掌上型產品。
這種類型的裝置能讓使用者手寫筆記後,透過 AI 即時將筆記內容轉換為數位文字,並直接傳送至 ChatGPT 進行摘要或編輯。這種裝置的設計哲學是「對螢幕開戰」,試圖以聲音、耳朵與簡單的物理互動取代傳統的螢幕點擊與滑動,並透過整合 麥克風、鏡頭與揚聲器,讓裝置保持活動狀態,隨時感測環境並對使用者的需求做出即時反應,使 AI 硬體裝置更像是一個能主動提供建議並協助達成目標的「陪伴者」,而非僅是單純的數位工具,這也呼應矽谷近年來對「去螢幕化」互動的整體轉向趨勢。
從「對螢幕開戰」到語音優先,音訊介面成為矽谷共識
OpenAI 對音訊技術的關注,其實是矽谷整體科技由「視覺導向」轉向「語音介面(voice-first interfaces)」的縮影,目標是讓「聲音與耳朵」取代傳統的「點擊與滑動」,因為螢幕雖然曾具革命性,但現今已造成嚴重的數位疲勞、注意力分散以及眼部疲勞問題。相較之下,透過語音互動,能讓 AI 無縫滲透進居家、車內甚至穿戴裝置中,將每一處空間都轉化為互動的控制表面。
除了 OpenAI 之外,Meta 也推出搭載五個麥克風陣列的 Ray-Ban 智慧眼鏡,能將使用者的臉部作為定向收音的參考位置,強化裝置對環境的即時感知與互動能力;Google 則自 2025 年 6 月起測試「音訊概覽」(Audio Overviews),將搜尋結果轉化為更具對話感的聽覺摘要;Tesla 也把 xAI 的聊天機器人 Grok 整合進車輛系統,讓駕駛能透過自然對話全語音操作導航、空調與娛樂功能,不必分心盯著螢幕。
因此,若 AI 要從單純的工具進化為日常生活中的「長時間陪伴型工具」,具備即時且自然的語音互動能力,將比受限於螢幕的視覺操作更具可擴展性。此外,這種「去螢幕化」的設計方向,也能顯著提升視障族群的可近用性,並預計在 2026 年重塑整個人機互動市場。
先模型、後硬體:OpenAI 的產品節奏與下一步
目前 OpenAI 採取明確的「先完善模型、後推出硬體」的策略,因為根據內部評估,OpenAI 認為目前的音訊模型在準確度與反應延遲上仍落後於文字模型,因此必須優先補強相關基礎能力。OpenAI 的具體作法是,在過去兩個月內將原先分散的工程、研究與產品團隊重新整合,並由前 Character.AI 研究員 Kundan Kumar 領導。
除了為硬體做準備,OpenAI 也正同步擴大音訊應用的商業化可能性,更計畫進軍生成式音樂領域,開發能將文字指令轉化為完整歌曲的工具,直接挑戰 Suno 或 Udio 等市場強手。這項舉動不僅是為了豐富音訊產品線,也是為了透過高成長的 AI 音樂市場來提振消費性業務的動能。
展望未來,OpenAI 的野心並不止於單一裝置,而是計畫建立一個完整的硬體家族。因此對 OpenAI 而言,加速音訊模型的研發不僅是單純的技術升級,更是支撐未來硬體產品線的關鍵基礎工程,這也意味著在 OpenAI 的 AI 硬體正式問世之前,決定勝負的戰線,已先從「模型能力」與「互動介面」開始。
*本文開放合作夥伴轉載,參考資料:《The Information》、《SiliconAngle》、《Web Pro News》、《Digit.in》、《TechCrunch》,圖片來源:Unsplash
解鎖 3 堂 NVIDIA DLI 技能培訓課!立即報名 1/10【AI 人才年會暨 AI 職涯博覽會】,就能免費參與課程強化 AI 能力、為職涯加分