請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

ChatGPT 變身強大語音助理,OpenAI 新模型 GPT-4o 突顯對話能力

科技新報

更新於 05月14日10:36 • 發布於 05月14日02:59

不到半小時的 OpenAI 發表會,由技術長穆拉蒂(Mira Murati)揭曉 ChatGPT 三項更新:旗艦新模型「GPT-4o」、適用於 Mac 電腦的桌面版 App、一般用戶可以免費造訪 GPT Store。

GPT-4o 具 GPT-4 等級的智慧,同時改進 GPT-4 在文字、圖像及音訊方面的能力。GPT-4o 可接受文字、圖像、音訊的任意輸入組合,即時產生文字、音訊、圖像的任意輸出組合,大大改善 ChatGPT 體驗,尤其與 ChatGPT 對話更像真人交談。

發表會現場示範時,支援 GPT-4o 的 ChatGPT 還會模仿機器人語氣說話,甚至高歌一曲。

▲ 與支援 GPT-4o 的 ChatGPT 對話。

OpenAI 稱 GPT-4o 可在短短 232 毫秒的時間內回應人們輸入的語音資料,平均需要 320 毫秒,這接近人們對話的反應時間。GPT-4o 在英語文字和編輯程式碼的表現媲美 GPT-4 Turbo,非英語文字的性能也有所提升,同時 API 的回應速度更快,成本只需一半。

OpenAI 橫跨文字、圖像、音訊資料端到端訓練出這款新模型,意味著所有輸入和輸出都由同一神經網路處理。

GPT-4o 文字和圖像功能今日起支援 ChatGPT,一般用戶可免費使用,未來幾週內將為 ChatGPT Plus 用戶推出具新版語音模式的 GPT-4o alpha 版。

已有手機版 App 的 ChatGPT,如今增添桌面版 App,優先適用於 Mac 電腦,至於 Windows 電腦的版本今年稍晚推出。桌面版連同網頁版一起調整 UI,包含更具對話性的主畫面和訊息輸入設計。此外,一般用戶也能免費造訪 GPT Store,不再限於付費用戶。

GPT-4o 是 OpenAI 突破深度學習界限的最新成果,這次 OpenAI 朝著實用方向開發。GPT-4o 字尾的 o 代表拉丁文「omni」,有「全能」之意,也意指 GPT-4o 的多模態,這使 ChatGPT 邁向更自然的人機互動。

(首圖來源:影片截圖)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0

留言 0

沒有留言。