【觸不到的她】OpenAI發布GPT-4o 可與用戶語音對話

在香港時間周二凌晨，OpenAI 在春季發布會上宣布ChatGPT迎來重大更新。大眾迎來的不是 GPT-5 發布，也不是 AI 搜尋引擎，而是 OpenAI 宣布推出名為 GPT-4o，可與用戶語音對話的 AI 模型。

OpenAI 技術總監 Mira Murati 在發布會上宣布，推出名為 GPT-4o 的全新旗艦 AI 模型。GPT-4o 具備文字、語音、影像處理能力，輸入模式可為文字、語音、影像的任意組合，同時亦能以這三種不同模式輸出。

根據官方介紹，GPT-4o 能夠處理50種不同語言，而其運行速度是 GPT-4 Turbo 的兩倍。在 GPT-4o 中的「o」代表「omni」。「omni」一詞源自拉丁語「omnis」，意為「全能」；而在英語中，「omni」常被用作詞根，有「全部」、「所有」、「全方位」等意思。

GPT-4o 能在 232 毫秒内對語音作出反應，與人類對話的反應時間相近。從發布會直播片段可見，OpenAI 職員與 GPT-4o 的互動自然，亦能由輸入的語音中識別用家情緒，例如 GPT-4o 能從急促的喘氣聲判斷對方「緊張」。

GPT-4o 將免費向公眾開放，包括 OpenAI 的免費用戶。同時，OpenAI 亦公布將發表桌面版的 ChatGPT，但最初只會推出 Mac 版本。

財經