在香港時間周二凌晨,OpenAI 在春季發布會上宣布ChatGPT迎來重大更新。大眾迎來的不是 GPT-5 發布, 也不是 AI 搜尋引擎,而是 OpenAI 宣布推出名為 GPT-4o,可與用戶語音對話的 AI 模型。
OpenAI 技術總監 Mira Murati 在發布會上宣布,推出名為 GPT-4o 的全新旗艦 AI 模型。GPT-4o 具備文字、語音、影像處理能力,輸入模式可為文字、語音、影像的任意組合,同時亦能以這三種不同模式輸出。
根據官方介紹,GPT-4o 能夠處理50種不同語言,而其運行速度是 GPT-4 Turbo 的兩倍。在 GPT-4o 中的「o」代表「omni」。「omni」一詞源自拉丁語「omnis」,意為「全能」;而在英語中,「omni」常被用作詞根,有「全部」、「所有」、「全方位」等意思。
GPT-4o 能在 232 毫秒内對語音作出反應,與人類對話的反應時間相近。從發布會直播片段可見,OpenAI 職員與 GPT-4o 的互動自然,亦能由輸入的語音中識別用家情緒,例如 GPT-4o 能從急促的喘氣聲判斷對方「緊張」。
GPT-4o 將免費向公眾開放,包括 OpenAI 的免費用戶。同時,OpenAI 亦公布將發表桌面版的 ChatGPT,但最初只會推出 Mac 版本。
留言 0