語音 AI 大爆發、創投募資翻 7 倍,客服與點餐如何成為落地試煉場?
美國調研公司 CB Insights 指出,語音對話在與顧客互動上比文字更具表達力,然而許多中小企業仍面臨客服無人接聽、或通話後長時間等待的困境,使多數顧客在幾分鐘內掛斷。隨著 AI 技術持續進展,語音 AI 有望打破這一僵局。
事實上,在生成式 AI 浪潮與創投資金推動下,語音 AI 已成新興戰場。CB Insights 統計顯示,語音 AI 新創的募資金額,在短短兩年間大幅飆升,從 2022 年的 3.15 億美元,暴增至 2024 年的 21 億美元;2025 年第一季更已募得近 5 億美元。
這股資金熱潮背後,來自語音原生 AI 模型的突破進展,讓語音 AI 能用更自然、人性化的方式和使用者互動。《華爾街日報》指出,從保險、餐飲到醫療保健等產業,越來越多企業將這類技術導入客服流程當中。
語音 AI 取代 IVR 老系統,進入擬人化時代
傳統的客服電話採用「互動語音應答系統」(IVR),只能提供制式化選單、無法理解顧客真實意圖。新一代語音 AI 系統,則能結合語音辨識、語音合成與大型語言模型(LLM),具備即時理解語意與邏輯回應能力。
所謂「語音原生」(voice-native)AI 模型,跳過將語音轉為文字的中介步驟,可直接處理語音輸入與輸出,反應延遲降至 300 毫秒內,更接近人類自然對話的節奏。
調研公司 Gartner 分析師 Tom Coshow 表示,「 如今的 AI 語音代理不僅可被打斷,還能主動提出符合邏輯的建議,對話幾乎無延遲,這本來是我們預估一年半或兩年後才會看到的技術。」
語音 AI 公司 Regal 執行長 Alex Levin 也指出,「在過去一年多,我們觀察到 AI 語音代理的表現與人類一樣好,甚至更好。」
語音 AI 加速商業落地,從保險到餐飲業成試煉場
在實際應用方面,保險平台 eHealth 正透過 AI 語音代理處理潛在客戶初步篩選,特別是在人工客服無法應付來電量或非上班時間時提供支援。
eHealth 數位長 Ketan Babaria 表示,隨技術進步,公司逐漸習慣使用語音 AI 代理,「某一刻,我們發現 AI 代理的表現變得非常像人類,」他更指出顧客已經無法區分兩者。因此,eHealth 系統會在每次通話時告知顧客,它們是虛擬代理。
娛樂與餐飲集團 Fertitta 旗下賭場與餐廳,則運用語音 AI 技術處理訂位與客服來電。但為防止 AI 生成錯誤答案,Fertitta 表示,其語音 AI 代理使用的是自家知識庫,因此不會偏離主題或出現「幻覺」。
CB Insights 觀察,速食店已成為語音 AI 最具應用潛力的場景──除了可減少前線員工人力負擔,更能提升訂單處理速度與準確率,是語音 AI 與人類互動的「甜蜜點」,因為點餐這類對話簡短、語料固定,是語音 AI 最能穩定發揮的場景之一。
下一步,語音 AI 將成為「行動者」
未來語音 AI 將不僅限於對話,而是能主動「打電話」完成任務。PolyAI 執行長 Nikola Mrksic 表示,語音 AI 的下一階段發展,將是具備獨立完成訂餐、下單、銷售等行動能力。
Gartner 預測,到 2028 年,全球有 75% 的新客服中心將導入語音或文字生成式 AI。然而,Coshow 也觀察,許多企業仍普遍認為真人互動仍有不可取代性,特別是高價值的顧客服務時,「這不代表客服中心走向終結。」
*本文開放合作夥伴轉載,資料來源:《Wall Street Journal》、《Business Insider》、CB Insights,首圖來源:Image Creator 生成