請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

台灣大哥大推出 myVoca 語音辨識模型,支援中台英客四種語言混合辨識

T客邦

更新於 03月25日16:11 • 發布於 03月14日23:30 • 洪詩詩

台灣大哥大與長問科技聯手推出 myVoca 語音辨識模型,專為台灣獨特的混合對話環境打造,能精準辨識中文、台語、英文、客語混合對話,不僅辨識率高達97%,更實現即時轉錄,大幅提升企業營運效率。

台灣大哥大與長問科技合作開發一款名為 myVoca 的自動語音辨識模型(ASR),主要針對台灣特有的多元語言環境設計,能夠同時辨識中文、台語、英文與客語的混合對話。

在目前的語音辨識市場中,多數模型主要針對單一語言進行優化,而這款新開發的模型則著重於解決台灣民眾在日常溝通或職場專業對談中,經常切換不同語言的習慣,透過雙方的技術整合,模型在硬體運作效率與辨識速度上皆有所調整,目標是讓語音轉文字的過程更貼近在地化的使用需求。

台灣大哥大推出 myVoca 語音辨識模型,支援中台英客四種語言混合辨識

在技術開發的分工上,台灣大哥大利用其電信產業的背景,蒐集並整理了大量的通用語料與特定產業語料,包括醫療、金融、製造與政府機關等領域,這些語料經過清洗、分類與標註,確保音檔品質符合訓練要求,藉此提升模型在面對產業專業術語時的準確度;長問科技則負責模型架構的設計、演算法調整以及訓練流程的優化。雙方合作後的數據顯示,模型運作時所需的運算資源約為過往架構的 8 分之 1,使得硬體成本得以下降,在實際測試中,經由客製化調校後,辨識正確率最高可達 97 %,且在說話後的 1 秒內即可完成即時轉錄,縮短了語音轉寫的延遲時間。

這款模型的設計核心在於處理台灣常見的跨語言現象(Code-switching)以及產業專有名詞,台灣大哥大資訊長蔡祈岩指出,模型能否落地的關鍵不在於規模大小,而是在於產業語料的精準度。因此,myVoca 針對台灣特有的發音習慣與聲學特徵進行訓練,希望讓語音辨識技術成為企業內部流程管理或客服系統的基礎工具,目前此項技術已開始應用於不同產業場景,例如在金融與醫療體系中,語音辨識可以輔助紀錄處理;而在智慧政府的應用上,則能協助提升行政效率。

台灣大哥大推出 myVoca 語音辨識模型,支援中台英客四種語言混合辨識

為了推動語音辨識技術的普及,台灣大哥大也著手建構相關的生態系,目前已有超過 30 家夥伴加入,範疇涵蓋資訊服務、系統整合與硬體設備商。在實際的應用案例中,已有智慧機器人導入此模型,支援四種語言混合辨識,協助民眾辦理銀行存款或醫療就診紀錄。此外,該模型也被整合進 AI 透明雙向翻譯機中,提升即時翻譯的速度;在客服數位轉型方面,已有業者將此語音模型應用於多通路語音客服系統,而金融科技公司則將 ASR 技術與即時通訊軟體的機器人結合,開發互動式的語音應用服務。

台灣大哥大推出 myVoca 語音辨識模型,支援中台英客四種語言混合辨識

針對企業端的需求,台灣大哥大提供從模型開發、平台運作到實際場景落地的一站式支援,包含後續的系統整合與維運監控。目前這項語音辨識服務已開放企業客戶申請試用,在 3 月底前申請可獲得一個月的免費串接體驗,同時也提供語音記錄平台的使用優惠。透過降低導入門檻,業者希望讓更多企業能將語音轉寫技術應用於會議記錄、客服流程及各種業務自動化場景中,進而優化整體的營運效率。

想看小編精選的3C科技情報&實用評測文,快來加入《T客邦》LINE@

查看原始文章

更多科技相關文章

01

【張瑞雄專欄】放棄思考:AI時代的認知投降危機

Knowing
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...