請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

Google最新公布AI語音!目標支援1000種語言

新頭殼

更新於 2023年03月08日02:56 • 發布於 2023年03月08日02:56 • Newtalk新聞 |王秀江 綜合報導
近期Google發表了關於「通用語音模型(USM)」的API和研究成果。Google的自動語音辨識(ASR)是以「不斷自我監督學習並微調」的方式進行。   圖:新頭殻資料照

Newtalk新聞

在去年11月Google公布計劃後,近期Google發表了關於「通用語音模型(USM)」的API和研究成果。Google的自動語音辨識(ASR)是以「不斷自我監督學習並微調」的方式進行。目前已經可以支援 100 多種語言自動辨識,最終目標是希望開發到1000種語言。

全球搜尋引擎公司Google所設計的「自動語音辨識」,辨識參數有1200萬小時語音,並經過280億組訓練,涵蓋300多種語言,而目前可以支援到一百多種語言自動辨識。支援語種、資料庫是非常龐大的規模,目前Google還在持續開發設計,最終目標是支援到 1000 種語言。

自動語音識別的最大挑戰是「傳統監督學習」缺乏可擴展性,並且費時費力,所以模型本身需要更高效的方式改進來擴大語種跟辨別品質。Google對於自動語音辨識有三大自我監督學習的新設計,分別是「自我監督學習法」,可在無外部監督的情形下大量分析並學習語音資料,「多目標監督預訓練模型」,則可進行整合各地其他資訊,最後是「介入監督式 loss 函數」,對終端任務進行微調。

YouTube 的「即時語音辨識」與「翻譯」品質改善,正是因為 Google 已把這版的 USM 使用在 YouTube ,特別在使用量較少的 73 種語言上,實現低於 30% 的單詞錯誤率。

延伸閱讀:

推特加密功能即將出現!馬斯克:有望本月上線

婦女節兑現承諾!潘文忠:8/1弱勢女學生可免費取得生理用品

查看原始文章

更多科技相關文章

01

消息人士:日對美5500億美元投資已擬首批計畫 含軟銀參與

路透社
02

Intel、AMD高層:軟硬整合只是入場券!台灣新創要「理解市場」才能存活

創業小聚
03

OpenAI營收破200億美元 運算能力擴大與用戶創新高

路透社
04

史上最佛心老闆?AI 經營售貨機,竟然主動送 PS5 還想賣活魚!及其他一週大事

1% STYLE
05

智抗糖持續獲日立、NTT與三菱重工採用,以數位健康管理深入日企5萬員工市場

創業小聚
06

中華電信抽WBC門票 台灣大辦資費遊亞洲

卡優新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 2

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...