請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

「動口不出聲」也能傳達訊息:頸部 AI 感測裝置讀肌肉微動,準確率達 85.8%

科技新報

更新於 04月23日15:21 • 發布於 04月26日08:30

韓國浦項工科大學(POSTECH)研究團隊開發出一款穿戴式 AI 感測器,能透過偵測頸部與喉部周圍的細微肌肉變化,將「無聲說話」轉換為可聽見的語音,為失去聲音的患者與高噪音環境中的溝通開啟新可能。相關成果已發表於《Cyborg and Bionic Systems》。

這項技術的核心是一種名為「多軸應變映射感測器」的穿戴式裝置。它結合迷你攝影機、柔性矽膠層與參考標記點,可貼合或配戴於頸部,追蹤說話時皮膚與肌肉的極細微形變。研究團隊指出,相較於傳統主要依賴 EEG 或 EMG 的靜默語音系統,此做法更輕量,也更適合日常使用,且在重新配戴後仍可自動校正。

在辨識部分,系統結合卷積神經網路(CNN)與 Transformer 模型,解析應變圖樣並重建語音內容,再搭配使用者的聲音特徵進行語音合成。研究團隊以 5,186 筆樣本訓練模型,受試者為 6 名 23 至 32 歲的健康成人,詞彙範圍涵蓋 NATO 音標字母表的 26 個單字。結果顯示,分類準確率達 85.8%。在模型壓縮後,檔案大小從 12.4 MB 降至 3.6 MB,推論速度也由 0.018 秒縮短至 0.003 秒,準確率仍維持在 82%。

研究團隊也強調該裝置在高噪音情境中的表現。系統在約 90 分貝白噪音環境下,辨識效果與一般 60 分貝環境相近;研究同時指出,若配戴過鬆、使用者說話太大聲,或在走動、頭部上下擺動時,辨識率會下降,顯示後續仍需加強穩定性與抗動態干擾能力。

研究團隊表示,這項技術未來可望幫助因聲帶受損或喉部手術而失聲的患者,讓他們透過自身的肌肉動作重新「發聲」;同時也可能應用於工廠、建築工地、會議室或圖書館等不便開口的場景。研究人員並提到,接下來將持續擴大資料集、增加使用者與詞彙範圍,並改善運動干擾問題,以推進實際部署。

▲ 穿戴式 AI 感測器在環境雜訊與振動干擾下,仍維持穩定語音辨識效能之實驗結果與比較分析。(Source:Cyborg and Bionic Systems

(首圖來源:pixabay

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

國巨爆鉅額違約交割 金額達3880萬元

中央通訊社
02

領獎倒數7天!今年1-2月期統一發票「87510041」千萬獎還有4張未領 最低只花2元

太報
03

暴賺123%!今年最賺ETF是這檔 今天分割前最後交易日

EBC 東森新聞
04

台股狂飆「國巨」V拉漲停!謝金河看好「另一支千金股」

民視新聞網
05

駕艙機車6/30開放上路!要什麼駕照?售價多少?Lean3重點整理

數位時代
06

詐客戶4945萬還嗆「沒讀書」 遠雄人壽前經理遭起訴求重刑

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...