請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

手機語音辨識活用術:開會不用手打逐字稿,記事連同聲音一起存

T客邦

更新於 2019年06月18日10:39 • 發布於 2019年06月17日02:30 • 小治

在各類型的科幻片中我們經常會看到一個共通之處,那就是主人翁憑藉著一張嘴,就能走遍天涯無往不利,當然,這裡並非指主角善於油嘴滑舌,而是簡單如開門、關燈;困難如自動駕駛、遠端遙控,都能夠藉由語音指令完成,完全不必動手。

不管這是不是你所期望的未來世界,現實世界的技術開發者,的確是朝著這樣方向在努力著,而語音輸入在開闊環境下的辨識正確性,也成為各家亟欲突破的瓶頸之一。

在各類型的科幻片中我們經常會看到一個共通之處,那就是主人翁憑藉著一張嘴,就能走遍天涯無往不利,當然,這裡並非指主角善於油嘴滑舌,而是簡單如開門、關燈;困難如自動駕駛、遠端遙控,都能夠藉由語音指令完成,完全不必動手。不管這是不是你所期望的未來世界,現實世界的技術開發者,的確是朝著這樣方向在努力著,而語音輸入在開闊環境下的辨識正確性,也成為各家亟欲突破的瓶頸之一。

不過還好,現在我們有個折衷的方式,就是透過隨身行動裝置內建的語音助理功能,由於下指令者多半是手機的持有人,聲音接收距離較近,因此也讓辨識出錯的機率降低不少,在許多行動應用上都可達到加快輸入速度、簡化操作流程的便利性,例如 Google搜尋、找地圖、撥打電話給指定聯絡人等等,甚至在工作學習方面,也能夠透過行動裝置擷取並辨識第三人的語音,衍生出即時會議紀錄等額外的用途。

傳簡訊不必用手按:Google語音助理

去年 Google語音助理才正式支援繁體中文,但由於背後的龐大搜尋引擎與機器學習技術支援,所以表現比 Siri 有過之而無不及,不過很可惜的是,因為安全性考量問題,原本英文版有的 Voice Match 功能被移除,使用者無法在待機狀態下,透過「Ok, Google」語音指令喚醒手機,必須先喚醒手機長按 Home鍵,才能啟動 Google助理,但啟動之後,你可以請它導航、詢問天氣與行事曆等諸多功能,這裡我們以傳送簡訊做示範,透過 Google助理的語音輸入,其實就可以節省翻找聯絡人名單、手動輸入訊息及傳送的手續,不過因為 Google助理目前不支援標點符號,所以此方式以傳送單句的短訊為佳。

1.在手機喚醒狀態下長按「Home」鍵,叫出 Google語音助理。

▲ 1.在手機喚醒狀態下長按「Home」鍵,叫出 Google語音助理。

2.對著手機說要傳簡訊給某個聯絡人,如果此人擁有多支電話,Google助理會並進一步詢問要傳送到哪一支電話。

▲ 2.對著手機說要傳簡訊給某個聯絡人,如果此人擁有多支電話,Google助理會並進一步詢問要傳送到哪一支電話。

3.接著以口述的方式輸入訊息的內容。

▲ 3.接著以口述的方式輸入訊息的內容。

4.辨識上相當正確,不過如果中途有停頓,Google助理就會詢問你是否要修改或送出。

▲ 4.辨識上相當正確,不過如果中途有停頓,Google助理就會詢問你是否要修改或送出。

5.完成後,說出「直接送出」,Google助理便可幫你傳送簡訊出去。

▲ 5.完成後,說出「直接送出」,Google助理便可幫你傳送簡訊出去。

改用語音來做筆記:Google Keep

對於某些資訊量龐大的課程來說,速記已經成為學生必備的技能,但與其抄到手酸,不如善用語音筆記的方式,達到事半功倍的效果。Google Keep 是 Google 所推出雲端筆記及備忘錄服務,其中便搭載了語音記事的功能,其功能特色並不只是錄音而已,而是可以把你的語音記事內容,即時轉換為文字並儲為筆記,方便日後再把內容修改的更完整。其他像是開會,或是人在外面,突然有靈感但沒有筆可以快速記下來時,也都能透過 Google Keep 來幫忙。不過要注意的一點是,Google Keep 的語音記事功能只支援在手機或平板電腦上使用,如果你帶的是筆電,打開 Google Keep 的網頁,可是找不到麥克風按鈕的喔。

Google Keep
Android版:https://goo.gl/Hs7sI
iOS版:https://goo.gl/WXnVKQ

1.開啟Google Keep App,在下方新增記事的地方選擇「麥克風」,以語音輸入方式來記事。

▲ 1.開啟Google Keep App,在下方新增記事的地方選擇「麥克風」,以語音輸入方式來記事。

2.對著手機說出你要記錄的內容或事項。

▲ 2.對著手機說出你要記錄的內容或事項。

3.接著Google Keep便會跳至筆記草稿編輯頁面,同時列出錄音檔及文字。

▲ 3.接著Google Keep便會跳至筆記草稿編輯頁面,同時列出錄音檔及文字。

▲ 4.此時可以輸入更多內容讓筆記更完整,或可按「+」號新增另一段語音記事到筆記中。

 ▲ 4.此時可以輸入更多內容讓筆記更完整,或可按「+」號新增另一段語音記事到筆記中。

5.而筆記修改完後不需要的錄音檔,則可以按「X」號加以刪除。

▲ 5.而筆記修改完後不需要的錄音檔,則可以按「X」號加以刪除。

即刻生成會議記錄草稿:雅婷逐字稿

不管是擔任會議記錄的人員、口述歷史研究者,或是替影片製作逐字稿的後製人員,除了打字速度要夠快,也需要具備理解專有名詞或口音的能力,如果可以把轉錄文字的工作交給電腦,自己專注於除錯及修改字詞的話,就能讓工作效率增進不少。這裡介紹的雅婷逐字稿,是一款由台灣團隊開發的一款語音轉文字軟體,不但具備即時轉錄的功能,也可以匯入其他錄音檔來轉成文字,而且還可自動加入標點符號,只需要檢查有無錯誤再微調修改即可,另外雅婷逐字稿也標榜能夠辨認台灣國語、中英夾雜等語音,符合台灣本地的用語習慣。

雅婷逐字稿
Android版:https://goo.gl/YmCGLq
iOS版:https://goo.gl/whjU2o

1.進入雅婷逐字稿App首頁介面,按下底下的麥克風圖示,即可開始進行錄音及轉成文字的工作。

▲ 1.進入雅婷逐字稿App首頁介面,按下底下的麥克風圖示,即可開始進行錄音及轉成文字的工作。

2.錄音過程中,轉出的文字會即時顯示於上方,並會自動加入標點符號。

▲ 2.錄音過程中,轉出的文字會即時顯示於上方,並會自動加入標點符號。

3.如果前一步驟按下停止錄音,則可以播放剛剛錄製的聲音,或接著「繼續錄音」。

▲ 3.如果前一步驟按下停止錄音,則可以播放剛剛錄製的聲音,或接著「繼續錄音」。

4.回到首頁可以查詢剛剛錄好的檔案,由右往左滑動,便可設為重要、分享或刪除。

▲ 4.回到首頁可以查詢剛剛錄好的檔案,由右往左滑動,便可設為重要、分享或刪除。

5.點選文件圖示可以匯入音檔進行轉寫,不過基本版一個月內只能轉寫3個檔案。

▲ 5.點選文件圖示可以匯入音檔進行轉寫,不過基本版一個月內只能轉寫3個檔案。

不方便傳LINE就直說吧:LINE語音訊息

LINE 可以說是台灣民眾最常使用的即時通訊軟體,上至政府機關,下至販夫走卒,很少人手機裡面沒有 LINE 的存在,連婆婆媽媽也懂得用 LINE 不定時分享長輩圖。除了普及性之外,多樣化的傳訊方式,或許也是人們愛用的原因之一,像是最基本的文字訊息、語音通話,要是懶得打太多字的話,你也可以用貼圖代替心情,或是傳送語音訊息。但…都能語音通話了,何必用語音傳訊呢?也許對方不方便接聽、有些話不方便直接說,當然最重要的是,聲音能夠比文字表達出更多的情緒,因而減少會錯意發生誤會的情況。

LINE
Android版:https://goo.gl/8dKaw
iOS版:https://goo.gl/Oh57hX

1.進入好友的聊天室介面,點選文字輸入框右方的「麥克風」圖示。

▲ 1.進入好友的聊天室介面,點選文字輸入框右方的「麥克風」圖示。

2.要錄製語音訊息,按著下方麥克風按鈕不放,便會啟動錄音,放開手便會停止錄音。

▲ 2.要錄製語音訊息,按著下方麥克風按鈕不放,便會啟動錄音,放開手便會停止錄音。

3.訊息錄音完成便會立即發送出去,在對話牆上點擊該訊息,可以隨時播放。

▲ 3.訊息錄音完成便會立即發送出去,在對話牆上點擊該訊息,可以隨時播放。

4.如果反悔想要收回,就長按該則訊息,在跳出的視窗選擇「收回」。

▲ 4.如果反悔想要收回,就長按該則訊息,在跳出的視窗選擇「收回」。

5.假如好友的 LINE 版本不同,有可能無法從對方的聊天室收回訊息,確認的話就按「收回」。

▲ 5.假如好友的 LINE 版本不同,有可能無法從對方的聊天室收回訊息,確認的話就按「收回」。

讓聽障朋友也能融入交談:即時轉錄

世界衛生組織預估,到了2055年,全球將有多達9億人會面臨聽力障礙的問題,為了讓聽障朋友也能擁有無障礙溝通的環境,Google 與世界上唯一一所專供聽力障礙學生就讀的大學—美國高立德大學合作,開發出這款應用程式,運用了 Google 自家的語音識別技術,可支援70多種語言,目前仍在測試中,但已可下載試用。使用者透過手機即可接收附近說話的聲音,並即時轉換為字幕顯示在手機螢幕上,像在朋友聚餐時,成員若有聽力障礙者,開啟 App 後便能「看見」大家在說什麼,也能輕易加入話題,不會因為自己聽不到,朋友又不會手語,而被冷落在一旁。

即時轉錄
Android版:https://goo.gl/UyhXF1
iOS版:無

1.一打開App就會即時進行收音和轉錄,其實並不用什麼多餘的操作。

▲ 1.一打開App就會即時進行收音和轉錄,其實並不用什麼多餘的操作。

2.收到的說話聲音會轉成文字,直接顯示在手機螢幕上。

▲ 2.收到的說話聲音會轉成文字,直接顯示在手機螢幕上。

3.如果自己不方便說話,也能按下鍵盤圖示,用打字的方式與他人對話。

▲ 3.如果自己不方便說話,也能按下鍵盤圖示,用打字的方式與他人對話。

4.點選齒輪圖示可以設定字體大小及背景主題,按「更多設定」可開啟細部選項。

▲ 4.點選齒輪圖示可以設定字體大小及背景主題,按「更多設定」可開啟細部選項。

5.開啟快訊開關後,當說話者間隔了一段時間才又說話時,手機會發出震動的提示。

▲ 5.開啟快訊開關後,當說話者間隔了一段時間才又說話時,手機會發出震動的提示。

          本文同步刊載於PC home雜誌
 
         

Google Drive網頁版實用技總複習:無縫整合Web APP應用,線上修圖、轉檔、簽名等一站搞定


          歡迎加入PC home雜誌粉絲團

想看小編精選的3C科技情報&實用評測文,快來加入《T客邦》LINE@

查看原始文章

更多科技相關文章

01

ASML稱新一代EUV設備就緒 助AI晶片量產邁新里程

路透社
02

衝擊電玩產業 輝達預估遊戲晶片短缺將持續到年底 

路透社
03

傳Meta與Google簽數十億美元協議 租用AI晶片開發模型

路透社
04

加州女子告Meta、YouTube 控損害心理健康

路透社
05

Netflix放棄收購華納兄弟提案 股價盤後飆漲10%

路透社
06

華府強硬督促敘利亞 改用美方電信技術排除中資

路透社
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...