Google 近期致力於發展 Gemini AI,並且將它廣泛運用在自家服務中。最近更新了 Pixel 手機上的錄音應用程式,稱強了 AI 摘要功能。據 Google 稱,這項更新使錄音應用大受歡迎,而且還不吝分享了一些關於新功能的運作原理細節。
Google Pixel 新錄音應用增強 AI 摘要大受歡迎
Pixel 新錄音應用適用於 Pixel 3 以上的機型,可讓你使用 Android 裝置進行錄音,你可以輕鬆地與他人共享錄音檔,並且透過雲端再裝置間同步。該應用程式包括方便的即時轉錄功能,使得找出哪些地方提到特定單字並透過搜尋關鍵字跳轉節點變得輕而易舉。在錄製像是講座、會議音訊時,自動轉錄尤為實用,而新加入的摘要功能則使錄音應用程式更上一層樓。
Google 指出,由於 Gemini Nano 的助力,錄音應用程式現在可以從頭開始建立轉錄摘要功能,其中所用到的大型語言模型(LLM)針對本機運行做了最佳化,不必連接網路即可運作。最初,Google 嘗試了與伺服器連接的運作模式,但得到的結論表示 Gemini Nano 的強大足以運行該功能,同時將資料處理保留在本機上作業。
將 AI 摘要加入錄音應用顯著促進用戶的使用率與參與度,同時收穫不少活躍用戶的好評。這些改良並沒有被 Android 用戶忽視,用戶每天都會在錄音應用程式中使用 2 至 5 次的 AI 摘要功能,保存下錄音的數量增加了近 25%。錄音應用採用最新的 Gemini Nano 模型使該軟體能夠總結更長的錄音,且語法比以往更好。無論錄音多長,AI 摘要都可以將音訊紀錄濃縮成三個項目,包括講者、主題與要點。由於生成式 AI 功能通常需要專用的神經處理硬體來加速 AI 任務,因此目前僅在 Pixel 9 系列手機上提供摘要功能。
[embed]https://youtu.be/-VcYUdNOp3s?si=g3fHqkFoIb7Ufgkb[/embed]
Pixel 應用程序產品經理 Kristi Bradford 解釋,在設備上內建機上 LLM 對用戶來說是有利的,因為它供了更多隱私性、更少延遲,而且由於不依賴網路,因此可在任何需要的地方運作。內容摘要功能是 AI 如何改善人們日常生活的最佳範例之一,除了工作,對學習也很有幫助。
留言 0