請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Google I/O 2025發布會說了什麼?6 大重點一次看:AI從語言模型走向行動代理

經理人月刊

更新於 2025年05月23日04:33 • 發布於 2025年05月23日04:30 • 支琬清

想像一下,以後逛網拍,可能只需要「告訴 AI 想買什麼」,它就會幫你找到商品、比價、追蹤價格,甚至在打折的時候,自動幫你下單(經過你的同意)。這是 Google 在 I/O 2025 發布會上實際展示的全新購物模式。

Google I/O 是 Google 每年舉辦的開發者大會,不僅發表最新產品與技術的平台,也展示研究成果落地應用、說明開發工具如何整合至實際產品的重要發布會。

《經理人》整理發布會中的 6 大重點主題,聚焦於本次發表會中所揭示的策略方向與技術應用,解析 Google 將藉由 Gemini 技術與代理型 AI(Agentic AI),推動產品升級與市場擴張。

1. Gemini 2.5 與代理模式:從語言模型走向可執行任務的操作助手

Google 宣布推出 Gemini 2.5 Pro 與 Flash 兩大模型版本,主打推理能力、語境處理與成本效率。Pro 版本支援深度思考(deep think)模式,可在更複雜任務中展現邏輯處理與延伸思考能力;Flash 則定位為反應速度更快、成本更低的版本,適合即時應用場景。

同步登場的「代理模式」(Agent Mode)則標誌著 Gemini 從回應式模型邁向具備行動能力的代理型 AI。根據現場展示內容,Agent Mode 可協助使用者完成如購票、篩選商品、提交表單等任務,朝「操作型 AI 助手」的方向前進。

代理模式未來將整合至 Gemini App、Chrome 與安卓(Android)系統中。Google 強調,該功能是在使用者監督下的「代為執行」而非「自主決策」,目標是提升用戶在網路操作與資訊篩選上的效率。

Google 指出,AI 僅會根據明確指令操作,並需經由使用者確認關鍵步驟,例如點擊「為我購買」等按鍵。因代理技術仍處於早期發展階段,採用由人主導、AI 輔助的架構,不僅有助於結果更符合使用者意圖,也能降低誤判與資料濫用的風險。

2. Google 搜尋進入 AI 模式時代:從查詢回應邁向資訊整合

Google 搜尋推出AI(AI Mode),將搜尋體驗推向更進階的語意處理與任務導向應用。(目前僅限美國)透過 Gemini 模型的支援,使用者可輸入更長、更複雜的敘述式問題,AI 系統會拆解為子查詢並整合多方資料,生成具脈絡與引用的整合性答案。

進一步的深度搜尋(deep search)功能則允許系統針對同一主題發出數百筆查詢,自動彙整並以研究報告的形式產出結果,對於學術、專案規畫等需求具實用潛力。

Google 也展示了 AI 模式的即時互動能力,包括圖表產生、視覺搜尋與個人化建議。用戶可選擇讓系統取用 Gmail、Google 雲端硬碟等服務資料作為輔助背景,強化回應的精準度與實用性,這些設計顯示 Google 正試圖將搜尋服務升級為 AI 驅動的「資訊助理」。

3.Gemini Live:連動手機鏡頭和麥克風,即時分析影像和語音

Gemini Live 是今年 I/O 發表會上的另一大亮點,源自研究計畫 Project Astra。該功能結合手機鏡頭與麥克風,讓 AI 可針對即時環境進行語音與影像分析。根據現場展示,使用者可拍攝某物體並問問題,AI 能快速判斷並回覆。

Google 指出 Gemini Live 在視覺輔助和教育方面具應用潛力,並可能擴展至導覽等更多情境。並表示該技術已在安卓平台開放,後續也將支援iOS。該功能被視為 Gemini 從純語言模型擴展向「具備環境感知能力的 AI 助理」的重大進步。

4.AI模式購物體驗:結合 Shopping Graph、虛擬試穿與價格監控

Google 在 AI 模式中導入全新的購物體驗。透過超過 500 億筆商品資料構成的 Shopping Graph,使用者可以自然語言描述需求, 例如「我想找一個可愛的旅行背包」,AI 即可回傳符合條件的產品推薦,包含價格、規格與購買途徑等資訊。

虛擬試穿功能亦同步登場,使用者可上傳個人照片,AI 將模擬穿著特定服裝後的外觀效果。此項目透過 AI 圖像生成模型實現,目標是提升消費者購物前的決策信心。

Google 也推出價格追蹤與結帳代理功能,用戶設定條件讓 AI 監控價格波動,達到目標價時通知使用者,經使用者確認後由 AI 完成結帳流程。這些功能體現了 Google 嘗試整合搜尋與購物流程,提升使用者轉換率並拓展商務應用場景。

5. 智慧眼鏡:預計2025年上市,Gemini 應用擴展至穿戴平台

Google 在本屆 I/O 上正式發布安卓 XR 平台,該平台旨在支援智慧眼鏡與頭戴式裝置。其中一款重點頭戴式裝置是與 Samsung 合作開發的 Project Moohan,預計於 2025 年上市。

官方同步展示智慧眼鏡應用,透過 Gemini 技術整合語音助理、即時翻譯、訊息回覆與拍照功能。眼鏡將搭配鏡頭、麥克風與隱藏顯示器, 讓使用者可以「解放雙手」,減少拿出手機、滑動螢幕或打字等動作。

Google 也與眼鏡品牌Gentle Monster、Warby Parker 合作設計具時尚風格的鏡架,讓穿戴式裝置在造型上更易被接受。Gemini 在穿戴平台的應用,將是 Google 進軍 AR 市場的戰略延伸。

6. Google Beam:3D 通訊平台與語音翻譯

原為研究項目的 Project Starline 正式命名為 Google Beam。該系統透過6顆攝影機與 AI 合成技術,能將使用者的視訊影像重建為 3D 影像,提升視訊會議的臨場感與互動性。

結合 Google Meet 的語音翻譯功能,Beam 系統可同步翻譯對話並模擬語氣與語調,目前已支援英文與西班牙文版本,其他語言版本後續將開放測試,未來可應用於商務與跨境溝通情境。

資料來源:Google1Google2Google3Google4Google5Google6Mashable;本文初稿由 AI 協助整理,編輯:支琬清

延伸閱讀

AI 很聰明,為什麼還不能幫我們把工作做完?AI的3大核心限制
Perplexity、ChatGPT 只要一鍵就能搜尋,Google 會被 AI 搜尋取代嗎?
加入《經理人》LINE好友,每天學習商管新知

查看原始文章

更多理財相關文章

01

包裹有「這3字」別取貨!超商店員急攔阻 加碼曝光詐騙黑名單

自由電子報
02

中國貿易順差衝破1.19兆美元的「危險訊號」!進口停滯、關稅失靈下的全球警訊

anue鉅亨網
03

郵局網路轉定存限額降至百萬 3/14上路 

NOWNEWS今日新聞
04

大摩唱多記憶體 上修南亞科等五傑目標價

NOWNEWS今日新聞
05

台灣鯛價格崩盤漁民排隊賣不掉 台美關稅定案但緩不濟急

自由電子報
06

法說前夕再飆半根! 「這檔記憶體」目標價翻倍搶先看

CTWANT
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...