請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Google I/O:除Gemini 升級!還有哪些更新?

遠見雜誌

更新於 05月24日08:09 • 發布於 05月20日18:32 • 曾子軒

Google本週(5/20)舉行2025年開發者大會(Google I/O),試圖將底層AI模型的能力注入終端產品,再結合Google橫跨各端的通路優勢,實現「資訊變智慧、智慧更個人」的願景。隨著最新版本的Gemini 2.5模型進一步升級,整合至搜尋、購物與個人助理後,使用者是否真的能感受到AI帶來的改變?《遠見》一文整理帶你掌握完整消息。

【目錄】
▌Gemini 2.5 Pro要做最強大模型,Flash力求性價比
▌AI搜尋進化,變身能夠深入對話的AI模式
▌購物加上AI能提問、試穿,還能提醒結帳
▌Gemini助理加強,即時看螢幕、說話就互動
▌結語:智慧、代理以及個人化,打好產品+AI地基

Google執行長皮蔡(Sundar Pichai)在2025 Google I/O上,向Google員工、媒體和開發者說,Google發布新技術和新產品的速度,比以往任何時候都快。

「更多智慧正普及到每一個人、每一個角落。全世界也正迅速回應,以前所未有的速度採用AI。」

Gemini 2.5 Pro要做最強大模型,Flash力求性價比

回顧過去一年的基礎模型戰場,OpenAI同時維持兩條軸線,一邊是重視推理能力的o開頭系列模型,以及遵循擴展定律(scaling law),另一邊則是增加參數和資料量的GPT-4開頭系列模型

Anthropic持續更新Claude,且將重點放在企業端使用者,對寫程式的應用尤為重視;DeepSeek訴求以較低成本推出表現仍優異的模型,也在AI爭霸戰寫下濃墨重彩的一筆。

至於Google,腳步則相對穩定,持續帶給使用者更加進步的Gemini模型,表現可說是中規中矩。今年在Google I/O舉辦前,沒有留給競爭對手突襲機會,本月初(5/6)便預先推出Gemini 2.5 Pro I/O版。

Google多次強調,從客觀數字來看,Gemini 2.5 Pro是現在市面最強大的基礎模型之一,不僅好幾項關鍵基準測試表現最為優異,還在大模型競技場上名列前茅,而且廣受開發者喜愛。

Google的AI舵手哈薩比斯(Demis Hassabis)分享,Google正在引入「深度思考」(deep think)的新模式,讓模型在回覆前能夠考量多種不同假設(hypotheses),藉此將模型的能力推向極限。

至於回應速度更快的輕量Flash系列模型,皮蔡表示,若以每秒產生的符元(token)數量計算,Gemini靠著2.5 Flash的兩個版本和2.0 Flash就包辦了前三名,而且還達到極高的性價比。「價格和效能之間有著嚴峻的權衡,但我們一次又一次以最具成本效益的價格提供最好的模型。」

哈薩比斯補充,Gemini 2.5 Flash雖然能力比不上Gemini 2.5 Pro,但是在推理、多模態、寫程式和長文本等不同面向上,都更加有效率。

另外,Google同步推出原生語音輸出(native audio out),讓Gemini模型能以自然語氣、口音與風格進行語音互動,開發者用來打造語音互動對話時,可調整語音語調,例如講故事時加入戲劇張力,甚至能辨識使用者語音中的情緒,帶給使用者更有情感的回應。

隨著推理能力成為模型提供者的兵家必爭之地,Google另外提供思考摘要(thought summaries),讓開發者清楚了解模型在思考過程中的重點、使用哪些工具與邏輯;為了衡量成本,也將過往Flash模型就有的思考預算(thinking budgets),延伸到Pro模型,如此一來,開發者調用API時可以自訂模型「思考」所消耗的符元,在成本與品質之間尋求平衡。

雖然人們擔心Gemini應用程式的知名度和使用者比不上ChatGPT,也連帶關注Gemini模型的聲勢無法和GPT系列模型相比,但考慮到Google既有的龐大生態系,只要Gemini模型持續更新,就算Gemini應用程式使用者比不過對手,只要整合到產品裡,Google就有一戰本錢。

AI搜尋進化,變身能夠深入對話的AI模式

在Google老本行搜尋業務上,去年推出AI概覽(AI overview),今年Google升級搜尋體驗,正式端出3月預告的AI模式(AI mode),戮力展開金雞母業務的全面革新。

AI概覽是將搜尋結果摘要,提拱使用者更能對應搜尋意圖的內容,但分析師們總是擔心,AI推論(inference)將讓搜尋成本提高,而且,因為使用者不用造訪網頁,就能得到解答,進而減少點擊連結的誘因,可能影響Google搜尋廣告帶來的豐沛營收。

在I/O前接受All-in Podcast採訪時,皮蔡表示,隨著技術進展,AI推論花費下降飛快,成本不是大問題;以AI概覽的廣告收益來說,也已經達到基準線(baseline),即便使用者獲取資訊的方式出現典範轉移,從傳統搜尋轉向AI問答,也不會和Google的核心商業模式產生衝突。

皮蔡也在I/O上分享,人們實際使用AI概覽以後,對搜尋結果益發滿意,且搜尋頻率也愈來愈高,可以看出AI增進搜尋體驗的效果,他語氣強烈地表示,「(AI輔助搜尋)這是過去十年來搜尋領域最成功的發布之一。」

皮蔡樂觀表示,AI概覽帶動使用者的查詢,且預期成長會隨著時間推移增加。曾子軒攝

皮蔡樂觀表示,AI概覽帶動使用者的查詢,且預期成長會隨著時間推移增加。曾子軒攝

如果說AI概覽是Google的牛刀小試,則AI模式就是真槍實彈地全心投入。

Google副總裁暨搜尋負責人雷德(Liz Reid)認為,時代轉變之下,Google提供的價值已經從組織資訊,轉變為提供智慧,靠著底層模型的先進推理能力,深化搜尋的強度與深度,AI模式不只是排序、整理,更要重新編排,帶來更多洞見,回答使用者的複雜問題。

使用者運用AI模式時,AI會將使用者提出的問題分解成許多細項,再逐一尋找每個子題的內容,最後彙整成完整回答,如此一來,便不會局限在包含大量資訊、但未必能夠解決問題的網頁上。

皮蔡提到,AI模式早期測試者的查詢長度是傳統搜尋的兩到三倍,且可以深入對話、持續提出新問題,視覺查詢的數量更是年增超過65%。

AI模式之所以能夠運作,背後就是靠著Gemini 2.5系列模型,帶來推理與多模態理解能力。除了回應複雜提問,Google也預告深入研究功能,執行數百筆查詢並跨資訊來源整合,快速生成專家級、具引用來源的報告,節省大量研究時間。

另外,Google也結合過往就有的視覺查詢,以及智慧助理Gemini Live的即時問答功能,推出即時視覺搜尋(Search Live),使用者開啟相機以後,透過Lens或者AI模式的「Live」功能,便可一邊拍攝、一邊搜尋互動提問,獲得即時理解與建議。

從Google分享的指標來看,使用者提問的深度與複雜度正在提升。

儘管AI可能推升搜尋成本、削弱始用者點擊廣告誘因,但AI帶來的新資訊獲取方式,也在填滿過去搜尋引擎難以承接的新需求。究竟是AI能夠推升更多使用量,還是AI搜尋會提前讓人看到營收減損?未來就看兩者能否取得平衡,讓Google的營收與利潤金雞母繼續生長。

購物加上AI能提問、試穿,還能提醒結帳

除了在搜尋場景中導入AI模式,Google也進一步將AI應用擴展至更具商業潛力的購物場域。

Google廣告與商務副總裁胥黎法珊(Vidhya Srinivasan)表示,平常Google上就有大量帶有購物意圖的行為,因為Google維護包含產品價格、顏色、供應情況等海量商品資料,將其整理成購物圖譜(shopping graph),每小時更新超過20億次。

因此,Google將Gemini模型與購物圖譜結合,推出全新的AI購物模式。當使用者搜尋商品時,系統除了提供常規結果外,也能進一步解析語句背後的需求與情境,主動引導使用者提問與探索。例如,若搜尋內容中提到即將前往某地旅遊,AI將考量當地天氣、氣溫等條件,推薦適合的商品。

不過,為何在眾多類型問題中,優先鎖定購物?針對《遠見》記者提問,Google副總裁暨搜尋負責人雷德指出,關鍵在於購物問題很適合用AI解答。「你會問一些複雜問題、有很多限制條件,有些過濾式的結構化資料,⋯⋯真正適合用對話來體驗。」

因爲挑選商品時,要對應使用者的購物意圖,剛好可以利用篩選、排序等功能,「人們實際上真的會從AI支援的體驗中受益匪淺。所以這是真正深入研究的案例之一。」

這樣的互動式搜尋體驗,也延伸至後續購物流程。Google另外推出AI試衣功能,只要點擊「試穿」按鈕並上傳自拍照,生成式模型便可渲染指定服飾穿在使用者身上,讓購衣者能夠眼見為憑。

從靈感探索、產品比對到模擬試穿,AI模式重塑使用者的購物決策歷程。在最後的結帳階段,Google也導入價格追蹤功能,當商品價格下跌時,AI Agent會即時發出通知,協助使用者在最適合時機完成交易。

Google進一步將AI應用擴展至更具商業潛力的購物場域。取自Google台灣官方部落格

Google進一步將AI應用擴展至更具商業潛力的購物場域。取自Google台灣官方部落格

Gemini助理加強,即時看螢幕、說話就互動

去年(2024)的年會上,Google誓言打造更通用且日常的AI助理,當時展示能夠看懂周遭環境、即時和使用者互動的實驗性專案Project Astra

今年的年會上,Google讓研究落地成為產品,將Gemini Live開放給所有使用者,讓Gemini在文字對話以外,把感官延伸到能夠閱讀使用者的螢幕,還能用相機鏡頭向外看到更多,並且以距離消費者最近的聲音媒介互動

想要走進生活,除了感知能力增強、互動更加方便以外,還需要能夠和使用者的日常產生連結。Google實驗室暨Gemini副總裁伍德沃德(Josh Woodward)表示,Gemini Live將開始整合地圖、日曆等Google生態系內的應用程式,讓助理掌握更多,能做的事情也更多。

伍德沃德也預告,Gemini即將整合至Google Chrome瀏覽器,初期可針對當前頁面摘要、解釋,未來將支援多分頁協作與自動導航,讓互動變得簡單,也更貼近生活。

皮蔡另外分享,Gemini將整合AI Agent能力,推出Agent模式(agent mode),發揮Agent所具有的能力,包含瀏覽網路、深度研究等能力,接收使用者所下指令後,自行規劃出詳細步驟,藉此處理更複雜的問題。

在生活助理面向以外,Gemini也保有其生產力工具的能力,例如使用深度研究(deep research)功能時,可以不只考慮外部資料,也讓使用者上傳個人檔案,整合兩者以後,提出的報告內容能夠更加完整。

此外,Google先前在Gemini推出方便使用者編輯的Canvas功能,提供一鍵轉換成網頁、資訊圖表與語音等多種形式,讓寫作變得更加容易,開發者也可以更好開發出產品原型。

對專業創作者來說,Google則推出以文生圖的新一代模型Imagen 4、生成影片的Veo 3,前者生成的圖像更加真實,且也可放上文字;後者則不只生成動態場景,同時直接加上聲音,不用再另外後製。

從文字、圖像到影音生成,再從深度研究到與使用者自然互動,Gemini不再只是對話機器人,而是朝向全方位AI助理邁進。Google明確宣示野心,要讓Gemini成為個人化、主動且強大的AI助理,佔據使用者的每個生活場景。

Gemini推出眾多更新。取自Google台灣官方部落格

Gemini推出眾多更新。取自Google台灣官方部落格

結語:智慧、代理以及個人化,打好產品+AI地基

本次Google I/O的更新裡,和過往一樣橫跨Google旗下不同事業群,在不同產品裡加入更多AI功能。背後共享的軸線,是皮蔡強調的三件大事:智慧(intelligence)、代理(agent)和個人化(personlization)。

智慧,來自於基礎模型的進步。不管是Gemini 2.5 Pro增強推理能力,還是Gemini 2.5 Flash回覆更加快速,前者讓開發者能夠更有效率打造出網頁和產品,後者則讓面對消費者時能夠更加自然。

代理,是讓智慧能夠為人所用。AI Agent需要記憶、規劃和感知,還要能夠調用工具,Google針對每種能力都投入研究團隊各個擊破。Project Astra是增加感知能力,Project Marine則讓Agent更有辦法做到多模態理解和推理,再加上基礎模型更強的智慧和記憶力,代理上線以後,便能替使用者解決更多問題。

個人化,則是具備終端產品者的獨門武器。去年皮蔡提到,Google要把AI加到所有產品裡,讓產品更為強大;今年皮蔡則是強調,將回過頭來利用這些接觸使用者的通路,進一步改善使用者體驗。「在你的允許下,Gemini模型可以使用來自你所有Google應用程式的相關上下文,這種方式是私密的、透明的,並且完全由你控制。」

智慧、代理、個人化,三者互相加乘,替Google各項產品更新打好地基,也迎接AI競爭新局。

*吳季柔對本文亦有貢獻

更多精采報導,歡迎加入《遠見》 Line官方帳號!

查看原始文章

更多理財相關文章

01

一張表看懂!2026信用卡權益戰開打 點數生態圈各自為王、飛行卡市場大洗牌

anue鉅亨網
02

經濟部發錢了 領取資格一次看

三立新聞網
03

金價引爆「下車潮」!今年暴漲近7成創46年紀錄 貴金屬高檔震盪

ETtoday新聞雲
04

5人到千人工廠都在拚!一條法規讓台灣之光好日子到頭,台灣紡織誰能戰勝?

商業周刊
05

震撼半導體界!輝達傳豪砸6300億買新創公司 黃仁勳回應了

風傳媒
06

震撼半導體界!輝達砸6300億買下Groq資產與人才 陸行之揭「不能說併購」幕後原因

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...