【Google 第 8 代 TPU 來了】訓練與推論分流、效能比上代快 3 倍,支撐為 AI 代理而生的技術堆疊
在 Google Cloud Next 2026 大會即將於拉斯維加斯登場、預計吸引逾 3.5 萬名與會者之際,Google Cloud 執行長 Thomas Kurian 於會前媒體簡報中公布一系列新產品與功能,點出這次大會的核心:AI 模型的演進,正在根本性地改變人們使用 AI 的方式。
過去,模型主要用來回答問題或生成內容;如今,模型正轉向能夠自主使用工具、具備多項技能,並能代替使用者執行多步驟複雜任務的「AI 代理(Agents)」。Kurian 將這個轉變稱為「向代理轉移」,而 Google 在本屆大會發布的所有新功能,正是其過去一年多為因應這場轉移所打造的全端技術堆疊成果。
運算基石大進化:第 8 代 TPU 雙晶片登場
要驅動 AI 代理所需的龐大任務生態系,一切從基礎設施開始。Google 推出兩款針對不同用途設計的第八代 TPU。
TPU 8t 專注於訓練任務,採用晶片互連(ICI)技術,單一 superpod 可擴展至 9,600 個 TPU,並搭配 2 PB 的高頻寬共享記憶體。其整體運算效能是上一代 TPU Ironwood 的 3 倍,每瓦效能最高可提升 2 倍。
TPU 8i 則專注於推論任務。Google 採用名為「boardfly」的全新架構,將大量 TPU 晶片交叉連接,搭載更多 SRAM 以容納更大的分散式快取,並導入全新的集合加速引擎(collective acceleration engine),使 TPU 8i 成為以推論為核心的應用程式的專屬平台。Google 聲稱,與上代 Ironwood 相比,TPU 8i 的每美元推理效能提升了 80%。
除 TPU 之外,Google 也更新 GPU 產品組合,推出 NVIDIA VR200 系統;針對 AI 代理在傳統運算架構上的任務執行需求,推出搭載 ARM 處理器優化的全新 Axion 虛擬機器(N4A);在儲存端,部署最高每秒 15 Tbps 吞吐量的 Rapid 超低延遲儲存技術,以及擴充至每秒 10 Tbps 的託管 Lustre 儲存服務。
網路方面,Google 推出的新功能 Virgo 網路。這是新開發的專用 AI 優化網路,可將 NVIDIA Vera Rubin NVL72 系統或 TPU 8t 超級處理器連接成擁有數十萬個加速器的大型超級電腦,從而極大地增強了世界上最強大的前沿模型的分佈式訓練。
資料成為 AI 的記憶體:建立跨雲系統的語意脈絡
算力之外,讓模型能夠理解並存取企業資料,是 AI 代理能否真正發揮作用的另一關鍵。Google 在資料雲領域推出一系列新功能,核心目標是從企業所有系統中獲取資料、建立上下文,以餵給模型。
首項重點發布是「跨雲湖倉(Cross-cloud Lakehouse)」。這項功能允許企業將分析運算保留在單一雲端中,同時連接至其他雲端上的資料,無需跨雲複製任何資料即可完成分析,實現所謂的「零複製(zero copy)」。跨雲湖倉採用優化的 Iceberg 格式,支援連接 Amazon、Azure、Google 雲端儲存,以及任何支援 Iceberg 的資料庫與 Salesforce、SAP 等 SaaS 應用程式。
第二項是「知識目錄(Knowledge Catalog)」。Google 使用 Gemini 從結構化與非結構化來源中提取資料,將其連接成一個知識圖譜,供 AI 模型用於推論並理解企業資訊的語意上下文。
實現多重代理協作:Gemini 企業代理平台
在應用層,Google 推出 Gemini 企業代理平台(Gemini Enterprise Agent Platform),提供構建、編排、治理及優化代理的完整能力。平台底層將所有 Google Cloud Platform 服務(包含 Kubernetes Engine、Compute、BigQuery、Alloy DB 等)以及 Workspace 內的所有服務,全數以 MCP 工具形式對外開放,供任何代理連接使用。
平台提供低程式碼代理建構器,支援單一或多代理編排,並內建治理、安全、身分識別、日誌記錄與可觀測性等功能。企業可透過即時、排程或觸發條件等多種方式啟動代理,並透過代理市集(Marketplace)發現與部署第三方代理。
安全防護同步升級,威脅情資準確率達 98%
隨著 AI 系統能力增強,資安威脅也隨之升級。Google 在安全領域同步推出多項新功能,涵蓋偵測、預防與回應三個層次。
在威脅情資方面,Google 推出可收集包含暗網在內的威脅資訊的功能,結合 Mandiant 的研究專長進行優先級排序,並建立由 Gemini 驅動的威脅情資代理,據稱準確率達 98%。
在持續測試方面,Google 透過旗下 Wiz 產品推出三款 Gemini 驅動的新代理:「紅代理」持續對基礎設施進行紅隊演練以尋找漏洞;「藍代理」接收紅隊發現的問題,協助釐清危害成因並排定處理優先順序;「綠代理」則負責解決已識別的問題,實現對企業環境的持續測試與持續修復。
針對擁有安全營運中心(SOC)的企業,Google 也推出用於分類調查、威脅狩獵與偵測工程的 Gemini 代理,以及能同時偵測並修復程式碼問題的新模型。
Thomas Kurian 在簡報中強調,Google 是目前唯一一家在整個 AI 技術堆疊中提供第一方解決方案的供應商。從算力、資料到平台,這次 Cloud Next 2026 的系列發布,不只是單點功能的疊加,而是 Google 為 AI 代理時代重新設計的全面佈局。
【推薦閱讀】
◆ Google 傳找 Marvell 開發推論晶片:TPU 供應鏈重組,Broadcom 不再是唯一核心
*首圖來源:Google Cloud。