請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

【Google 第 8 代 TPU 來了】訓練與推論分流、效能比上代快 3 倍,支撐為 AI 代理而生的技術堆疊

TechOrange 科技報橘

更新於 04月23日10:17 • 發布於 04月22日14:51 • 廖紹伶

在 Google Cloud Next 2026 大會即將於拉斯維加斯登場、預計吸引逾 3.5 萬名與會者之際,Google Cloud 執行長 Thomas Kurian 於會前媒體簡報中公布一系列新產品與功能,點出這次大會的核心:AI 模型的演進,正在根本性地改變人們使用 AI 的方式。

過去,模型主要用來回答問題或生成內容;如今,模型正轉向能夠自主使用工具、具備多項技能,並能代替使用者執行多步驟複雜任務的「AI 代理(Agents)」。Kurian 將這個轉變稱為「向代理轉移」,而 Google 在本屆大會發布的所有新功能,正是其過去一年多為因應這場轉移所打造的全端技術堆疊成果。

運算基石大進化:第 8 代 TPU 雙晶片登場

要驅動 AI 代理所需的龐大任務生態系,一切從基礎設施開始。Google 推出兩款針對不同用途設計的第八代 TPU。

TPU 8t 專注於訓練任務,採用晶片互連(ICI)技術,單一 superpod 可擴展至 9,600 個 TPU,並搭配 2 PB 的高頻寬共享記憶體。其整體運算效能是上一代 TPU Ironwood 的 3 倍,每瓦效能最高可提升 2 倍。

TPU 8t。圖片來源:Google Cloud。

TPU 8i 則專注於推論任務。Google 採用名為「boardfly」的全新架構,將大量 TPU 晶片交叉連接,搭載更多 SRAM 以容納更大的分散式快取,並導入全新的集合加速引擎(collective acceleration engine),使 TPU 8i 成為以推論為核心的應用程式的專屬平台。Google 聲稱,與上代 Ironwood 相比,TPU 8i 的每美元推理效能提升了 80%。

TPU 8i。圖片來源:Google Cloud。

除 TPU 之外,Google 也更新 GPU 產品組合,推出 NVIDIA VR200 系統;針對 AI 代理在傳統運算架構上的任務執行需求,推出搭載 ARM 處理器優化的全新 Axion 虛擬機器(N4A);在儲存端,部署最高每秒 15 Tbps 吞吐量的 Rapid 超低延遲儲存技術,以及擴充至每秒 10 Tbps 的託管 Lustre 儲存服務。

網路方面,Google 推出的新功能 Virgo 網路。這是新開發的專用 AI 優化網路,可將 NVIDIA Vera Rubin NVL72 系統或 TPU 8t 超級處理器連接成擁有數十萬個加速器的大型超級電腦,從而極大地增強了世界上最強大的前沿模型的分佈式訓練。

資料成為 AI 的記憶體:建立跨雲系統的語意脈絡

算力之外,讓模型能夠理解並存取企業資料,是 AI 代理能否真正發揮作用的另一關鍵。Google 在資料雲領域推出一系列新功能,核心目標是從企業所有系統中獲取資料、建立上下文,以餵給模型。

首項重點發布是「跨雲湖倉(Cross-cloud Lakehouse)」。這項功能允許企業將分析運算保留在單一雲端中,同時連接至其他雲端上的資料,無需跨雲複製任何資料即可完成分析,實現所謂的「零複製(zero copy)」。跨雲湖倉採用優化的 Iceberg 格式,支援連接 Amazon、Azure、Google 雲端儲存,以及任何支援 Iceberg 的資料庫與 Salesforce、SAP 等 SaaS 應用程式。

第二項是「知識目錄(Knowledge Catalog)」。Google 使用 Gemini 從結構化與非結構化來源中提取資料,將其連接成一個知識圖譜,供 AI 模型用於推論並理解企業資訊的語意上下文。

實現多重代理協作:Gemini 企業代理平台

在應用層,Google 推出 Gemini 企業代理平台(Gemini Enterprise Agent Platform),提供構建、編排、治理及優化代理的完整能力。平台底層將所有 Google Cloud Platform 服務(包含 Kubernetes Engine、Compute、BigQuery、Alloy DB 等)以及 Workspace 內的所有服務,全數以 MCP 工具形式對外開放,供任何代理連接使用。

平台提供低程式碼代理建構器,支援單一或多代理編排,並內建治理、安全、身分識別、日誌記錄與可觀測性等功能。企業可透過即時、排程或觸發條件等多種方式啟動代理,並透過代理市集(Marketplace)發現與部署第三方代理。

安全防護同步升級,威脅情資準確率達 98%

隨著 AI 系統能力增強,資安威脅也隨之升級。Google 在安全領域同步推出多項新功能,涵蓋偵測、預防與回應三個層次。

在威脅情資方面,Google 推出可收集包含暗網在內的威脅資訊的功能,結合 Mandiant 的研究專長進行優先級排序,並建立由 Gemini 驅動的威脅情資代理,據稱準確率達 98%。

在持續測試方面,Google 透過旗下 Wiz 產品推出三款 Gemini 驅動的新代理:「紅代理」持續對基礎設施進行紅隊演練以尋找漏洞;「藍代理」接收紅隊發現的問題,協助釐清危害成因並排定處理優先順序;「綠代理」則負責解決已識別的問題,實現對企業環境的持續測試與持續修復。

針對擁有安全營運中心(SOC)的企業,Google 也推出用於分類調查、威脅狩獵與偵測工程的 Gemini 代理,以及能同時偵測並修復程式碼問題的新模型。

Thomas Kurian 在簡報中強調,Google 是目前唯一一家在整個 AI 技術堆疊中提供第一方解決方案的供應商。從算力、資料到平台,這次 Cloud Next 2026 的系列發布,不只是單點功能的疊加,而是 Google 為 AI 代理時代重新設計的全面佈局。

【推薦閱讀】

Google 傳找 Marvell 開發推論晶片:TPU 供應鏈重組,Broadcom 不再是唯一核心

Google TPU 為什麼贏不了 NVIDIA?陳良基:真正差距在對台灣供應鏈的掌握度

Google TPU 與 AWS Trainium 夾擊下,黃仁勳親解 NVIDIA 真正護城河

*首圖來源:Google Cloud。

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

快訊/強到被盯上!00403A爆出5%「高額溢價」 金管會要求檢討

三立新聞網
02

下市消息重擊!森崴能源跳空跌停 逾2.2萬張求售無門 正崴集團倒地

工商時報
03

一頓豆漿早餐,改寫台灣命運:「工研院之父」如何種下半導體王國的第一顆種子?

經理人月刊
04

散戶瘋搶00403A慘當盤子?阮慕驊揭虧損真相:這群人躺賺5%

風傳媒
05

快訊/散戶炸鍋!這檔壁紙人道走廊限時開放 「每隔30分」才給逃

三立新聞網
06

〈焦點股〉森崴難逃下市 跌停委賣近4萬張搶逃生 集團股全數一字鎖跌停

anue鉅亨網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...