Google 傳找 Marvell 開發推論晶片:TPU 供應鏈重組,Broadcom 不再是唯一核心
《The Information》報導,知情人士透露 Google 正與 Marvell 洽談開發兩款新 AI 晶片:一款是可與現有 TPU 搭配運作,且能根據運算與記憶體需求分擔 AI 工作負載的記憶體處理晶片(MPU),Google 預計初步生產近 200 萬顆,計畫最快在明年完成設計並進入測試生產階段;另一款則是專為推論(inference)設計的新 TPU。
雖然目前雙方尚未正式簽署合約,但已明確凸顯 Google 基礎設施布局的核心方向,正從單純擴張訓練算力,轉向推論效率的優化。這項轉變也與 Google 的商業策略擴張有關:Google 自去年起開始將 TPU 出租給如 Anthropic、Meta 和 Apple 等非 Google 資料中心的客戶,直接挑戰 NVIDIA 在 AI 晶片領域的霸權。
推論需求爆發,Google 加快晶片布局
Google 近期才剛發表第七代 TPU「Ironwood」,峰值效能不僅是前一代的 10 倍,更被官方明確定位為「推論時代的 Google TPU」。事實上,Google 原本就規劃開發新的推論晶片,特別是在今年 3 月 NVIDIA 於 GTC 大會推出針對推論效率優化、採用 Groq 授權技術的新晶片(LPU)後,Google 更進一步加快研發腳步,反映出自主代理(autonomous agents)這一類複雜商業 AI 產品的興起,正讓推論算力需求快速飆升。
推論不同於一次需要花費數週或數月的大型模型訓練,而是必須不間斷地處理每一位用戶的每一次查詢。當 AI 產品規模擴大到數億用戶後,推論成本會隨需求等比例成長並成為主要支出,這也讓客製化推論晶片在成本與效率上的優勢,成為通用 GPU 無法取代的關鍵。
未來 Marvell 設計的晶片將用於補強 Ironwood,以針對不同的工作負載與成本區間提供支援,並藉由針對不同任務使用不同類型的推論晶片,成為大幅提升效率、降低成本的核心。
Marvell 為什麼成為 Google TPU 計畫的新變數?
這次,Google 找上 Marvell 並非偶然,因為雙方的信任已建立在過去深厚的合作基礎上。例如,Google 過去已經向 Marvell 採購過用於管理資料中心內伺服器記憶體共享的 CXL 控制器晶片,且雙方在 Axion ARM CPU 上也早有合作。更關鍵的是,Marvell 正是 Groq 第一代 LPU 的晶片設計夥伴,這讓其早已具備 Google 迫切需要的推論晶片設計經驗。
除此之外,Marvell 也展現強大的客製化晶片版圖,其客製化矽晶片業務正快速成長,目前年化收入運行率高達 15 億美元,並在全球雲端供應商中拿下了 18 個晶片設計案,其中包含 Amazon、Microsoft 以及 Meta 等大廠。
最後,在生態系與技術投資的加持下,NVIDIA 於今年 3 月底向 Marvell 投資了 20 億美元進行技術整合,且 Marvell 也在去年底斥資高達 55 億美元收購矽光子技術公司 Celestial AI。Marvell 執行長 Matt Murphy 藉此強調,他們擁有「業界最完整的 AI 與雲端客戶連接平台」,並預期在 2027 財年實現約 30% 的營收年成長、挑戰拿下客製化 AI 晶片市場 20% 的市占率,這些線索皆充分顯示 Marvell 已經站穩大型雲端業者 ASIC 供應鏈的核心位置。
TPU 供應鏈重組:從單一走向多元
這次洽談也進一步揭露 Google 對於整體晶片供應鏈的長遠戰略轉變。早在 2023 年,Google 就曾因主要設計夥伴 Broadcom 對每顆生產出的 TPU 都要收取一筆費用,導致成本隨需求攀升,因此試圖尋求替代方案以省下數十億美元。
然而,Google 本月剛與 Broadcom 簽下延續至 2031 年的 TPU 與網通元件合作協議,這代表 Google 放棄「完全剔除」Broadcom 的想法,轉而建立一個多元化而非替代的多供應商架構。
目前 Google 的晶片策略包含四個主要合作夥伴與其內部設計團隊:Broadcom 負責高效能晶片、MediaTek 負責成本可降低 20% 至 30% 的「e」系列優化版本、Marvell 有望負責推論與記憶體晶片,最後統一交由 TSMC 製造。這種策略有如車廠管理零組件供應商的模式,讓不同夥伴在不同產品線競爭,從而不讓單一供應商掌握過大的議價話語權。
Google 與 Marvell 的洽談,反映 Google 正圍繞著「推論」這項未來最大宗的 AI 支出,重新調整其 TPU 的設計與供應鏈布局。對 Marvell 而言,若合約順利成形,將站穩其作為全球第二大客製 AI 晶片設計商的地位;對 Google 來說,在客製化 AI 晶片市場預計於 2033 年達到 1,180 億美元規模的龐大商機前,建立一個不依賴單一供應商的強韌供應鏈,將是支撐未來龐大 AI 運算需求的關鍵解方。
*本文開放合作夥伴轉載,參考資料:《The Information》、《The Next Web》,圖片來源:Unsplash