請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

【AI】TPU 時代來了?Google 對輝達 GPU 的反擊

財經M平方短評

更新於 2025年11月25日15:42 • 發布於 2025年11月25日15:42

重點整理

上週 Gemini 3 Pro 橫空出世、模型能力 霸榜 (雖然不到 1 週又被 Anthropic Opus 4.5 超過),但因為官方號稱是完全使用張量處理器(TPU)進行訓練,甚至開始有消息說 Meta 也在洽購 TPU,Google 先前也跟 Anthropic 簽訂合約,供應最多 100 萬顆 TPU 晶片。這被視為是 Google 雲端業務在未來 10 年最大的競爭優勢,也可能影響輝達壟斷 GPU 市場版圖的轉捩點。

MM 研究員

雖 GPU/ASIC 競爭並不是零和遊戲,且這次 Gemini 3 Pro 的成功也代表Scaling Law 仍然有效,但還是值得關注一下兩者之間的競爭。以下是透過 AI 整理 TPU vs GPU 的科普入門:

TPU 的起源

  • 核心目的: TPU 的誕生不是為了賣給遊戲玩家(相較於 GPU),而是為了即解決 Google 龐大的內部運算成本問題。早在 2016 年公開前,TPU 就已默默支撐 Google Maps 、 Photos 和翻譯功能。
  • 危機意識: 2013 年,Google 高層(Jeff Dean 等人)計算發現,如果每位 Android 用戶每天僅使用 3 分鐘的語音搜索,Google 就需要將全球資料中心算力翻倍。
  • 效率瓶頸: 當時依賴的 CPU 和 GPU 對於深度學習所需的「矩陣乘法」來說效率太低,而擴充現有硬體在財務和物流上都是場災難。因此 Google 才決定自研晶片(ASIC),專門用於跑 TensorFlow 神經網絡。

TPU vs GPU 的技術差異

  • GPU (通用型): 設計初衷是圖形處理。雖然並行運算能力強,但為了處理各種通用任務(如遊戲貼圖、分支預測),硬體上有很多「包袱」,消耗了額外的能量與晶片面積。

  • TPU (專用型): 移除了所有圖形處理的硬體,採用獨特的「脈動陣列(Systolic Array)」架構。優勢在於數據讀取一次後,直接在大量運算單元間傳遞,無需頻繁寫回記憶體。這解決了傳統晶片的「馮紐曼 / 記憶體瓶頸(Von Neumann bottleneck)」。

  • 最新一代 (TPU v7 / Ironwood):

  • 增強了 SparseCore(針對推薦系統與 LLM)。

    • 大幅提升記憶體頻寬與容量(單晶片 192GB HBM,與 Nvidia Blackwell B200 相當)。
    • 使用光路交換器(OCS)連接集群,比 Nvidia 的 InfiniBand 更省電、更便宜,但靈活性較低。

效能與成本數據

雖然 Google 官方數據保密,但根據前員工與行業專家的訪談:

  • 性價比: 根據內部人員訪談,在特定應用下,TPU 的性價比可比 GPU 高出 1.4 倍。

  • 能源效率: TPU 更省電,產生的熱量更少。最新 v7 的每瓦效能據稱比上一代 v6e 提升 100% 。

  • 實際案例:

  • 有客戶表示,使用 TPU v5e Pod 的成本遠低於 8 張 Nvidia H100 。

    • Google 會讓舊款 TPU 變得極其便宜(甚至形容為「幾乎免費」),適合不急迫的訓練任務,成本可降至 1/5 。
  • 競爭態勢: SemiAnalysis 評論認為 Google 的 TPU v7 在性能上足以與 Nvidia 的 Blackwell 匹敵。

TPU 普及化的障礙

儘管 TPU 效能強大,但外部採用率仍不如 Nvidia GPU,重點原因包括:

  • 生態系壁壘: Nvidia 的 CUDA 是行業標準,工程師在學校就學這個。 TPU 依賴 JAX 和 TensorFlow(雖現已支援 PyTorch,但在開發者習慣上仍有落後)。
  • 多雲策略與鎖定風險: 企業通常使用多個雲端(AWS 、 Azure 、 GCP)。 Nvidia GPU 在所有雲端都可用,代碼可無痛轉移;但若針對 TPU 優化代碼,就會被 GCP 鎖定,客戶擔心未來議價能力喪失

Google 的護城河

  • 利潤保衛戰: 雲端運算正從高毛利(50-70%)轉向低毛利,因為 Nvidia 拿走了 AI 硬體約 75% 的毛利。

  • 自研晶片的優勢: 擁有成熟 ASIC(如 TPU)的雲端供應商,能擺脫 Nvidia 的定價控制,重回 50% 的毛利水準。

  • Google 的領先地位

  • Google 是目前唯一擁有「能與 Nvidia 頂級晶片匹敵」且「大規模量產」 ASIC 的公司。

    • Google 掌控了前端設計(RTL),Broadcom 僅負責後端實體設計,這讓 Google 保留了更多利潤。
    • Gemini 3 模型完全在 TPU 上訓練,證明了其不僅能做推論,也能處理最頂級的訓練任務。

更多 AI 相關圖組,可參考 產業決策平台 - AI 專區

推薦閱讀

加入〈財經M平方〉官方Line,掌握最新行情!

更多理財相關文章

01

台股2025年寫6項歷史新高 拚擠進全球市值第6大股市

中央通訊社
02

快訊/慟!中經院副院長「產業軍師」王健全過世…享壽67歲

三立新聞網
03

「產業軍師」中經院副院長王健全辭世 享年67歲

自由電子報
04

科技圈大逃亡?5兆男面對「2000億稅金」!黃仁勳竟煩惱這事:隨便課

三立新聞網
05

184萬股東被錢香醒!台積電今發配息5元

NOWNEWS今日新聞
06

悼!中經院副院長王健全辭世 曾發願退休成立基金會助青年脫低薪、購屋

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...