大摩最新報告觀察到 AI GPU 租賃服務盛行,幫助企業快速導入 AI 營運,目前主流是 H100,再來有 Gaudi2 及 MI300X,其中最近有觀察到 Gaudi 有在加單,反應在 CoWoS-S 增 3~4K 晶圓,因此點名點名世芯、技嘉、緯創、聯想、台達電將受惠運算外包。
大摩表示,AI 運算租賃業務模式日趨成熟,AI GPU 產品種類繁多,NVIDIA GTC 大會為台灣下游供應鏈創造新的機會,首先 GPU 租賃業務模式協助企業快速建置 AI 工作負載,目前以 NVIDIA H100 為主流解決方案,而英特爾的 Habana Guadi 2 和 AMD 的 MI300X 同樣可供出租。
大摩指出,大型企業今年正在增加其 AI 資本支出組合,但微軟除外,因為微軟在 2023 年已經投入大量資金,同時觀察到台積電 InFO-LSI 產能的需求顯著增長,該產能主要用在蘋果的 M2 Ultra,而 5 奈米 M2 Ultra 或未來 3 奈米 M3 Ultra 的需求,可能來自蘋果的內部 AI 伺服器。
大摩認為,英特爾 Habana 正在獲得更多 CoWoS 分配,預計除 2024 年原定的 10k 外,為英特爾的 Habana 額外供應 3~4k 的 CoWoS-S 晶圓,預計將產生 4 萬顆 Gaudi3 晶片,有助於世芯在 2025 年的 IC 設計服務營收成長。
AI 下游供應鏈方面,大摩表示,這次 GTC 主題演講中,輝達重點介紹緯創如何利用 Omniverse Cloud 構建其新 DGX/HGX 工廠的數位孿生平台,並展示技嘉配備 H100 8-GPU 設計的機架解決方案,還將有基於採用 HGX、超級晶片和 PCIe 卡外形尺寸的 Blackwell GPU。
IDC 預測 2026 年 AI PC 滲透率將達到 50~60%,但聯想認為有更大的潛力,看好 AI PC 的 ASP(平均銷售價格)起價將至少為 1,000 美元,接著在 2~3 個季度後降至 800 美元,因為 AI PC 在 2026 年之前不會擴散到 400~500 美元的細分市場。
大摩分享,台達電共享 GB200 功率,從 1,700W 翻倍至 3,300W,推升 GB200 伺服器的每台交流伺服器電源成本增加至 7,200 美元,而 H100 的成本為 2,400 美元,至於 AI GPU 機架需要 250KW,而 CPU 機架則需要 30KW。
大摩強調,GPU 軍備競賽最大的擔憂是大型企業或雲端供應商如何利用這種龐大的運算能力,但發現不同的 AI 新創,如 CoreWeave 已開始進行 GPU 租賃業務,以協助企業擁有 GPU 以加速工作負載,目前看到 NVIDIA H100 是不同供應商的主流租賃解決方案。
(首圖來源:NVIDIA Blackwell)
留言 0