日前外媒報導,輝達新一代 Blackwell 架構 AI 晶片在高容量的機架伺服器中存在嚴重的過熱問題。而這些問題導致輝達的設計調整與計畫延期,使 Google、 Meta 和微軟等主要客戶對能否按計畫部署搭載 Blackwell 架構 AI 晶片的伺服器感到擔憂。對此,全球伺服器大廠戴爾(Michael Dell)在社交媒體 X 上貼文指出,第一台輝達 GB200 NVL72 伺服器現已正式出貨,似乎直接反駁 Blackwell 架構 AI 晶片過熱的說法,表示當前出貨正常。
外媒 The Information 引用知情人士說法,Blackwell 架構 AI 晶片專為 AI 和高性能計算(HPC)所設計,但 72 個處理器伺服器出現過熱問題,此類伺服器每個機架功耗最高可達 120 KW。過熱問題迫使輝達多次修改機架設計,不僅限制晶片性能,還可能損壞硬體。客戶因此擔心,這些問題會延後資料中心的伺服器部署時程。
由於 The Information 的報導被多家國際媒體引用,也造成市場上緊張的情況,使得相關類股股價受到影響。因此,身為伺服器大廠的戴爾就在媒體 X 上貼文,就是旗下最新伺服器照片,並強調「全球第一台輝達 GB200 NVL72 伺服器現已正式出貨」的情況,也間接駁斥 GB200 因過熱而導致出貨再次延宕的消息。
另外,根據市場消息指出,在輝達 GB200 主要代工廠鴻海與廣達的部分,鴻海內部也指出其出貨時程正常的情況,沒有因晶片過熱而有出貨延宕狀況。至於,廣達方面也指出,根據先前法說會的說法,GB200 系列伺服器將在年底前小量出貨,並於 2025 年第一季放量,時間沒有改變。
甚至,鴻海方面也宣布,鴻海將與輝達攜手,打造下世代 AI 工廠(AI Factory),運用 Omniverse 平台,以數位孿生 (Digital Twins) 技術重塑製造業的未來。雙方不僅革新製造流程和供應鏈管理,更為全球先進設備部署和提升企業韌性開闢了新途徑。這顯示了相關伺服器的出貨沒有受到外傳過熱因素的影響,鴻海將依照計畫在相關應用上進行進一步的部署。
市場另有消息指出,輝達新一代 Blackwell 架構 AI 晶片過熱的消息出現在 20 日輝達新一季財報公布之前,這不禁讓人聯想,懷疑市場有人藉此利空消息打壓股價、進一步低接的意圖。而根據美系外資的最新消息,重申 B200 出貨沒有任何延遲,因為經過深入通路訪查,計算晶片在第四季出貨是 300k,2025 年第一季上升至 800k。另外,H 系列第四季 1.5m,2025 年第一季降至 1m。其中,因 H200 上市,H100 降價兩成多,但整體 H 系列需求仍屬健康,GB200 NVL72 機架伺服器 2025 年維持 35k 不變。
(首圖來源:科技新報攝)