近期市場關注NVIDIA GB200整櫃式方案(rack)各項供應進度,TrendForce於最新調查指出,由於GB200 Rack在高速互通介面、熱設計功耗(TDP)等設計規格皆明顯高於市場主流,供應鏈業者需要更多時間持續調校、優化,預期最快將於2025年第二季後才有機會放量。
NVIDIA GB Rack方案(包括GB200、GB300等)因導入技術層次更複雜、高成本等特性,主力客群將為大型CSP,其餘包含Tier-2資料中心、國家主權雲,以及學研單位等HPC/AI應用專案。在NVIDIA大力推動下,預期GB200 NVL72機櫃將於2025年成為主要採用方案,占比可望接近80%。
TrendForce表示,為提升AI/HPC server系統整體運算效能,NVIDIA開發NVLink提供GPU晶片之間的高速互連技術,如GB200採用第五代NVLink,總頻寬大幅優於目前市場主流PCIe 5.0。此外,2024年主導市場的HGX AI server每櫃TDP動輒達60 KW至80 KW,而GB200 NVL72每櫃則達到140 KW,TDP再度提升一倍,為此業者嘗試擴大採用液冷散熱解決方案。
由於GB200 Rack系統採用更高設計規格,市場頻傳可能因部分零組件未達要求,有遞延出貨風險。根據TrendForce調查,目前Blackwell GPU晶片出貨情形大致如原先預期,2024年第四季僅少量出貨,2025年第一季後逐季放量。在AI Server系統方面,因尚待供應鏈各環節持續調整,至今年底的出貨量恐低於業者預期,據此,2025年GB200整機櫃的出貨高峰將略為延後。
傳統氣冷散熱解決方案已無法應對GB200 NVL72的TDP值,液冷技術成為其必須。隨著GB200 Rack方案於2024年底開始小量出貨,相關業者也加大液冷散熱零組件研發能量,如冷卻分配系統(CDU)供應商正透過擴大機櫃尺寸,和採用更高效的冷卻板(Cold Plate)提高散熱效能。TrendForce表示,目前Sidecar CDU的散熱能力主要集中於60KW至80 KW,未來可望達成雙倍、甚至逾三倍的散熱表現。至於更高效的液對液(L2L)型in-row CDU方案,散熱能力已能超過1.3MW,未來也將繼續提升以因應算力增長。
留言 0