CES 2026》輝達Rubin平台亮相:六晶片「極致協同設計」成一台AI超級電腦,推論詞元成本較Blackwell降10倍
2026 CES(消費電子展)開展,輝達(NVIDIA)在拉斯維加斯宣布推出NVIDIA Rubin平台,以「六款全新晶片」組成新一代AI基礎設施,目標是用更低成本建置、部署並防護全球規模最大的AI系統。輝達強調,Rubin是一套可打造「一台出色的AI超級電腦」的平台,並以六晶片的「極致協同設計」為核心,直接把訓練時間與推論詞元(token)成本往下壓。
在演講現場上,黃仁勳把上述時間表講得更直白:輝達已在量產GB300,而「如果Vera Rubin要趕上今年的節奏,它現在就必須已經進入生產」,因此他在台上宣布「Vera Rubin 已全面量產(in full production)」。
這句話等於替Rubin平台定調:它不是概念或路線圖,而是準備接棒、面向「AI的下一個前沿」的量產世代。
摩爾定律放緩、token爆炸成長,逼出極限共同設計
黃仁勳進一步解釋說,輝達內部原本有個「好規則」:新一代平台最多更換一到兩顆晶片;但問題在於摩爾定律放緩後,晶片電晶體數成長速度已追不上AI的需求曲線:模型規模快速放大、推論生成的token數量年年飆升、而token成本又必須以極快速度下降,否則整個產業無法維持競爭節奏。於是他下結論:若不做「aggressive, extreme co-design」,也就是跨晶片、跨整個堆疊同步創新,「產業不可能跟上」,這一代「沒有選擇,只能把每一顆晶片都重新設計」。
依據輝達所提供的資料:Rubin六晶片採「極致協同設計」,包含Vera CPU、Rubin GPU、NVLink 6交換器、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6乙太網路交換器,目的就是讓整套系統像「一台機器」那樣運作,去承接代理型AI(agentic AI)、先進推理與大規模混合專家(MoE)模型的運算需求。
Rubin關鍵數字:推論詞元成本降10倍、MoE訓練GPU需求減少4倍
在效益宣示上,輝達把Rubin的「成本曲線」放在第一順位。依據輝達的數據指出,相較NVIDIA Blackwell平台,Rubin透過軟硬體協同設計,可將推論詞元成本降低10倍,並將訓練混合專家(MoE)模型所需GPU數量減少4倍。
若把這兩個數字放回黃仁勳的「下一個前沿」主線,意思是:當推理(inference)從「一次性回答」變成「在執行時思考的過程」,每一次推論都要生成更多token;而Rubin的任務,就是把「生成token的成本」繼續壓低,讓代理型AI與長情境應用能在更大規模部署。
從機架級NVL72到系統級HGX,把AI超級電腦做成標準
輝達也明確定義Rubin的兩個主要形態:NVIDIA Vera Rubin NVL72 機架級解決方案與 NVIDIA HGX Rubin NVL8 系統。
在CES會場的影片與講述中,輝達用更具象的方式說明「六晶片像一顆晶片」的概念:從「六晶片架構」一路堆疊到NVLink互連,把多顆GPU視為單一運算體,再配合Spectrum-X乙太網路光子學等網路技術,把AI工廠尺度推進到「成千上萬個機櫃」。
黃仁勳則把這套節奏收斂成一句話:「Rubin的問世恰逢其時,因為AI運算對訓練與推論的需求正呈現爆炸性成長。憑藉我們每年推出新一代AI超級電腦的節奏,以及橫跨六款全新晶片的極致協同設計,Rubin正朝AI的下一個前沿邁出重大躍進。」
生態系與客戶端訊號:雲端、模型實驗室與系統廠同步表態
Rubin並非只是一套硬體平台。輝達同時揭露了預計採用Rubin的雲端服務供應商、模型實驗室與系統夥伴,並安排多位指標客戶/夥伴發言,為Rubin的落地來背書。
例如OpenAI執行長Sam Altman指出,智慧會隨運算能力擴展,增加運算資源可讓模型更強大、解更棘手的問題;他表示,Rubin平台能協助把「先進智慧」推進並普及。
Anthropic執行長Dario Amodei則把重點放在「更長記憶體、更佳推理能力與更可靠輸出」所需的基礎設施突破,認為Rubin的效率提升是關鍵。
Meta執行長Mark Zuckerberg也提到Rubin將帶來效能與效率的飛躍,對於向數十億人部署最先進模型是必要條件。(推薦閱讀)CES 2026》蘇姿丰揭曉2奈米MI455X與「Helios」平台,擘劃次世代AI基建藍圖
至於落地時程方面,輝達指出,CoreWeave將自2026年下半年起把Rubin系統整合進其AI雲端平台,並搭配Mission Control提供生命週期的效能、可靠性與規模支援。