請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

CES 2026》輝達Rubin平台亮相:六晶片「極致協同設計」成一台AI超級電腦,推論詞元成本較Blackwell降10倍

風傳媒

更新於 01月08日02:43 • 發布於 01月08日04:10 • 魏鑫陽
輝達(NVIDIA)在拉斯維加斯宣布推出NVIDIA Rubin平台。圖為輝達創辦人暨執行長黃仁勳。(資料照,美聯社)

2026 CES(消費電子展)開展,輝達(NVIDIA)在拉斯維加斯宣布推出NVIDIA Rubin平台,以「六款全新晶片」組成新一代AI基礎設施,目標是用更低成本建置、部署並防護全球規模最大的AI系統。輝達強調,Rubin是一套可打造「一台出色的AI超級電腦」的平台,並以六晶片的「極致協同設計」為核心,直接把訓練時間與推論詞元(token)成本往下壓。

在演講現場上,黃仁勳把上述時間表講得更直白:輝達已在量產GB300,而「如果Vera Rubin要趕上今年的節奏,它現在就必須已經進入生產」,因此他在台上宣布「Vera Rubin 已全面量產(in full production)」。

這句話等於替Rubin平台定調:它不是概念或路線圖,而是準備接棒、面向「AI的下一個前沿」的量產世代。

摩爾定律放緩、token爆炸成長,逼出極限共同設計

黃仁勳進一步解釋說,輝達內部原本有個「好規則」:新一代平台最多更換一到兩顆晶片;但問題在於摩爾定律放緩後,晶片電晶體數成長速度已追不上AI的需求曲線:模型規模快速放大、推論生成的token數量年年飆升、而token成本又必須以極快速度下降,否則整個產業無法維持競爭節奏。於是他下結論:若不做「aggressive, extreme co-design」,也就是跨晶片、跨整個堆疊同步創新,「產業不可能跟上」,這一代「沒有選擇,只能把每一顆晶片都重新設計」。

依據輝達所提供的資料:Rubin六晶片採「極致協同設計」,包含Vera CPU、Rubin GPU、NVLink 6交換器、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6乙太網路交換器,目的就是讓整套系統像「一台機器」那樣運作,去承接代理型AI(agentic AI)、先進推理與大規模混合專家(MoE)模型的運算需求。

Rubin關鍵數字:推論詞元成本降10倍、MoE訓練GPU需求減少4倍

在效益宣示上,輝達把Rubin的「成本曲線」放在第一順位。依據輝達的數據指出,相較NVIDIA Blackwell平台,Rubin透過軟硬體協同設計,可將推論詞元成本降低10倍,並將訓練混合專家(MoE)模型所需GPU數量減少4倍。

若把這兩個數字放回黃仁勳的「下一個前沿」主線,意思是:當推理(inference)從「一次性回答」變成「在執行時思考的過程」,每一次推論都要生成更多token;而Rubin的任務,就是把「生成token的成本」繼續壓低,讓代理型AI與長情境應用能在更大規模部署。

輝達(Nvidia)創辦人兼執行長黃仁勳在拉斯維加斯 CES 展前記者會上發表演說。(美聯社)

從機架級NVL72到系統級HGX,把AI超級電腦做成標準

輝達也明確定義Rubin的兩個主要形態:NVIDIA Vera Rubin NVL72 機架級解決方案與 NVIDIA HGX Rubin NVL8 系統。

在CES會場的影片與講述中,輝達用更具象的方式說明「六晶片像一顆晶片」的概念:從「六晶片架構」一路堆疊到NVLink互連,把多顆GPU視為單一運算體,再配合Spectrum-X乙太網路光子學等網路技術,把AI工廠尺度推進到「成千上萬個機櫃」。

黃仁勳則把這套節奏收斂成一句話:「Rubin的問世恰逢其時,因為AI運算對訓練與推論的需求正呈現爆炸性成長。憑藉我們每年推出新一代AI超級電腦的節奏,以及橫跨六款全新晶片的極致協同設計,Rubin正朝AI的下一個前沿邁出重大躍進。」

生態系與客戶端訊號:雲端、模型實驗室與系統廠同步表態

Rubin並非只是一套硬體平台。輝達同時揭露了預計採用Rubin的雲端服務供應商、模型實驗室與系統夥伴,並安排多位指標客戶/夥伴發言,為Rubin的落地來背書。

例如OpenAI執行長Sam Altman指出,智慧會隨運算能力擴展,增加運算資源可讓模型更強大、解更棘手的問題;他表示,Rubin平台能協助把「先進智慧」推進並普及。

Anthropic執行長Dario Amodei則把重點放在「更長記憶體、更佳推理能力與更可靠輸出」所需的基礎設施突破,認為Rubin的效率提升是關鍵。

Meta執行長Mark Zuckerberg也提到Rubin將帶來效能與效率的飛躍,對於向數十億人部署最先進模型是必要條件。(推薦閱讀)CES 2026》蘇姿丰揭曉2奈米MI455X與「Helios」平台,擘劃次世代AI基建藍圖

至於落地時程方面,輝達指出,CoreWeave將自2026年下半年起把Rubin系統整合進其AI雲端平台,並搭配Mission Control提供生命週期的效能、可靠性與規模支援。

查看原始文章

更多國內相關文章

01

蘇格蘭國家博物館台灣標示爭議 館方:參考聯合國

中央通訊社
02

喪屍菸彈危國安/毒駕案件爆增200倍 揭中國原料侵台黑幫低價促銷亂象

鏡週刊
03

昔日意氣風發!徐春鶯羈押半年爆瘦「白髮」 交保一臉憔悴苦笑喊2字

太報
04

「可以跟我老婆打砲」新莊男嗨收SOD訊息衝永和 屋主應門後結局神展開悲劇了

鏡週刊
05

台灣竟「罕見開砲金正恩」!全因北韓配合中共做1事 外交部都說了

民視新聞網
06

女特助激戰「出人命」!辯不知生父是誰卻羞喊「8字」慘了

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...