請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

輝達引領 AI 新紀元,Rubin CPX GPU 與革新 PCIe Switch+CX8 I/O 板重塑 HPC 架構

科技新報

更新於 2025年09月15日21:57 • 發布於 2025年09月15日13:30

在全球人工智慧(AI)運算能力與效率需求急遽攀升的浪潮下,日前 GPU 大廠輝達 (NVIDIA) 正式發布兩項劃時代創新技術,包括新一代專為大規模情境(context)處理設計的 Rubin CPX GPU,以及將成為其系統關鍵基礎的 NVIDIA MGX PCIe Switch Board with ConnectX-8 SuperNICs。兩者結合,預示著 AI 運算正邁向高效能、高效率與高擴展性的全新時代。

輝達Rubin CPX GPU的核心使命,是突破AI系統在「長情境」推論上的瓶頸。隨著AI模型逐漸龐大,處理數百萬詞元的需求愈加常見,無論是大型軟體專案分析、長篇文件理解,或是一小時長度的影片生成,都對傳統GPU構成挑戰。Rubin CPX則以全新設計打破限制,能在單一晶片上整合影片解碼器、編碼器與長情境推論處理,提供前所未有的速度與效能。

▲ 透過將GPU功能與上下文和生成工作負載保持一致來最佳化推理(圖片來源:Nvidia

想像一下,AI要處理一份厚達數百萬字的文件、分析一個大型軟體專案,或是生成一部長達一小時的影片,這對傳統的GPU來說是個巨大的挑戰。但 Rubin CPX GPU的誕生,就是為了打破這個瓶頸!

Rubin CPX GPU 專為「長篇」AI 推論而生,效能是現有系統 7.5 倍

對此,輝達創辦人暨執行長黃仁勳指出,Rubin CPX是首款專為大規模情境AI設計的CUDA GPU,與Vera Rubin CPU及Rubin GPU協同運作,組成 Vera Rubin NVL144 CPX平台。單一機架下可提供高達 8 exaflops 的AI運算能力,效能是現有GB300 NVL72系統的7.5倍。而且,該系統同時配置 100TB記憶體與每秒1.7PB頻寬,讓資料能以極高速流動,支撐嚴苛的AI工作負載。輝達亦提供 Rubin CPX運算托盤,協助客戶延伸既有Vera Rubin系統的投資效益。

在效能規格上,Rubin CPX採用 NVFP4精度,運算力達30 petaflops,並配備 128GB GDDR7記憶體,能以極高能源效率處理大規模AI推論。與GB300 NVL72相比,Rubin CPX系統專注力提升3倍,使AI模型能處理更長的情境序列,維持高效能而不降速。

根據Facebook專頁粉絲頁「Richard只談基本面-Richard's Research Blog」所發布的內容顯示,Rubin CPX具備高度彈性,能與Quantum-X800 InfiniBand橫向擴展架構或Spectrum-XGS乙太網路平台相結合,搭配NVIDIA ConnectX-9 SuperNICs,滿足不同企業需求。對此,NVIDIA更指出,每投資1億美元於Rubin CPX,即能帶來高達50億美元的詞元收益,展現極具吸引力的投資回報,將AI技術直接轉化為可觀的商業價值。

PCIe Switch+CX8 I/O 板強化硬體效能,推動 AI 規模化應用

為了完整釋放Rubin CPX的驚人效能,輝達同步推出了全球首款 PCIe 6.0規格的 I/O板。這塊板子就像是AI伺服器的「神經中樞」,它把多個重要晶片整合在一起,簡化了伺服器設計,讓所有零組件都能以超高速互相溝通。

許多頂尖的AI公司都已經開始採用這項技術,例如Cursor利用它來加速程式碼生成,Runway則用它來創作電影等級的長影片內容。

為了支撐Rubin CPX的龐大效能,輝達同步推出了 PCIe Switch+CX8 I/O板。這是全球首款量產的 PCIe 6.0規格 I/O產品,將PCIe Switch晶片與ConnectX-8 SuperNIC整合於同一大板,搭載9個PCIe插槽與8個NIC連接器。

▲ NVIDIA Vera Rubin NVL144 CPX 機架和托盤,配備 Rubin Context GPU (Rubin CPX)、Rubin GPU 和 Vera CPU(圖片來源:Nvidia

這塊 I/O 板和傳統的主機板很不一樣,它沒有 CPU,是專門為需要大量運算力的 AI GPU 伺服器所設計。

它最大的特色是將 PCIe SwitchCX8 NIC 這兩個關鍵元件合而為一,就像是將原本分開的兩個功能整合在一起,讓伺服器的設計變得更簡單,同時減少了零件數量。

▲採用 ConnectX-8 SuperNIC 的傳統伺服器設計(左)與最佳化伺服器設計(右)的比較 (圖片來源:Nvidia

這項設計還有三個主要優點:

  • 速度更快: 由於元件高度整合,讓伺服器內的各個 GPU 可以直接以超高速的 PCIe 6.0 進行溝通,傳輸速度最高可達 800Gb/s,大幅降低了延遲。

  • 散熱更好: 減少了多餘的小板,讓伺服器內部的空氣流動更順暢,散熱效率也跟著提升。

  • 技術門檻更低: 透過這塊板子,輝達簡化了伺服器的架構,讓更多企業能更容易地部署和使用高效能的 AI 運算系統,甚至能部分取代現有的市場

▲採用 ConnectX-8 SuperNIC 的傳統伺服器設計(左)和最佳化伺服器設計(右)的比較,突顯了三個關鍵的 GPU 通訊路徑(圖片來源:Nvidia

這項新技術已經開始量產,並應用在輝達的 Rubin CPX 運算系統中。一些 AI 領域的先驅企業已經率先採用,例如:

  • Cursor: 利用其強大效能來加速「智慧程式碼生成」。

  • Runway: 用來生成「電影等級」的長影片內容。

  • Magic: 則能處理上億個詞元,讓 AI 助理可以完整理解複雜的軟體歷史,加速自動化工程。

軟硬體兼備,生態系全面擴張

除了硬體上的突破,Rubin CPX 也能完整支援輝達的 AI 技術生態系,這包括能提升效率的 Dynamo 平台Nemotron 模型以及 NVIDIA AI Enterprise 套件等。

這些軟體工具讓企業無論是在雲端、資料中心還是工作站,都能輕鬆地部署 AI 應用。搭配上輝達廣大的開發者社群和超過 6,000 種應用程式,Rubin CPX 的硬體優勢將能迅速轉化為實際的商業價值。

輝達表示,NVIDIA Rubin CPX 預計在 2026 年底上市。雖然還有一段時間,但這項技術在長情境處理、系統整合及投資回報上的突破,已經讓業界充滿期待。這不只是一場硬體架構的革新,更是推動 AI 應用走向成熟普及的重要一步。

(首圖來源:輝達提供)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

面板展來了/2026年先進封裝百花齊放 設備廠樂觀喊:好到很恐怖

鏡報
02

獨家/康舒「備位總經理」葉正賢7週閃辭 4年連走3高層

鏡報
03

台積電本周配發1555億現金股利 國發基金99億入袋 0050也有25億進帳

信傳媒
04

孤老宅破90萬間! 北漂養老族最多 專家:生活基能成關鍵

民視新聞網
05

預期美伊將停火「美股小漲」!台股早盤漲逾6百點 台積電開1850元

民視新聞網
06

解放日至今關稅政策變動超過 50 次,美國這一年有變更有錢嗎?

科技新報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...