Vera Rubin全面量產 黃仁勳:謝謝台灣
輝達(NVIDIA)執行長黃仁勳於GTC Taipei演講中宣布,新一代AI平台Vera Rubin已進入全面量產,並向台灣供應鏈表達感謝。他指出,Vera Rubin是輝達史上最具野心的工程計畫,不只是單一GPU,也不是單一晶片,而是涵蓋GPU、CPU、網路、儲存、安全處理器與軟體堆疊的完整AI基礎建設系統,背後更仰賴台灣龐大且高度協作的供應鏈支撐。
黃仁勳表示,AI運算模式正在從傳統應用程式,轉向代理式AI(Agentic AI)架構。未來AI agent將不只是單純呼叫工具,而是能在資料中心內橫跨不同運算資源,進行觀察、理解、推理、規劃與執行。他形容,大型語言模型如同「大腦」,harness是身體,工具與執行環境則像工作坊;每一次AI思考,都會啟動整座Grace Blackwell NVLink72機櫃,並同時動用CPU、GPU、DPU與儲存系統。
正因AI agent運算牽涉分散式、異質運算與龐大記憶體管理,黃仁勳指出,輝達打造下一世代Vera Rubin,就是為了因應全新運算模型。他強調,Vera Rubin不是單一晶片,而是端到端系統,包含Vera Rubin GPU、Vera CPU、NVLink72、CX9網路、DOCA軟體堆疊,以及BlueField DPU安全處理器,支援資料在靜態、傳輸及使用中的加密,符合confidential computing需求。
黃仁勳形容,Vera Rubin是「輝達史上最具野心的計畫」,全公司4 萬名工程師投入其中,台灣供應鏈也共同參與。他說,NVIDIA過去曾是GPU公司,後來轉型為系統公司,如今更進一步成為AI基礎建設公司。客戶真正需要的不是單一電腦,而是能大規模產生算力與營收的AI factory。
他指出,全球正競相興建AI factory,這是人類史上最大規模的基礎建設投資之一。單座1GW等級AI factory投資金額,已從200億至300億美元,推升至500億至600億美元,未來更可能達到800億至1,000億美元。由於資本支出龐大,系統必須一次到位、快速上線,並具備高可靠度與高效能。
黃仁勳並提出「compute is revenue」的觀點,強調未來資料中心不只看晶片價格,而是看每瓦可產生多少token、多少營收。若AI factory電力上限為1GW,則tokens per watt便直接決定收入能力;選錯架構即使晶片較便宜,也不代表總體經濟效益較佳。輝達透過晶片、機櫃、網路、軟體與資料中心層級共同設計,提升time to first token、tokens per watt與系統可靠度。
在供應鏈進度方面,黃仁勳正式宣布:「Vera Rubin is in full production。」他指出,Vera Rubin所建立的供應鏈規模,是Grace Blackwell的兩倍,且製造效率大幅提升;過去組裝一座Grace Blackwell rack需要兩小時,如今僅需五分鐘,代表產能與吞吐效率同步提高,可支撐全球AI factory強勁需求。
黃仁勳表示,為支援Grace Blackwell,供應鏈已投入數百萬平方英尺產能,如今也正為Vera Rubin拉升量產規模。他最後向台灣供應鏈致謝,隨新平台全面量產,台灣半導體、伺服器、散熱、電源、網通、PCB、機構件與整機組裝供應鏈,預料將再迎AI基礎建設擴張新一波商機。