【AI】輝達 2026 GTC Taipei 大會演講重點:AI Agent 崛起、Vera Rubin系統拆解、邊緣及物理AI推進
重點整理
1. 全新的運算典範:代理型 AI (Agentic AI) 的崛起
- 從「應用程式」到「代理」:未來的運算模式將不再是人類手動點擊、輸入來操作應用程式,而是人類表達意圖後,由 AI 代理自動觀察、推理、規劃並使用工具來達成目標。
- Agent = Model + Harness:傳統的運算模式是「應用程式的程式碼 (Application code)」在「作業系統 (Operating system)」中執行;但在全新的代理型 AI 時代,這個架構被替換成了「代理 (Agent)」,它是由「大型語言模型 (Model)」放置在「控制框架 (Harness)」所組成,由模型扮演著「大腦 (Brain)」的角色,負責思考、處理上下文、觀察環境、進行推理並制定計畫,控制框架 (Harness)則扮演著「身體 (Body)」或「作業系統」的角色,負責統籌協調 (orchestrate) 所有的資訊傳遞,管理代理的短期記憶(工作記憶)與長期記憶,並協助模型去呼叫外部工具(如試算表、資料庫或網頁瀏覽器)來完成具備生產力的工作。
- 驚人的經濟產值:代理型 AI 已具備實用性,並能創造龐大的經濟效益,例如運算需求產生的 Tokens 現在已經成為可獲利的單位演講。
2. 專為代理打造的巨獸:Vera Rubin 系統與 AI 工廠
- 史上首款專為「代理型 AI 」打造的機架級系統:因為代理型 AI 會牽涉到極度複雜的記憶體管理(工作記憶體與長期記憶體)與分散式工具呼叫,NVIDIA 推出了全新世代的 Vera Rubin 超級電腦,目前已投入全面生產,其供應鏈規模是前一代 Grace Blackwell 的兩倍,且組裝時間從 2 小時大幅縮短至 5 分鐘。
- AI 工廠數位孿生:未來的 AI 工廠建置成本高達數百億美元,因此 NVIDIA 會透過 Omniverse 數位孿生技術 (DSX 藍圖),在工廠動工前就先在虛擬世界中完成空間配置、 45°C 熱液冷散熱以及動態電力分配的模擬驗證,確保上線後的 Tokens 效率與利潤最大化。
- 轉型基礎設施公司:NVIDIA 強調自己已經從單純的 GPU 或系統公司,轉型為全面的「 AI 基礎設施公司」,致力於幫助全球合作夥伴建構最高效能、最低 TCO (總體擁有成本) 的 AI 工廠。
3. 為 AI 代理而生的處理器:Vera CPU
傳統 CPU 是為人類的「秒級」反應所設計,但 AI 代理極度缺乏耐心,需要在「奈秒級」的環境中呼叫工具與資料庫。因此,NVIDIA 重新打造了 Vera CPU,具備以下極致特性:
- 極高的單執行緒效能:單一週期可獲取、解碼並執行 10 個指令。
- 無與倫比的頻寬:採用無晶片邊界傳輸稅的架構,具備 3.6 TB/s 的互連頻寬,且是首款採用 1.2 TB/s LPDDR5X 記憶體的 CPU。
- 極致能源效率:確保將更多的電力預算留給能賺錢的 GPU 去生成 Tokens。
4. 頂尖開源大語言模型:Nemotron 3 Ultra
這是全球首款結合狀態空間模型 (SSM) 與混合專家 (MoE) 的開源模型,速度比目前最好的開源模型快 5 倍,整體運行成本降低了 30% 。 NVIDIA 甚至開源了訓練腳本與訓練資料,讓全球企業能無痛打造專屬 AI Agent。
5. 攜手微軟,迎來 40 年來最大 PC 革命:RTX Spark
- NVIDIA 與微軟耗時 3 年合作,徹底重塑了 PC 的軟硬體架構,並與聯發科合作開發了 N1X 晶片 (RTX Spark),內建 6,144 個 CUDA 核心與 20 核心客製化 Grace CPU。
- 24 小時無休的家用 AI 超級電腦:未來的 PC 將成為人們家中的專屬 AI 助理。你可以把桌機放在家裡 24 小時免費運行 (meter-free) 代理程式,它能連接你家中的各種設備,並協助你完成從 3D 建築設計渲染到日常瑣事的各種任務,就像《星際大戰》裡的 R2-D2 一樣陪伴人類。
6. 實體 AI (Physical AI) 的全面爆發:Cosmos 、 Alpamayo 與 Groot
- Cosmos 3 世界模型:解決了實體機器人最缺乏的「第一人稱視角資料」問題。這款前沿模型能感知、推理,並生成符合物理法則的精確影片,作為訓練機器人策略的模擬器。
- Alpamayo 2 自駕車模型:全球首款具備「推理能力」的自動駕駛模型,它會在腦中「自言自語」來評估路況並做出決策,目前已被全球約 80% 的汽車製造商採用。
- NVIDIA Isaac Groot 人形機器人:為了降低大學與實驗室的研究門檻,NVIDIA 推出這款身高 6 呎、重 150 磅,全身具有 31 個自由度(單手 25 個自由度)的參考設計機器人,硬體與軟體全面整合,讓開發者能迅速展開研究。
更多 AI 趨勢相關數據,可留意 AI 產業專區!