請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

1200億參數怪獸現身 NVIDIA Nemotron 3 Super 登場

新頭殼

更新於 03月12日07:06 • 發布於 03月12日07:06 • Newtalk新聞 |蘇元和 綜合報導

Newtalk新聞

NVIDIA 今日(12)推出 NVIDIA Nemotron 3 Super模型,這是一款具備 1200 億參數的開放模型,其中包含 120 億個活躍參數(active parameters),專為大規模運行複雜的代理型 AI 系統而設計。此模型現已開放使用,結合先進推理能力,可讓自主代理以高效率完成任務並維持高準確度。

以下是輝達發布完整內容:

AI 原生企業:Perplexity 已為其用戶提供 Nemotron 3 Super,用於搜尋功能,並將其作為 Computer 產品中 20 個協作模型之一。提供軟體開發代理的公司,如CodeRabbit、Factory 與 Greptile,也正將該模型與自家模型整合至 AI 代理中,以降低成本並同步提升準確度。此外,Edison Scientific 與 Lila Sciences等生命科學與頂尖 AI 機構,則將運用 Nemotron 3 Super 模型驅動其代理系統,用於深度文獻搜尋、資料科學研究,以及分子層級的理解任務。

企業軟體平台:Amdocs、Palantir、Cadence、達梭系統與西門子等業界領導廠商正在部署並客製化 Nemotron 3 Super 模型,用於電信、資安、半導體設計與製造等領域的工作流程自動化。

隨著企業從聊天機器人邁向多代理應用,正面臨兩大主要限制。

首先是情境膨脹(context explosion)問題。多代理工作流程所產生的詞元數量,可能是一般聊天互動的 15 倍,因為每次互動都必須重新傳送完整歷史紀錄,包括工具輸出與中間的推理過程。

在處理時間較長的任務中,龐大的情境資料量會增加成本,且可能導致代理偏離原始目標。

第二項是思考稅(thinking tax)。複雜代理需要在每個步驟進行推理,但若是每個子任務都使用大型模型,將使多代理應用成本過高且運行緩慢,難以在實務環境中部署。

Nemotron 3 Super 提供 100 萬個詞元的情境窗口,使代理能將完整工作流程狀態保留在記憶中,進而避免目標偏移。

Nemotron 3 Super 亦樹立全新效能標準,在效率與開放性方面於 Artificial Analysis 評比中排名第一,並在同級模型中展現領先的準確度。

該模型也同時讓 NVIDIA AI-Q 研究代理在 DeepResearch BenchDeepResearch Bench II 排行榜上榮登榜首。這兩項基準測試皆用於衡量 AI 系統在處理大型文件集時,進行全面多步驟研究,並維持推理連貫性的能力。

混合式架構

Nemotron 3 Super 採用混合式專家(MoE)架構,整合三大關鍵創新,相較前一代 Nemotron Super 模型,資料輸送量提升最高達 5 倍,準確度提升最高達 2 倍。

混合式架構(Hybrid Architecture:Mamba 層可提供高達 4 倍的記憶體與運算效率,而 Transformer 層則驅動進階推理。

混合專家(MoE:在推論階段時,1200 億參數中僅有 120 億參數將處於活躍狀態。

潛在混合專家(Latent MoE:這項創新技術能在推論階段,以一個專家的成本啟動四個專家模型來產生下一個詞元,進一步提升準確度。

多詞元預測(Multi-Token Prediction:可同步預測多個未來詞元,使推論速度提升 3 倍。

在 NVIDIA Blackwell 平台上,該模型以 NVFP4 精度運行。此舉可降低記憶體需求,並將推論速度提升至 NVIDIA Hopper 平台上 FP8 精度運算的 4 倍,同時維持相同準確度。

開放權重、資料與訓練方法

NVIDIA 以寬鬆授權方式釋出 Nemotron 3 Super 模型的開放權重。開發者可在工作站、資料中心或雲端環境部署並客製化該模型。

Nemotron 3 Super 模型使用由前沿推理模型生成的合成資料進行訓練。NVIDIA 同時完整公開研究方法,包括超過 10 兆詞元的訓練前與訓練後資料集、15 個強化學習訓練環境及評估流程。研究人員也可進一步運用 NVIDIA NeMo 平台對模型進行微調,或自行建構全新模型。

在代理型系統中的應用

Nemotron 3 Super 專為處理多代理系統中的複雜子任務而設計。

軟體開發代理可將完整程式碼庫一次性載入情境,實現端到端程式碼生成與除錯,且無需分割文件。

在財務分析場景中,該模型可將數千頁報告載入記憶體,避免在長時間對話中反覆推理,從而提升效率。

Nemotron 3 Super 亦具備高準確度的工具調度能力,使自主代理能可靠地在龐大的函式庫中選擇正確功能,以避免在資安領域中的自動化安全編排等高風險環境發生執行錯誤。

上市時程

NVIDIA Nemotron 3 Super 模型為 Nemotron 3 系列模型成員,目前已可透過 build.nvidia.comPerplexityOpenRouterHugging Face 存取。戴爾科技集團正將該模型導入 Hugging Face 上的 Dell Enterprise Hub,並針對 Dell AI Factory 的地端部署進行最佳化,以推動多代理 AI 工作流程。慧與科技亦將 NVIDIA Nemotron 引入其代理平台(agents hub),協助企業大規模採用代理型 AI。

企業與開發者可透過以下合作夥伴部署 Nemotron 3 Super 模型:

雲端服務供應商:Google Cloud Vertex AI、Oracle Cloud Infrastructure,以及即將支援的 Amazon Web Services(透過 Amazon Bedrock)與 Microsoft Azure。

NVIDIA 雲端合作夥伴:Coreweave、CrusoeNebiusTogether AI

推論服務供應商BasetenCloudFlareDeepInfraFireworks AIInference.netLightning AIModalFriendliAI

資料平台與服務:Distyl、Dataiku、DataRobot、德勤、安永與塔塔顧問服務。

延伸閱讀

查看原始文章

更多理財相關文章

01

面板展來了/2026年先進封裝百花齊放 設備廠樂觀喊:好到很恐怖

鏡報
02

獨家/康舒「備位總經理」葉正賢7週閃辭 4年連走3高層

鏡報
03

每10人就有1人背房貸 全台房貸族破225萬創新高

台視
04

台積電本周配發1555億現金股利 國發基金99億入袋 0050也有25億進帳

信傳媒
05

高股息ETF回神!00878、00919帶頭加息,0056最新配息能突破0.9元?想每月多領1萬怎麼配?

幸福熟齡 X 今周刊
06

孤老宅破90萬間! 北漂養老族最多 專家:生活基能成關鍵

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...