從Token經(jīng)濟到Agent路由：英偉達用Nemotron重構(gòu)企業(yè)級AI底座

本文作者：劉伊倫

2025-12-16 14:00

導語：Nemotron 3 Token吞吐量提升4倍，并減少了多達60%的推理Token生成量。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))消息，2025年12月15日，英偉達正式對外發(fā)布Nemotron 3系列開放模型及配套的數(shù)據(jù)集與工具庫，這一舉措精準切入全球企業(yè)AI轉(zhuǎn)型的核心訴求，為行業(yè)帶來了兼具透明度與高效能的代理式AI開發(fā)解決方案。

隨著AI技術(shù)在產(chǎn)業(yè)場景的深度滲透，企業(yè)對AI的應用需求已從單一對話交互升級為復雜工作流自動化，協(xié)作式多智能體系統(tǒng)成為必然趨勢。

然而，開發(fā)者在轉(zhuǎn)型過程中始終面臨三重核心困境：智能體間通信開銷過高、長任務推理易出現(xiàn)上下文漂移、推理成本居高不下，同時，模型透明度不足也讓企業(yè)和開發(fā)者難以放心將核心業(yè)務托付給AI系統(tǒng)。

Nemotron 3的推出正直面這些挑戰(zhàn)。

Nemotron 3模型推出Nano、Super和Ultra三種規(guī)模，突破性異構(gòu)潛在混合專家（MoE）架構(gòu)是核心亮點，既守住了專業(yè)化代理式AI所需的性能，又堅持開放特質(zhì)，讓開發(fā)者無需在“性能強度”與“使用自由度”間做取舍，成為高效的開發(fā)底座。

“開放創(chuàng)新是AI進步的基礎。通過Nemotron，我們將先進AI轉(zhuǎn)化成開放平臺，為開發(fā)者提供構(gòu)建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。

Nemotron并非孤立的模型發(fā)布，而是英偉達主權(quán)AI戰(zhàn)略的關鍵支撐。

埃森哲、德勤、安永、ServiceNow、西門子、Zoom等12家企業(yè)已經(jīng)成為Nemotron早期用戶，從制造業(yè)的智能產(chǎn)線優(yōu)化，到網(wǎng)絡安全的威脅閉環(huán)應對，再到媒體通信的高效協(xié)作，這些行業(yè)標桿企業(yè)正將這款開放模型深度融入核心AI工作流，一場跨領域的智能升級浪潮已悄然拉開序幕。

Token吞吐量提高4倍、減少60%推理Token生成量，Nemotron 3讓每一分算力「物超所值」

在多智能體AI系統(tǒng)愈發(fā)深入產(chǎn)業(yè)的今天，開發(fā)者面臨很現(xiàn)實的問題：既要依賴專有模型的前沿推理能力支撐復雜任務，又希望借助開放模型的高效與可定制性控制成本。

Nemotron 3的出現(xiàn)，正在解決這種“性能與經(jīng)濟不可兼得”的困境。

任務路由技術(shù)成為關鍵。在單一工作流中，開發(fā)者可通過智能調(diào)度，讓日常高效型任務交由Nemotron 3這樣的開放模型處理，而核心復雜的前沿推理則聯(lián)動專有模型，既保證了智能體的能力，又優(yōu)化了Token經(jīng)濟效益。這一模式并非理論構(gòu)想，已在Perplexity的實踐中落地。

作為AI瀏覽器領域的創(chuàng)新者，Perplexity正將Nemotron 3 Ultra納入其智能體路由器的核心選項。

“Perplexity的構(gòu)建理念是當精準AI融入先進工具時（例如 AI 助手），人類的好奇心將被放大。通過我們的智能體路由器，可以將工作負載定向到領先的精細調(diào)優(yōu)開放模型，如Nemotron 3 Ultra，或在任務能夠從其獨特能力中受益時，利用領先的專有模型，以此確保我們的AI助手能夠以卓越的速度、效率和規(guī)模運行。”Perplexity首席執(zhí)行官Aravind Srinivas表示。

如果說大企業(yè)借助Nemotron 3實現(xiàn)了效率升級，那么這款開放模型對初創(chuàng)公司而言，更像是一把加速創(chuàng)新的“鑰匙”。General Catalyst和Mayfield旗下的諸多創(chuàng)業(yè)公司，正借助Nemotron 3搭建人機協(xié)作的AI隊友，實現(xiàn)工作效能的快速提高。

這背后離不開NVIDIA全生態(tài)的支撐。

Mayfield管理合伙人Navin Chaddha表示：“英偉達的開放模型堆棧與初創(chuàng)加速計劃為初創(chuàng)公司提供了各類模型、工具及經(jīng)濟高效的基礎設施，助力其開展試驗、實現(xiàn)差異化發(fā)展并快速擴展規(guī)模。Nemotron 3可以讓創(chuàng)始人在構(gòu)建代理式AI應用和AI隊友方面取得先機，并幫助他們利用英偉達龐大的用戶基礎?！?/p>

Nemotron 3系列MoE模型包含三種規(guī)模：

Nemotron 3 Nano：是一款具備300億參數(shù)的小型模型，每次運行最多激活30億參數(shù)，適用于針對性、高效的任務。

Nemotron 3 Super：是一款具備約1000億參數(shù)的高精度推理模型，每個Token最多激活100億參數(shù)，適用于多智能體應用。

Nemotron 3 Ultra：是一款具備約5000億參數(shù)的大型推理引擎，每個Token最多激活500億參數(shù)，適用于復雜的AI應用。

Nemotron 3 Nano已正式上線，是計算成本效益極高的模型，其針對軟件調(diào)試、內(nèi)容摘要、AI助手工作流及信息檢索等任務進行了優(yōu)化，同時保持了較低的推理成本。并且，模型采用獨特的異構(gòu)MoE架構(gòu)，以實現(xiàn)效率與可擴展性的提升。

這一設計使其Token吞吐量較Nemotron 2 Nano至高提升4倍，并減少了多達60%的推理Token生成量，大大降低了推理成本。同時，具備100萬Token的上下文處理能力，Nemotron 3 Nano具有更強的記憶能力，在處理長時間多步驟任務時能更精準地關聯(lián)信息。

從Token經(jīng)濟到Agent路由：英偉達用Nemotron重構(gòu)企業(yè)級AI底座

獨立AI基準測試機構(gòu)Artificial Analysis評定該模型為同等規(guī)模模型中兼具極高開放性和效率及卓越精度的模型。

在需要多智能體協(xié)作完成低延遲復雜任務的應用中，Nemotron 3 Super表現(xiàn)出色。Nemotron 3 Ultra則作為高級推理引擎，服務于需要深度研究和策略規(guī)劃的AI工作流。

Nemotron 3 Super與Ultra采用基于英偉達Blackwell架構(gòu)的超高效4位NVFP4訓練格式，可顯著降低顯存需求并加速訓練進程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎設施上進行訓練，不會因更高精度格式而犧牲準確性。

借助Nemotron 3系列模型，開發(fā)者可根據(jù)特定工作負載選擇適配的開放模型，在數(shù)十至數(shù)百個智能體間靈活擴展，同時在復雜工作流中獲得更快速、精準的長時推理能力。

3萬億Token數(shù)據(jù)、NeMo開源工具庫發(fā)布，英偉達為開發(fā)者按下「加速鍵」

英偉達還發(fā)布了面向?qū)I(yè)AI智能體開發(fā)者的訓練數(shù)據(jù)集與前沿強化學習庫集合。

3萬億Token規(guī)模的全新Nemotron預訓練、后訓練及強化學習數(shù)據(jù)集，為開發(fā)高性能特定領域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset則提供真實場景的遙測數(shù)據(jù)，幫助團隊評估并提升復雜智能體系統(tǒng)的安全性。

為加速開發(fā)進程，英偉達發(fā)布了NeMo Gym與NeMo RL開源庫，為Nemotron模型提供訓練環(huán)境及后訓練基礎，同時還推出用于驗證模型安全性和性能的NeMo Evaluator。所有工具及數(shù)據(jù)集現(xiàn)已上線GitHub和Hugging Face平臺。

Nemotron 3已獲得LM Studio、llama.cpp、SGLang和vLLM支持。此外，Prime Intellect與Unsloth正將NeMo Gym 的即用型訓練環(huán)境直接集成至其工作流，使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。

目前，Nemotron 3 Nano已上線Hugging Face平臺，并通過Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等推理服務商提供。

Nemotron還上線了多個企業(yè)級AI與數(shù)據(jù)基礎設施平臺，包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。Nemotron 3 Nano將通過Amazon Bedrock（無服務器模式）在亞馬遜云科技 (AWS) 平臺上提供給使用公有云的客戶，并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale及Yotta。

Nemotron 3 Nano同時以NVIDIA NIM形式提供，可以在英偉達加速基礎設施上進行安全、可擴展的部署，具有極高的隱私性與可控性。Nemotron 3 Super和Ultra預計將于 2026 年上半年推出。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

劉伊倫

編輯

微信YONGGANLL6662，歡迎交流

發(fā)私信

當月熱門文章