公布未來三年路線圖，黃仁勛把英偉達「逼到」極限

本文作者：包永剛

2024-06-03 15:48

導(dǎo)語：AI新一波浪潮是物理AI。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在COMPUTEX 2024開幕前，面向現(xiàn)場6500多名觀眾的演講，最引人注意的就是最新的產(chǎn)品路線圖。

黃仁勛展示了未來三年的產(chǎn)品路線圖，并首次公布下一代平臺Rubin。

看起來，黃仁勛將NVIDIA產(chǎn)品的更新節(jié)奏推向了技術(shù)的極限，近些年有類似節(jié)奏的公司是以消費市場為主的蘋果，這表達了NVIDIA“加速一切”決心的同時，也預(yù)示著AI應(yīng)用蓬勃發(fā)展的階段即將到來。

GPU架構(gòu)、網(wǎng)絡(luò)平臺Spectrum-X每年更新的同時，NVIDIA也在推動加速計算成本的降低、有降低AI應(yīng)用門檻的NIM推理微服務(wù)，以及推動AI新一波浪潮的機器人等。

可以越來越清晰的看到，NVIDIA要成為AI世界里的基石。

黃仁勛還給出預(yù)測，AI新一波浪潮是物理AI。

GPU、以太網(wǎng)網(wǎng)絡(luò)平臺每年更新

黃仁勛COMPUTEX 2024開幕前的演講，首次披露今年發(fā)布的Blackwell架構(gòu)的繼任平臺Rubin。

公布未來三年路線圖，黃仁勛把英偉達「逼到」極限

Rubin平臺將配備新 GPU、基于 Arm 的新 CPU — Vera，以及采用 NVLink 6、CX9 SuperNIC 和 X1600、并融合 InfiniBand/以太網(wǎng)交換機的高級網(wǎng)絡(luò)平臺。

根據(jù)NVIDIA的路線圖，2025年推出Blackwell Ultra GPU（8S HBM3e 12H）；2026年推出Rubin GPU（8S HBM4）；2027年推出Rubin Ultra GPU（12S HBM4）。

Rubin和Vera的命名均源自美國天文學(xué)家Vera Rubin。

“我展示的所有芯片都在百分之百在開發(fā)中?！秉S仁勛說，“NVIDIA的更新節(jié)奏以年為單位，所有架構(gòu)都是兼容的，以一年為周期，我們把所有東西推向技術(shù)極限?！?/strong>

黃仁勛稱以年為單位更新的基本理念非常簡單，打造數(shù)據(jù)中心規(guī)模，以每年的節(jié)奏分步驟實現(xiàn)、并向客戶交付產(chǎn)品，在各個領(lǐng)域?qū)崿F(xiàn)技術(shù)突破。

同樣計劃每年推出新產(chǎn)品的還有Spectrum-X產(chǎn)品。NVIDIA Spectrum-X 是全球首款專為 AI 打造的以太網(wǎng)網(wǎng)絡(luò)平臺，可將網(wǎng)絡(luò)性能較傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)平臺提升1.6倍。

Spectrum-X 為客戶提供更高的帶寬、更多的端口、更加強大的軟件功能集與可編程能力，不斷提高領(lǐng)先的AI以太網(wǎng)網(wǎng)絡(luò)性能。

網(wǎng)絡(luò)和存儲越來越成為限制AI發(fā)展的瓶頸。

NVIDIA網(wǎng)絡(luò)高級副總裁Gilad Shainer說：“生成式 AI 等開創(chuàng)性技術(shù)的飛速發(fā)展，使每家企業(yè)都必須把網(wǎng)絡(luò)創(chuàng)新放在第一位，從而獲得競爭優(yōu)勢。

Spectrum-X配備NVIDIA Spectrum SN5600以太網(wǎng)交換機和NVIDIA BlueField -3 SuperNIC，是一個兼顧了生成式 AI 云所需高性能和各種云功能的端到端平臺。

雷峰網(wǎng)了解到，率先采用NVIDIA Spectrum-X的AI云服務(wù)提供商有CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global 和 Yotta 等。

另外，戴爾科技、慧與、聯(lián)想和超微等之后，又有多家NVIDIA 合作伙伴也發(fā)布了基于 Spectrum 的產(chǎn)品，包括永擎電子（ASRock Rack）、華碩（ASUS）、技嘉科技（GIGABYTE）、鴻佰科技（Ingrasys）、英業(yè)達（Inventec）、和碩（Pegatron）、云達科技（QCT）、緯創(chuàng)（Wistron）和緯穎科技(Wiwynn)等。

MGX和NIM降A(chǔ)I應(yīng)用的軟硬件門檻

身處2024年更應(yīng)該意識到，AI的發(fā)展不僅需要GPU、CPU、網(wǎng)絡(luò)等關(guān)鍵組件，更需要一個易用且低成本的AI系統(tǒng)。

NVIDIA 正在降低將數(shù)據(jù)轉(zhuǎn)化為智能的成本。

“買的越多，省的越多。”黃仁勛說，CPU的性能擴展已經(jīng)大大放緩，NVIDIA通過GPU+CPU組合，實現(xiàn)了高達100倍的加速，同時功耗僅增加到3倍，成本僅增加到1.5倍，每瓦性能比單獨使用CPU提高25倍。

有更加直觀的數(shù)據(jù)，8年內(nèi)NVIDIA AI算力增加了1000倍，帶來的顯著收益是，比如訓(xùn)練1.8萬億參數(shù)、8萬億token的GPT-4，所需能耗從8年前Pascal架構(gòu)的1000GWh減少到Blackwell的3GWh，能耗僅為8年前的1/350。

生成Token的能耗，Blackwell架構(gòu)降至8年前Pascal架構(gòu)的1/45000。

用Pascal產(chǎn)生1 Token的能耗相當于2個200W燈泡運行2天，而現(xiàn)在1 Token只用0.4J能耗。

MGX降低AI工廠建立成本和時間

架構(gòu)演進帶來的優(yōu)勢最終還是需要以系統(tǒng)應(yīng)用的方式呈現(xiàn)，并且要以足夠低的軟硬件門檻。

為了加快不同規(guī)模和配置的系統(tǒng)開發(fā)，NVIDIA推出了MGX模塊化參考設(shè)計平臺，以便計算機制造商能夠以快速且低成本的方式構(gòu)建超過 100 種的系統(tǒng)設(shè)計配置。

制造商首先可根據(jù)其服務(wù)器機箱選擇一種基本的系統(tǒng)架構(gòu)，然后再根據(jù)不同的工作負載選擇 GPU、DPU 和 CPU。通過采用 MGX，開發(fā)成本大幅降低，較之前最多降低了四分之三，開發(fā)時間縮短到僅六個月，較之前減少了三分之二。

目前，已有超過 25 家合作伙伴的 90 多套已發(fā)布或正在開發(fā)中的系統(tǒng)使用了 MGX 參考架構(gòu)。AMD和英特爾也都支持MGX 架構(gòu)，并首次計劃打造基于他們自己 CPU 主機處理器的模塊設(shè)計。

“新一輪工業(yè)革命已經(jīng)開始。眾多企業(yè)和地區(qū)正在與 NVIDIA 合作推動價值萬億美元的傳統(tǒng)數(shù)據(jù)中心向加速計算轉(zhuǎn)型，并建造一種新型數(shù)據(jù)中心——AI 工廠來生產(chǎn)新的商品：人工智能。“黃仁勛宣布，NVIDIA MGX模塊化參考設(shè)計平臺加入了對 NVIDIA Blackwell 產(chǎn)品的支持，包括全新 NVIDIA GB200 NVL2 平臺，這些系統(tǒng)搭載 Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施，將幫助企業(yè)建立 AI 工廠和數(shù)據(jù)中心。

NIM讓2800萬開發(fā)者輕松創(chuàng)建AI應(yīng)用

有了AI工廠和數(shù)據(jù)中心，就擁有了激發(fā)AI創(chuàng)新的硬件基礎(chǔ)。

每個企業(yè)都希望在其運營中融入生成式 AI，但并非每個企業(yè)都擁有專門的 AI 研究團隊。

NVIDIA給出的解決方案是NIM，這是一種推理微服務(wù)，通過經(jīng)優(yōu)化的容器的形式提供模型——以部署在云、數(shù)據(jù)中心或工作站上。

借助 NVIDIA NIM，開發(fā)者能夠輕松地為 Copilots、聊天機器人等構(gòu)建生成式 AI 應(yīng)用，所需時間從數(shù)周縮短至幾分鐘，NVIDIA宣布全球2,800 萬開發(fā)者已經(jīng)可以下載 NVIDIA NIM。

NIM能幫助企業(yè)實現(xiàn)基礎(chǔ)設(shè)施投資的效果最大化。例如，與未使用 NIM 的情況相比，在NIM中運行Meta Llama 3-8B所能生成的加速基礎(chǔ)設(shè)施AI Token可以提升3倍。

據(jù)悉，從Meta Llama 3開始，在Hugging Face上現(xiàn)已開始提供 NIM，NVIDIA已經(jīng)在 Hugging Face上發(fā)布了全面優(yōu)化的Llama 3。

通過基于 NVIDIA GPU 的 Hugging Face 推理端點，只需點擊幾下，開發(fā)者就能在其選擇的云平臺上輕松地訪問和運行 Llama 3 NIM，能有效降低開發(fā)AI應(yīng)用的門檻。

企業(yè)可以使用 NIM 來運行用于生成文本、圖像和視頻、語音以及數(shù)字人的應(yīng)用。借助面向數(shù)字生物學(xué)的 NVIDIA BioNeMo NIM 微服務(wù)，研究人員可以構(gòu)建新的蛋白質(zhì)結(jié)構(gòu)，加速藥物研發(fā)。

目前Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家NVIDIA的技術(shù)合作伙伴正將NIM集成到他們的平臺中，加快生成式AI部署到特定領(lǐng)域應(yīng)用中的速度，例如Copilots、代碼助手、數(shù)字人虛擬形象等。

價值50萬億美元的工業(yè)數(shù)字化變革

AI將帶來的變革，觸手可及的是AI PC。

搭載RTX技術(shù)的NVIDIA RTX AI PC將通過200多款RTX AI筆記本電腦和500多款采用 AI 技術(shù)的應(yīng)用和游戲改變消費者的體驗。

NVIDIA還發(fā)布了搭載RTX的AI助手技術(shù)演示G-Assist 項目，展示了針對PC游戲和應(yīng)用的上下文感知輔助功能。

除了消費級市場，NVIDIA也將目光放到了價值 50 萬億美元的工業(yè)數(shù)字化變革。

面對各行各業(yè)采用自主運營和數(shù)字孿生，通過虛擬模型提高效率并降低成本對需求。NVIDIA 通過其開發(fā)者計劃提供對 NIM 的訪問權(quán)限，以促進 AI 創(chuàng)新。

黃仁勛展示了Foxconn利用NVIDIA Omniverse、Isaac 和 Metropolis 創(chuàng)建數(shù)字孿生，通過結(jié)合視覺AI與機器人開發(fā)工具來實現(xiàn)增強的機器人設(shè)施。

“AI新一波浪潮是物理AI。AI能夠理解物理定律，并與人類并肩作戰(zhàn)，”黃仁勛他強調(diào)了機器人和人工智能在未來發(fā)展中的重要性。

如今大多數(shù)AI并不理解物理定律，不以物質(zhì)世界為基礎(chǔ)。而生成圖像、視頻、3D圖形和許多物理現(xiàn)象，需要基于物理并理解物理定律的AI。

“機器人和物理 AI 正在成為現(xiàn)實，而不僅是出現(xiàn)在科幻小說。這真的令人興奮，”黃仁勛補充。

NVIDIA Isaac平臺為開發(fā)者構(gòu)建 AI 機器人提供強大的套件，包括由AI模型以及Jetson Orin、Thor 等超級計算機驅(qū)動的AMR、工業(yè)機械臂和人形機器人。

“機器人將遍布所有工廠。工廠將實現(xiàn)對機器人的統(tǒng)籌，而這些機器人將制造新的機器人產(chǎn)品，”黃仁勛同時強調(diào)NVIDIA Isaac 在提高工廠和倉庫效率方面的作用，比亞迪電子、西門子、泰瑞達、Intrinsic 等全球領(lǐng)先企業(yè)都在使用 NVIDIA Isaac 的高級程序庫和 AI 模型。

從核心組件到整個AI系統(tǒng)，NVIDIA已經(jīng)成為加速AI發(fā)展的基石。

同時，NVIDIA給出了AI新一波浪潮是物理AI也傳遞出NVIDIA對于未來的判斷與引領(lǐng)。雷峰網(wǎng)(公眾號：雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

computex2024 英偉達rubin 英偉達AI工廠

推理和機器人，哪一個才是英偉達「AI工廠」的增長故 ...

包永剛

編輯

發(fā)私信

當月熱門文章

熱鬧的存算一體芯片賽道里，后摩的競爭壁壘是什么？｜WAIC 2025

Arm罕見地提前發(fā)布GPU新技術(shù)，2026年將在手機上實現(xiàn)桌面級神經(jīng)技術(shù)

生產(chǎn)先進模型的「AI工廠」，有哪五大核心要素？｜WAIC 2025

AI PC進入全民創(chuàng)新時代？英特爾人工智能創(chuàng)新應(yīng)用大賽給出答案

最新文章

AI PC進入全民創(chuàng)新時代？英特爾人工智能創(chuàng)新應(yīng)用大賽給出答案

Arm罕見地提前發(fā)布GPU新技術(shù)，2026年將在手機上實現(xiàn)桌面級神經(jīng)技術(shù)

超20%的年均復(fù)合增長率，移動游戲硬件進入「第二曲線」｜ChinaJoy 2025

十載磨「芯」：云天勵飛沖擊港股AI推理芯片第一股

蓮花紫星算力項目縮水超9成；某國產(chǎn)全功能GPU性能對標H100；芯片公司40億建智算中心；華東大廠購入GB200丨算力情報局

H20限時返場，降價出售已成必然

熱門搜索

虛擬現(xiàn)實無人駕駛財報中科院 Siri ARM Groupon HoloLens 隱私奇點 Lyft