0
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在COMPUTEX 2024開幕前,面向現(xiàn)場(chǎng)6500多名觀眾的演講,最引人注意的就是最新的產(chǎn)品路線圖。
黃仁勛展示了未來三年的產(chǎn)品路線圖,并首次公布下一代平臺(tái)Rubin。
看起來,黃仁勛將NVIDIA產(chǎn)品的更新節(jié)奏推向了技術(shù)的極限,近些年有類似節(jié)奏的公司是以消費(fèi)市場(chǎng)為主的蘋果,這表達(dá)了NVIDIA“加速一切”決心的同時(shí),也預(yù)示著AI應(yīng)用蓬勃發(fā)展的階段即將到來。
GPU架構(gòu)、網(wǎng)絡(luò)平臺(tái)Spectrum-X每年更新的同時(shí),NVIDIA也在推動(dòng)加速計(jì)算成本的降低、有降低AI應(yīng)用門檻的NIM推理微服務(wù),以及推動(dòng)AI新一波浪潮的機(jī)器人等。
可以越來越清晰的看到,NVIDIA要成為AI世界里的基石。
黃仁勛還給出預(yù)測(cè),AI新一波浪潮是物理AI。
GPU、以太網(wǎng)網(wǎng)絡(luò)平臺(tái)每年更新
黃仁勛COMPUTEX 2024開幕前的演講,首次披露今年發(fā)布的Blackwell架構(gòu)的繼任平臺(tái)Rubin。
Rubin平臺(tái)將配備新 GPU、基于 Arm 的新 CPU — Vera,以及采用 NVLink 6、CX9 SuperNIC 和 X1600、并融合 InfiniBand/以太網(wǎng)交換機(jī)的高級(jí)網(wǎng)絡(luò)平臺(tái)。
根據(jù)NVIDIA的路線圖,2025年推出Blackwell Ultra GPU(8S HBM3e 12H);2026年推出Rubin GPU(8S HBM4);2027年推出Rubin Ultra GPU(12S HBM4)。
Rubin和Vera的命名均源自美國天文學(xué)家Vera Rubin。
“我展示的所有芯片都在百分之百在開發(fā)中?!秉S仁勛說,“NVIDIA的更新節(jié)奏以年為單位,所有架構(gòu)都是兼容的,以一年為周期,我們把所有東西推向技術(shù)極限。”
黃仁勛稱以年為單位更新的基本理念非常簡(jiǎn)單,打造數(shù)據(jù)中心規(guī)模,以每年的節(jié)奏分步驟實(shí)現(xiàn)、并向客戶交付產(chǎn)品,在各個(gè)領(lǐng)域?qū)崿F(xiàn)技術(shù)突破。
同樣計(jì)劃每年推出新產(chǎn)品的還有Spectrum-X產(chǎn)品。NVIDIA Spectrum-X 是全球首款專為 AI 打造的以太網(wǎng)網(wǎng)絡(luò)平臺(tái),可將網(wǎng)絡(luò)性能較傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)平臺(tái)提升1.6倍。
Spectrum-X 為客戶提供更高的帶寬、更多的端口、更加強(qiáng)大的軟件功能集與可編程能力,不斷提高領(lǐng)先的AI以太網(wǎng)網(wǎng)絡(luò)性能。
網(wǎng)絡(luò)和存儲(chǔ)越來越成為限制AI發(fā)展的瓶頸。
NVIDIA網(wǎng)絡(luò)高級(jí)副總裁Gilad Shainer說:“生成式 AI 等開創(chuàng)性技術(shù)的飛速發(fā)展,使每家企業(yè)都必須把網(wǎng)絡(luò)創(chuàng)新放在第一位,從而獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
Spectrum-X配備NVIDIA Spectrum SN5600以太網(wǎng)交換機(jī)和NVIDIA BlueField -3 SuperNIC,是一個(gè)兼顧了生成式 AI 云所需高性能和各種云功能的端到端平臺(tái)。
雷峰網(wǎng)了解到,率先采用NVIDIA Spectrum-X的AI云服務(wù)提供商有CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global 和 Yotta 等。
另外,戴爾科技、慧與、聯(lián)想和超微等之后,又有多家NVIDIA 合作伙伴也發(fā)布了基于 Spectrum 的產(chǎn)品,包括永擎電子(ASRock Rack)、華碩(ASUS)、技嘉科技(GIGABYTE)、鴻佰科技(Ingrasys)、英業(yè)達(dá)(Inventec)、和碩(Pegatron)、云達(dá)科技(QCT)、緯創(chuàng)(Wistron)和緯穎科技(Wiwynn)等。
MGX和NIM降A(chǔ)I應(yīng)用的軟硬件門檻
身處2024年更應(yīng)該意識(shí)到,AI的發(fā)展不僅需要GPU、CPU、網(wǎng)絡(luò)等關(guān)鍵組件,更需要一個(gè)易用且低成本的AI系統(tǒng)。
NVIDIA 正在降低將數(shù)據(jù)轉(zhuǎn)化為智能的成本。
“買的越多,省的越多。”黃仁勛說,CPU的性能擴(kuò)展已經(jīng)大大放緩,NVIDIA通過GPU+CPU組合,實(shí)現(xiàn)了高達(dá)100倍的加速,同時(shí)功耗僅增加到3倍,成本僅增加到1.5倍,每瓦性能比單獨(dú)使用CPU提高25倍。
有更加直觀的數(shù)據(jù),8年內(nèi)NVIDIA AI算力增加了1000倍,帶來的顯著收益是,比如訓(xùn)練1.8萬億參數(shù)、8萬億token的GPT-4,所需能耗從8年前Pascal架構(gòu)的1000GWh減少到Blackwell的3GWh,能耗僅為8年前的1/350。
生成Token的能耗,Blackwell架構(gòu)降至8年前Pascal架構(gòu)的1/45000。
用Pascal產(chǎn)生1 Token的能耗相當(dāng)于2個(gè)200W燈泡運(yùn)行2天,而現(xiàn)在1 Token只用0.4J能耗。
MGX降低AI工廠建立成本和時(shí)間
架構(gòu)演進(jìn)帶來的優(yōu)勢(shì)最終還是需要以系統(tǒng)應(yīng)用的方式呈現(xiàn),并且要以足夠低的軟硬件門檻。
為了加快不同規(guī)模和配置的系統(tǒng)開發(fā),NVIDIA推出了MGX模塊化參考設(shè)計(jì)平臺(tái),以便計(jì)算機(jī)制造商能夠以快速且低成本的方式構(gòu)建超過 100 種的系統(tǒng)設(shè)計(jì)配置。
制造商首先可根據(jù)其服務(wù)器機(jī)箱選擇一種基本的系統(tǒng)架構(gòu),然后再根據(jù)不同的工作負(fù)載選擇 GPU、DPU 和 CPU。通過采用 MGX,開發(fā)成本大幅降低,較之前最多降低了四分之三,開發(fā)時(shí)間縮短到僅六個(gè)月,較之前減少了三分之二。
目前,已有超過 25 家合作伙伴的 90 多套已發(fā)布或正在開發(fā)中的系統(tǒng)使用了 MGX 參考架構(gòu)。AMD和英特爾也都支持MGX 架構(gòu),并首次計(jì)劃打造基于他們自己 CPU 主機(jī)處理器的模塊設(shè)計(jì)。
“新一輪工業(yè)革命已經(jīng)開始。眾多企業(yè)和地區(qū)正在與 NVIDIA 合作推動(dòng)價(jià)值萬億美元的傳統(tǒng)數(shù)據(jù)中心向加速計(jì)算轉(zhuǎn)型,并建造一種新型數(shù)據(jù)中心——AI 工廠來生產(chǎn)新的商品:人工智能。“黃仁勛宣布,NVIDIA MGX模塊化參考設(shè)計(jì)平臺(tái)加入了對(duì) NVIDIA Blackwell 產(chǎn)品的支持,包括全新 NVIDIA GB200 NVL2 平臺(tái),這些系統(tǒng)搭載 Grace CPU 以及 NVIDIA 網(wǎng)絡(luò)和基礎(chǔ)設(shè)施,將幫助企業(yè)建立 AI 工廠和數(shù)據(jù)中心。
NIM讓2800萬開發(fā)者輕松創(chuàng)建AI應(yīng)用
有了AI工廠和數(shù)據(jù)中心,就擁有了激發(fā)AI創(chuàng)新的硬件基礎(chǔ)。
每個(gè)企業(yè)都希望在其運(yùn)營中融入生成式 AI,但并非每個(gè)企業(yè)都擁有專門的 AI 研究團(tuán)隊(duì)。
NVIDIA給出的解決方案是NIM,這是一種推理微服務(wù),通過經(jīng)優(yōu)化的容器的形式提供模型——以部署在云、數(shù)據(jù)中心或工作站上。
借助 NVIDIA NIM,開發(fā)者能夠輕松地為 Copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從數(shù)周縮短至幾分鐘,NVIDIA宣布全球2,800 萬開發(fā)者已經(jīng)可以下載 NVIDIA NIM。
NIM能幫助企業(yè)實(shí)現(xiàn)基礎(chǔ)設(shè)施投資的效果最大化。例如,與未使用 NIM 的情況相比,在NIM中運(yùn)行Meta Llama 3-8B所能生成的加速基礎(chǔ)設(shè)施AI Token可以提升3倍。
據(jù)悉,從Meta Llama 3開始,在Hugging Face上現(xiàn)已開始提供 NIM,NVIDIA已經(jīng)在 Hugging Face上發(fā)布了全面優(yōu)化的Llama 3。
通過基于 NVIDIA GPU 的 Hugging Face 推理端點(diǎn),只需點(diǎn)擊幾下,開發(fā)者就能在其選擇的云平臺(tái)上輕松地訪問和運(yùn)行 Llama 3 NIM,能有效降低開發(fā)AI應(yīng)用的門檻。
企業(yè)可以使用 NIM 來運(yùn)行用于生成文本、圖像和視頻、語音以及數(shù)字人的應(yīng)用。借助面向數(shù)字生物學(xué)的 NVIDIA BioNeMo NIM 微服務(wù),研究人員可以構(gòu)建新的蛋白質(zhì)結(jié)構(gòu),加速藥物研發(fā)。
目前Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家NVIDIA的技術(shù)合作伙伴正將NIM集成到他們的平臺(tái)中,加快生成式AI部署到特定領(lǐng)域應(yīng)用中的速度,例如Copilots、代碼助手、數(shù)字人虛擬形象等。
價(jià)值50萬億美元的工業(yè)數(shù)字化變革
AI將帶來的變革,觸手可及的是AI PC。
搭載RTX技術(shù)的NVIDIA RTX AI PC將通過200多款RTX AI筆記本電腦和500多款采用 AI 技術(shù)的應(yīng)用和游戲改變消費(fèi)者的體驗(yàn)。
NVIDIA還發(fā)布了搭載RTX的AI助手技術(shù)演示G-Assist 項(xiàng)目,展示了針對(duì)PC游戲和應(yīng)用的上下文感知輔助功能。
除了消費(fèi)級(jí)市場(chǎng),NVIDIA也將目光放到了價(jià)值 50 萬億美元的工業(yè)數(shù)字化變革。
面對(duì)各行各業(yè)采用自主運(yùn)營和數(shù)字孿生,通過虛擬模型提高效率并降低成本對(duì)需求。NVIDIA 通過其開發(fā)者計(jì)劃提供對(duì) NIM 的訪問權(quán)限,以促進(jìn) AI 創(chuàng)新。
黃仁勛展示了Foxconn利用NVIDIA Omniverse、Isaac 和 Metropolis 創(chuàng)建數(shù)字孿生,通過結(jié)合視覺AI與機(jī)器人開發(fā)工具來實(shí)現(xiàn)增強(qiáng)的機(jī)器人設(shè)施。
“AI新一波浪潮是物理AI。AI能夠理解物理定律,并與人類并肩作戰(zhàn),”黃仁勛他強(qiáng)調(diào)了機(jī)器人和人工智能在未來發(fā)展中的重要性。
如今大多數(shù)AI并不理解物理定律,不以物質(zhì)世界為基礎(chǔ)。而生成圖像、視頻、3D圖形和許多物理現(xiàn)象,需要基于物理并理解物理定律的AI。
“機(jī)器人和物理 AI 正在成為現(xiàn)實(shí),而不僅是出現(xiàn)在科幻小說。這真的令人興奮,”黃仁勛補(bǔ)充。
NVIDIA Isaac平臺(tái)為開發(fā)者構(gòu)建 AI 機(jī)器人提供強(qiáng)大的套件,包括由AI模型以及Jetson Orin、Thor 等超級(jí)計(jì)算機(jī)驅(qū)動(dòng)的AMR、工業(yè)機(jī)械臂和人形機(jī)器人。
“機(jī)器人將遍布所有工廠。工廠將實(shí)現(xiàn)對(duì)機(jī)器人的統(tǒng)籌,而這些機(jī)器人將制造新的機(jī)器人產(chǎn)品,”黃仁勛同時(shí)強(qiáng)調(diào)NVIDIA Isaac 在提高工廠和倉庫效率方面的作用,比亞迪電子、西門子、泰瑞達(dá)、Intrinsic 等全球領(lǐng)先企業(yè)都在使用 NVIDIA Isaac 的高級(jí)程序庫和 AI 模型。
從核心組件到整個(gè)AI系統(tǒng),NVIDIA已經(jīng)成為加速AI發(fā)展的基石。
同時(shí),NVIDIA給出了AI新一波浪潮是物理AI也傳遞出NVIDIA對(duì)于未來的判斷與引領(lǐng)。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。