0
本文作者: 吳優(yōu) | 2023-08-09 17:51 |
“生成式AI的意義是什么?它讓計(jì)算機(jī)語言走向民主,未來幾乎所有的事物都會有一個大語言模型,人類語言將成為新的編程語言,人人都可以是程序員?!?/p>
在昨晚英偉達(dá)舉行的計(jì)算機(jī)圖形年會SIGGRAPH上,黃仁勛進(jìn)一步闡釋了“生成式AI是AI的iPhone時刻”的看法,并甩出一些系列重磅產(chǎn)品持續(xù)為生成式AI提供支持。
包括發(fā)布為加速計(jì)算和生成式AI而生的處理器GH200 Grace Hopper超級芯片;宣布與初創(chuàng)企業(yè)Hugging Face一起為數(shù)百萬開發(fā)者提供生成式AI超級計(jì)算,幫助構(gòu)建大模型等高級AI應(yīng)用;對Omniverse進(jìn)行升級,加入對生成式AI和OpenUSD的支持以實(shí)現(xiàn)工業(yè)數(shù)字化等。
在努力推動生成式AI成為新一代計(jì)算平臺的路上,英偉達(dá)每一次都很用力。
配備最快內(nèi)存,GH200降低大模型推理成本
"買得越多,省得越多”,黃教主在SIGGRAPH上多次重復(fù)這一銷售金句,向全世界推銷英偉達(dá)最新打造的新一代Grace Hopper超級芯片NVIDIA GH200,并稱其為生成式AI而生。
根據(jù)黃仁勛的介紹,Grace Hopper超級芯片NVIDIA GH200由72核Grace CPU和4PFLOPS Hopper GPU組成,并配備全球最快的內(nèi)存HBM3e,內(nèi)存容量達(dá)到141GB,提供每秒5TB的帶寬,每個GPU的容量能夠達(dá)到NVIDIA H100 GPU的1.7倍,帶寬達(dá)到H100的1.55倍。
與當(dāng)前一代產(chǎn)品相比,雙配置的內(nèi)存容量增加了3.5倍,帶寬增加了3倍,包括一臺具144個Arm Neoverse核心、8PFLOPS計(jì)算性能的GPU、282GB HBM3e內(nèi)存技術(shù)的單服務(wù)器,如果將連接到CPU的LPDDR內(nèi)存包括在內(nèi),那么總共集成了1.2TB超快內(nèi)存。
GH200是組建面向生成式AI服務(wù)器的基本單元,每個GH200芯片配備NVIDIA BlueField-3和ConnectX-7網(wǎng)卡、8通道4.6TB高速內(nèi)存,組成一個Grace Hopper機(jī)架,16個機(jī)架組成一個NVIDIA DGX GH200,并通過NVLink Switch系統(tǒng)連成集群。
由256塊GH200組成的NVIDIA DGX GH200 SuperPod,擁有高達(dá)1EFLOPS的算力和144TB高速內(nèi)存。
多個DGX SuperPod高速互聯(lián),即可組建成面向生成式AI的Grace HopperAI超級計(jì)算機(jī),與其他數(shù)據(jù)中心比起來,購買Grace Hopper AI超級計(jì)算機(jī),客戶可以用更低的成本獲得同等算力。
以1億美元能夠買到的數(shù)據(jù)中心為例,在過去1億美元能夠買8800塊 x86 CPU組成的數(shù)據(jù)中心,功耗是5MW,但如今1億美元能夠買2500塊GH200組成的Iso-Troughput數(shù)據(jù)中心,功耗是3MW,且AI推理能力能夠達(dá)到過去CPU系統(tǒng)的12倍,能效達(dá)20倍。
如果要實(shí)現(xiàn)過去1億美元能夠買到的x86 CPU數(shù)據(jù)中心所實(shí)現(xiàn)的AI推理性能,Iso-Troughput數(shù)據(jù)中心只需要用到210塊GH200,功耗為0.26MW,花費(fèi)800萬美元即可。
黃仁勛表示,領(lǐng)先的系統(tǒng)制造商預(yù)計(jì)將在2024年第二季度交付基于該平臺的系統(tǒng)。
服務(wù)百萬開發(fā)者,企業(yè)握住屬于自己的AI命脈
除了推出新一代處理器,英偉達(dá)還宣布了與Hugging Face建立合作伙伴關(guān)系,為數(shù)百萬開發(fā)者提供生成式AI超級計(jì)算服務(wù),幫助其構(gòu)建大語言模型(LLM)和其他高級AI應(yīng)用。
Hugging Face 平臺讓開發(fā)者能夠利用開源資源構(gòu)建、訓(xùn)練和部署最先進(jìn)的 AI 模型。目前有超過 15,000 家企業(yè)機(jī)構(gòu)正在使用 Hugging Face,社區(qū)共享了超過 25 萬個模型和 5 萬個數(shù)據(jù)集。
基于此次合作,開發(fā)者能夠使用Hugging Face平臺內(nèi)的NVIDIA DGX Cloud AI超級計(jì)算為高級AI模型進(jìn)行訓(xùn)練及調(diào)優(yōu),借助為智能聊天機(jī)器人、搜索、摘要等特定行業(yè)應(yīng)用的業(yè)務(wù)數(shù)據(jù)定制的大語言模型(LLM),推動生成式 AI 在各個行業(yè)中的應(yīng)用。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“研究人員和開發(fā)者是正在改變每個行業(yè)的生成式 AI 的核心力量。Hugging Face 與 NVIDIA 正在將全球最大的 AI 社區(qū)與 NVIDIA 在全球領(lǐng)先云環(huán)境中的 AI 計(jì)算平臺相連接。通過雙方的合作,Hugging Face 社區(qū)用戶只需要點(diǎn)擊一下鼠標(biāo),就可以使用 NVIDIA AI 計(jì)算?!?/p>
作為合作的一部分,Hugging Face 將提供一項(xiàng)名為“訓(xùn)練集群即服務(wù)(Training Cluster as a Service)”的新服務(wù),用以簡化企業(yè)創(chuàng)建新的自定義生成式 AI 模型的過程。
該服務(wù)由 NVIDIA DGX Cloud 提供支持,每個 DGX Cloud 實(shí)例均配備 8 顆 NVIDIA H100 或 A100 80GB Tensor Core GPU,每個節(jié)點(diǎn)的 GPU 總內(nèi)存為 640GB,附加英偉達(dá)專家支持,且將在未來幾個月內(nèi)推出。
Omniverse升級,實(shí)現(xiàn)更復(fù)雜的3D模擬
英偉達(dá)同時也在Omniverse方面做出重要更新,讓開發(fā)者能夠通過OpenUSD,利用生成式AI來加強(qiáng)自身工具,并讓企業(yè)能夠構(gòu)建更大、更復(fù)雜的世界級模擬,以此作為其工業(yè)應(yīng)用的數(shù)據(jù)測試場。
OpenUSD起源于皮克斯動畫工作室,原本是一項(xiàng)高性能3D場景描述技術(shù),能夠?yàn)楦鞣N數(shù)據(jù)和工作流帶來了強(qiáng)大的可操作性。英偉達(dá)、蘋果、Adobe 和 Autodesk在近期聯(lián)合成立OpenUSD聯(lián)盟以統(tǒng)一OpenUSD規(guī)范,用以推動構(gòu)建虛擬世界。
此次大會上,英偉達(dá)發(fā)布了四款全新的Omniverse Cloud API,幫助開發(fā)者更加無縫地實(shí)施和部署OpenUSD流程與應(yīng)用。
面向開發(fā)人員的大型語言模型 (LLM) copilot工具ChatUSD,可以回答USD知識問題或生成 Python-USD 代碼腳本;
RunUSD將OpenUSD文件轉(zhuǎn)換為完全路徑跟蹤渲染的圖像,并使用Omniverse Cloud生成渲染;
DeepSearch可在海量無標(biāo)記資產(chǎn)數(shù)據(jù)庫中進(jìn)行快速語義搜索;
USD-GDN Publisher可以助力企業(yè)和軟件制造商發(fā)布基于OpenUSD 的高保真體驗(yàn),并實(shí)時傳輸?shù)骄W(wǎng)絡(luò)瀏覽器和移動設(shè)備。
面對工業(yè)應(yīng)用對3D框架提出的不同要求,英偉達(dá)正在開發(fā)NVIDIA Omniverse(用于開發(fā)應(yīng)用程序的OpenUSD原生軟件平臺),以及地理空間數(shù)據(jù)模型、度量組件、SimReady、OpenUSD 規(guī)范等,以支持高度復(fù)雜的工業(yè)與感知AI工作負(fù)載。
目前,可以同NVIDIA OpenUSD開發(fā)者計(jì)劃搶先體驗(yàn) OpenUSD 服務(wù)、資源和工具。
當(dāng)然,英偉達(dá)為推動生成式AI做出的努力遠(yuǎn)不止如此,其中還包括在此次SIGGRAPH上發(fā)布的三款專業(yè)級桌面顯卡RTX 5000、RTX 4500和RTX 4000,為專業(yè)人士提供最新的AI、圖形和實(shí)時渲染技術(shù),以及發(fā)布NVIDIA OVX服務(wù)器,用于幫助加速計(jì)算密集型應(yīng)用,包括AI訓(xùn)練與推理、3D 設(shè)計(jì)與可視化、視頻處理以及工業(yè)數(shù)字化等......
“人人都是程序員”的時代,已近在眼前。(雷峰網(wǎng)(公眾號:雷峰網(wǎng)))
相關(guān)文章:
AI的「iPhone時刻」后,英偉達(dá)打開生成式模型「魔盒」
首款消費(fèi)級「國潮」顯卡進(jìn)入公開市場,性能追平英偉達(dá)六年前入門級
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。