0
“生成式AI的意義是什么?它讓計算機語言走向民主,未來幾乎所有的事物都會有一個大語言模型,人類語言將成為新的編程語言,人人都可以是程序員?!?/p>
在昨晚英偉達舉行的計算機圖形年會SIGGRAPH上,黃仁勛進一步闡釋了“生成式AI是AI的iPhone時刻”的看法,并甩出一些系列重磅產品持續(xù)為生成式AI提供支持。
包括發(fā)布為加速計算和生成式AI而生的處理器GH200 Grace Hopper超級芯片;宣布與初創(chuàng)企業(yè)Hugging Face一起為數(shù)百萬開發(fā)者提供生成式AI超級計算,幫助構建大模型等高級AI應用;對Omniverse進行升級,加入對生成式AI和OpenUSD的支持以實現(xiàn)工業(yè)數(shù)字化等。
在努力推動生成式AI成為新一代計算平臺的路上,英偉達每一次都很用力。
配備最快內存,GH200降低大模型推理成本
"買得越多,省得越多”,黃教主在SIGGRAPH上多次重復這一銷售金句,向全世界推銷英偉達最新打造的新一代Grace Hopper超級芯片NVIDIA GH200,并稱其為生成式AI而生。
根據(jù)黃仁勛的介紹,Grace Hopper超級芯片NVIDIA GH200由72核Grace CPU和4PFLOPS Hopper GPU組成,并配備全球最快的內存HBM3e,內存容量達到141GB,提供每秒5TB的帶寬,每個GPU的容量能夠達到NVIDIA H100 GPU的1.7倍,帶寬達到H100的1.55倍。
與當前一代產品相比,雙配置的內存容量增加了3.5倍,帶寬增加了3倍,包括一臺具144個Arm Neoverse核心、8PFLOPS計算性能的GPU、282GB HBM3e內存技術的單服務器,如果將連接到CPU的LPDDR內存包括在內,那么總共集成了1.2TB超快內存。
GH200是組建面向生成式AI服務器的基本單元,每個GH200芯片配備NVIDIA BlueField-3和ConnectX-7網(wǎng)卡、8通道4.6TB高速內存,組成一個Grace Hopper機架,16個機架組成一個NVIDIA DGX GH200,并通過NVLink Switch系統(tǒng)連成集群。
由256塊GH200組成的NVIDIA DGX GH200 SuperPod,擁有高達1EFLOPS的算力和144TB高速內存。
多個DGX SuperPod高速互聯(lián),即可組建成面向生成式AI的Grace HopperAI超級計算機,與其他數(shù)據(jù)中心比起來,購買Grace Hopper AI超級計算機,客戶可以用更低的成本獲得同等算力。
以1億美元能夠買到的數(shù)據(jù)中心為例,在過去1億美元能夠買8800塊 x86 CPU組成的數(shù)據(jù)中心,功耗是5MW,但如今1億美元能夠買2500塊GH200組成的Iso-Troughput數(shù)據(jù)中心,功耗是3MW,且AI推理能力能夠達到過去CPU系統(tǒng)的12倍,能效達20倍。
如果要實現(xiàn)過去1億美元能夠買到的x86 CPU數(shù)據(jù)中心所實現(xiàn)的AI推理性能,Iso-Troughput數(shù)據(jù)中心只需要用到210塊GH200,功耗為0.26MW,花費800萬美元即可。
黃仁勛表示,領先的系統(tǒng)制造商預計將在2024年第二季度交付基于該平臺的系統(tǒng)。
服務百萬開發(fā)者,企業(yè)握住屬于自己的AI命脈
除了推出新一代處理器,英偉達還宣布了與Hugging Face建立合作伙伴關系,為數(shù)百萬開發(fā)者提供生成式AI超級計算服務,幫助其構建大語言模型(LLM)和其他高級AI應用。
Hugging Face 平臺讓開發(fā)者能夠利用開源資源構建、訓練和部署最先進的 AI 模型。目前有超過 15,000 家企業(yè)機構正在使用 Hugging Face,社區(qū)共享了超過 25 萬個模型和 5 萬個數(shù)據(jù)集。
基于此次合作,開發(fā)者能夠使用Hugging Face平臺內的NVIDIA DGX Cloud AI超級計算為高級AI模型進行訓練及調優(yōu),借助為智能聊天機器人、搜索、摘要等特定行業(yè)應用的業(yè)務數(shù)據(jù)定制的大語言模型(LLM),推動生成式 AI 在各個行業(yè)中的應用。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“研究人員和開發(fā)者是正在改變每個行業(yè)的生成式 AI 的核心力量。Hugging Face 與 NVIDIA 正在將全球最大的 AI 社區(qū)與 NVIDIA 在全球領先云環(huán)境中的 AI 計算平臺相連接。通過雙方的合作,Hugging Face 社區(qū)用戶只需要點擊一下鼠標,就可以使用 NVIDIA AI 計算。”
作為合作的一部分,Hugging Face 將提供一項名為“訓練集群即服務(Training Cluster as a Service)”的新服務,用以簡化企業(yè)創(chuàng)建新的自定義生成式 AI 模型的過程。
該服務由 NVIDIA DGX Cloud 提供支持,每個 DGX Cloud 實例均配備 8 顆 NVIDIA H100 或 A100 80GB Tensor Core GPU,每個節(jié)點的 GPU 總內存為 640GB,附加英偉達專家支持,且將在未來幾個月內推出。
Omniverse升級,實現(xiàn)更復雜的3D模擬
英偉達同時也在Omniverse方面做出重要更新,讓開發(fā)者能夠通過OpenUSD,利用生成式AI來加強自身工具,并讓企業(yè)能夠構建更大、更復雜的世界級模擬,以此作為其工業(yè)應用的數(shù)據(jù)測試場。
OpenUSD起源于皮克斯動畫工作室,原本是一項高性能3D場景描述技術,能夠為各種數(shù)據(jù)和工作流帶來了強大的可操作性。英偉達、蘋果、Adobe 和 Autodesk在近期聯(lián)合成立OpenUSD聯(lián)盟以統(tǒng)一OpenUSD規(guī)范,用以推動構建虛擬世界。
此次大會上,英偉達發(fā)布了四款全新的Omniverse Cloud API,幫助開發(fā)者更加無縫地實施和部署OpenUSD流程與應用。
面向開發(fā)人員的大型語言模型 (LLM) copilot工具ChatUSD,可以回答USD知識問題或生成 Python-USD 代碼腳本;
RunUSD將OpenUSD文件轉換為完全路徑跟蹤渲染的圖像,并使用Omniverse Cloud生成渲染;
DeepSearch可在海量無標記資產數(shù)據(jù)庫中進行快速語義搜索;
USD-GDN Publisher可以助力企業(yè)和軟件制造商發(fā)布基于OpenUSD 的高保真體驗,并實時傳輸?shù)骄W(wǎng)絡瀏覽器和移動設備。
面對工業(yè)應用對3D框架提出的不同要求,英偉達正在開發(fā)NVIDIA Omniverse(用于開發(fā)應用程序的OpenUSD原生軟件平臺),以及地理空間數(shù)據(jù)模型、度量組件、SimReady、OpenUSD 規(guī)范等,以支持高度復雜的工業(yè)與感知AI工作負載。
目前,可以同NVIDIA OpenUSD開發(fā)者計劃搶先體驗 OpenUSD 服務、資源和工具。
當然,英偉達為推動生成式AI做出的努力遠不止如此,其中還包括在此次SIGGRAPH上發(fā)布的三款專業(yè)級桌面顯卡RTX 5000、RTX 4500和RTX 4000,為專業(yè)人士提供最新的AI、圖形和實時渲染技術,以及發(fā)布NVIDIA OVX服務器,用于幫助加速計算密集型應用,包括AI訓練與推理、3D 設計與可視化、視頻處理以及工業(yè)數(shù)字化等......
“人人都是程序員”的時代,已近在眼前。(雷峰網(wǎng)(公眾號:雷峰網(wǎng)))
相關文章:
首款消費級「國潮」顯卡進入公開市場,性能追平英偉達六年前入門級
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。