0
本文作者: 吳優(yōu) | 2021-11-10 09:14 |
“什么是最偉大的?”
“最偉大的是那些善待他人的人?!?/p>
在英偉達(dá) GTC 2021 大會(huì)上,黃仁勛的開幕演講以一段極具哲學(xué)性和未來感的對(duì)話畫上句號(hào)。
回答者不是黃仁勛本人,而是以黃仁勛為原型的對(duì)話式虛擬形象——Toy Jensen。黃仁勛在開幕演講中介紹,這一虛擬形象是基于目前訓(xùn)練的最大自然語(yǔ)言處理模型和光線追蹤的精美圖像而合成實(shí)時(shí)形象。
“有了最近才實(shí)現(xiàn)的一些驚人技術(shù),Toy-me 得以打造而成,而這些技術(shù)在以前看來幾乎都是不可能實(shí)現(xiàn)的?!?/p>
Toy Jensen 的呈現(xiàn),透露了英偉達(dá)的元宇宙愿景,此外,按照慣例,英偉達(dá)還在此次GTC上推出了一系列AI技術(shù)與產(chǎn)品:
目前為止最先進(jìn)的端到端的網(wǎng)絡(luò)平臺(tái) Quantum-2,多節(jié)點(diǎn)分布式推理功能的 NVIDIA Triton 推理服務(wù)器,NVIDIA A2 Tensor Core GPU加速器,全球最小、功能最強(qiáng)大、能效最高的下一代超級(jí)計(jì)算機(jī)NVIDIA Jetson AGX Orin 等系列產(chǎn)品等等。
Omniverse 更新升級(jí),加速 2D 互聯(lián)網(wǎng)向 3D 演變
在去年的 GTC 大會(huì)上,英偉達(dá)宣布推出 Omniverse,并介紹其為世界上第一個(gè)基于英偉達(dá) RTX 的三維仿真和協(xié)作平臺(tái),融合了物理和虛擬世界,實(shí)時(shí)模擬現(xiàn)實(shí)并具有真實(shí)感的細(xì)節(jié),無論是藝術(shù)家還是人工智能,都能夠在不同世界使用不同的工具,共同創(chuàng)造一個(gè)全新的世界。
經(jīng)歷近一年的發(fā)展,已經(jīng)有 70000 多名創(chuàng)作者下載,500 多家公司的專業(yè)人士使用 Omniverse 公測(cè)版,寶馬集團(tuán)、CannonDesign、Epigraph、Ericsson、建筑公司 HKS 和 KPF、Lockheed Martin 以及 Sony Pictures Animation 都包括在內(nèi)。
其中,Ericsson 正在使用 Omniverse 平臺(tái)創(chuàng)建數(shù)字孿生,模擬和可視化信號(hào)傳播,以加速 5G 網(wǎng)絡(luò)的功能開發(fā)和洞察。
與此同時(shí),Omniverse 本身也隨之更新升級(jí)。
Omniverse Avatar 是英偉達(dá)推出的一個(gè)能夠用于生成交互式 AI 虛擬化身的技術(shù)平臺(tái),連接英偉達(dá)語(yǔ)音 AI、計(jì)算機(jī)視覺、自然語(yǔ)言理解、推薦引擎和模擬方面技術(shù),即將 Metropolis 的感知能力、Riva 的語(yǔ)音識(shí)別能力、Merlin 的推薦能力、Omniverse 的動(dòng)畫渲染能力等交匯于一體。
其中,NVIDIA Riva 語(yǔ)音 AI 軟件新增了一項(xiàng) Riva 定制語(yǔ)音功能,只需要 30 分鐘的音頻數(shù)據(jù),就能在一天之內(nèi)打造類似真人的定制語(yǔ)音,幾乎類似于科幻愛情電影《她》中的薩曼莎,擁有斯嘉麗的迷人聲線,且擁有超強(qiáng)的學(xué)習(xí)能力。
落地到具體應(yīng)用中,企業(yè)可以使用 Riva 定制語(yǔ)音打造專屬語(yǔ)音的虛擬助理,開發(fā)具有辨識(shí)度的品牌語(yǔ)音,開發(fā)者也可以借助其創(chuàng)建各種各樣的應(yīng)用程序,為有語(yǔ)言障礙的人提供支持。
基于 Omniverse Avatar 這一平臺(tái),原本處于 2D 狀態(tài)的虛擬助手就有能力變成一個(gè)擁有常識(shí)、推理能力和生動(dòng)的 3D 視覺形象,理解多種語(yǔ)言,且在同人類的交流中給出更加智能的回答。正如在直播中看到的那樣,當(dāng)英偉達(dá)的 3 位工作人員分別向 Toy Jensen 提出有關(guān)氣候變化、天文學(xué)以及生物蛋白質(zhì)等棘手的問題時(shí),這個(gè)小家伙都能對(duì)答如流。
再者,英偉達(dá)演示了基于對(duì)話操作臺(tái) Tokkio 基于 Omniverse Avatar 平臺(tái)的應(yīng)用程序,當(dāng)餐廳有兩位顧客同時(shí)點(diǎn)餐時(shí),客戶服務(wù)的虛擬化身能夠同顧客進(jìn)行眼神交流,并根據(jù)兩位顧客的用餐需求給出推薦菜單。
而 Omniverse 本身,也更新了4大功能,包括 Showroom、Farm、AR和VR。
其中,Showroom 作為 Omniverse 公測(cè)版中的應(yīng)用程序提供,允許非技術(shù)用戶使用 Omniverse 技術(shù)演示,展示平臺(tái)的實(shí)時(shí)物理和渲染技術(shù);
Farm 允許團(tuán)隊(duì)同時(shí)使用多個(gè)工作站或服務(wù)器,為渲染、合成數(shù)據(jù)生成或文件轉(zhuǎn)換等任務(wù)提供支持;
VR 推出領(lǐng)先的完全圖像、光線追蹤 VR,支持開發(fā)者在平臺(tái)上構(gòu)建自己的 VR 功能,最終用戶可以直接享受 VR 功能;AR 同理。
另外,英偉達(dá)還宣布 Omniverse Enterprise 已進(jìn)入正式發(fā)布階段。它允許跨多個(gè)軟件套件工作的全球 3D 設(shè)計(jì)團(tuán)隊(duì)在共享虛擬空間中通過任意設(shè)備實(shí)時(shí)協(xié)作。Omniverse 的生態(tài)系統(tǒng)正在不斷擴(kuò)展。
最新 Triton 推理服務(wù)器,助力實(shí)時(shí)大型語(yǔ)言模型開發(fā)與部署
構(gòu)建交流如此自如的 Toy Jensen,同樣離不開強(qiáng)大的自然語(yǔ)言處理模型,其背后的技術(shù)邏輯也在此次大會(huì)上得以展現(xiàn)。
英偉達(dá)推出了為訓(xùn)練具有數(shù)萬(wàn)億參數(shù)的語(yǔ)言模型而優(yōu)化的 NVIDIA NeMo Megatron 框架,為新領(lǐng)域和語(yǔ)言進(jìn)行訓(xùn)練的可定制大型語(yǔ)言模型(LLM)Megatron 530B 以及具有多 GPU、多節(jié)點(diǎn)分布式推理能力的 NVIDIA Triton 推理服務(wù)器。
而基于這些工具,不僅僅能構(gòu)建 Toy Jensen,企業(yè)也可以建立自己的、特定領(lǐng)域的聊天機(jī)器人、個(gè)人助理以及其他 AI 應(yīng)用程序,高水平理解語(yǔ)言中細(xì)微的差別。
NVIDIA NeMo Megatron 是在 Megatron 的基礎(chǔ)上發(fā)展起來的開源項(xiàng)目,由 NVIDIA 研究人員主導(dǎo),研究大型轉(zhuǎn)換語(yǔ)言模型的高效訓(xùn)練。Megatron 530B 是世界上最大的可定制語(yǔ)言模型。
NeMo Megatron 框架經(jīng)過優(yōu)化,可以在 NVIDIA DGX SuperPOD 的大規(guī)模加速計(jì)算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。
有了大型語(yǔ)音模型,如何存儲(chǔ)和運(yùn)行呢?尤其是這些模型對(duì)內(nèi)存的需求極大,超過單個(gè) GPU 甚至是多個(gè)GPU 服務(wù)器所能夠提供給的內(nèi)存,且在實(shí)際應(yīng)用中對(duì)推理實(shí)時(shí)性要求較高。
NVIDIA Triton 推理服務(wù)器的出現(xiàn)解決這一問題,英偉達(dá)在此次大會(huì)上發(fā)布的最新 NVIDIA Triton 具有多 GPU、多節(jié)點(diǎn)特性,使大型語(yǔ)言模型推理工作負(fù)載能夠?qū)崟r(shí)在多個(gè) GPU 和節(jié)點(diǎn)上擴(kuò)展。
借助 Triton 推理服務(wù)器,Megatron 530B 能在兩個(gè) NVIDIA DGX 系統(tǒng)上運(yùn)行,將處理時(shí)間從 CPU 服務(wù)器上的 1 分鐘以上縮短到 0.5 秒,令實(shí)時(shí)部署部署大型語(yǔ)言模型成為可能。
事實(shí)上已經(jīng)有不少企業(yè)在使用 NVIDIA DGX SuperPOD 構(gòu)建大型復(fù)雜語(yǔ)言模型,SiDi、京東探索研究院和VinBrai都包括在內(nèi)。
其他AI新進(jìn)展:Quantum-2 和 Jentson AGX Orin
展望元宇宙的英偉達(dá),在其他產(chǎn)品線方面也保持著持續(xù)更新。
首先是推出了可進(jìn)行云原生超級(jí)計(jì)算的 Quantum-2 平臺(tái),即 400Gbps 的 InfiniBand 網(wǎng)絡(luò)平臺(tái),包括 NVIDIA Quantum-2 交換機(jī)、ConnectX-7 網(wǎng)卡、BlueField-3 數(shù)據(jù)處理器 DPU(數(shù)據(jù)處理器)和所有支持這種新架構(gòu)的軟件。這也是迄今為止最先進(jìn)的端到端網(wǎng)絡(luò)平臺(tái)。ConnectX-7 將于明年1月問世。
其中,Quantum-2 InfiniBand 交換機(jī)基于新的 Quantum-2 ASIC,采用臺(tái)積電 7nm 節(jié)點(diǎn),包含 570 億個(gè)晶體管,超過有 540 億晶體管的 A100 GPU。
Quantum-2 InfiniBand 擁有 400Gbps 的高吞吐量,將網(wǎng)絡(luò)速度提高 1 倍,網(wǎng)絡(luò)端口數(shù)量增加了 3 倍。它在性能提升 3 倍的同時(shí),還將對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)所需的交換機(jī)數(shù)量減少了 6 倍,于此同時(shí),數(shù)據(jù)中心的能耗和空間各減少了 7%。
另外,全球最小、功能強(qiáng)大、能效最高的新一代 AI 超級(jí)計(jì)算機(jī) NVIDIA Jetson AGX Orin,算力高達(dá) 200TOPS ,用于機(jī)器人、自主機(jī)器、醫(yī)療器械和其他形式的邊緣嵌入式計(jì)算。
Jetson AGX Orin 基于 NVIDIA Ampere 架構(gòu),與其前身 Jetson AGX Xavier 保持外形和引腳兼容性一直,不過處理能力擴(kuò)大至 6 倍,每秒可提供 200 萬(wàn)億次操作,它類似于支持 GPU 的服務(wù)器,但大小僅相當(dāng)于人的手掌。
新的 Jetson 計(jì)算機(jī)可加速完整的 NVIDIA AI 軟件棧,使開發(fā)人員能夠部署最大、最復(fù)雜的模型,以解決自然語(yǔ)言理解、3D 感知、多傳感器融合等邊緣 AI 和機(jī)器人任務(wù)。
小結(jié)
上周,英偉達(dá)市值突破7000億美元,不少分析師稱其市值上漲的背后,是元宇宙在助力,此次GT C大會(huì)上表現(xiàn)也確實(shí)證明,英偉達(dá)以其Omniverse平臺(tái)為基礎(chǔ),構(gòu)建了一個(gè)元宇宙愿景。
不過,不要忘了,英偉達(dá)依然是一家在AI和高性能計(jì)算領(lǐng)域有深厚積累的科技公司,除了火熱的元宇宙外,此次大會(huì)期間,也將有更多有關(guān)加速計(jì)算、深度學(xué)習(xí)領(lǐng)域的內(nèi)容呈現(xiàn)。
雷鋒網(wǎng)
相關(guān)文章:
英偉達(dá)市值超 7000 億美元,元宇宙成引擎|雷鋒網(wǎng)
英偉達(dá) AI 軟件新進(jìn)展,AI Enterprise 全球上市
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。