1
本文作者: 三川 | 2017-05-11 08:23 | 專題:GTC 2017【直播】 |
編者按:北京時(shí)間 5 月 11 日 00:00,萬(wàn)眾矚目的英偉達(dá) CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場(chǎng)長(zhǎng)達(dá)兩個(gè)多小時(shí),本場(chǎng)主題演講的話題涉獵面其實(shí)很廣: VR、Volta、超算、GPU 云服務(wù)、自動(dòng)駕駛芯片、以及機(jī)器人訓(xùn)練。英偉達(dá)也恰恰在 GTC 舉辦的同時(shí),公布了2017年第一季度的財(cái)報(bào)。財(cái)務(wù)數(shù)據(jù)顯示,NVIDIA在2017第一季度營(yíng)收同比增長(zhǎng)48%,達(dá)到19.4億美元??磥?lái),英偉達(dá)已經(jīng)如同老黃所說(shuō),已完全轉(zhuǎn)型成為領(lǐng)先的 AI 企業(yè)。
今年的 NVIDIA GTC 開發(fā)者大會(huì),與往年頗有些不同。
北京時(shí)間 5 月 11 日 00:00,萬(wàn)眾矚目的英偉達(dá) CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場(chǎng)長(zhǎng)達(dá)兩個(gè)多小時(shí),雷鋒網(wǎng)記者在媒體中第一位入場(chǎng),坐在了前排中央。然而,整場(chǎng)演講下來(lái),老黃并沒(méi)有一句提到游戲。
本場(chǎng)主題演講的話題涉獵面其實(shí)很廣: VR、Volta、超算、GPU 云服務(wù)、自動(dòng)駕駛芯片、以及機(jī)器人訓(xùn)練。但是,所有這些話題都有一個(gè)共同點(diǎn):要么基于 AI、深度學(xué)習(xí)技術(shù),要么為 AI、深度學(xué)習(xí)技術(shù)服務(wù)。
英偉達(dá)也恰恰在 GTC 舉辦的同時(shí),公布了2017年第一季度的財(cái)報(bào)。財(cái)務(wù)數(shù)據(jù)顯示,NVIDIA在2017第一季度營(yíng)收同比增長(zhǎng)48%,達(dá)到19.4億美元。在過(guò)去一年里,NVIDIA致力于深度學(xué)習(xí)的計(jì)算系統(tǒng)解決方案極大推動(dòng)了語(yǔ)音識(shí)別、機(jī)器視覺(jué)、虛擬助手、自動(dòng)駕駛等領(lǐng)域的發(fā)展,而其在各行各業(yè)的核心開發(fā)者也成為這家“核彈公司”源源不斷的增長(zhǎng)動(dòng)力。
看來(lái),英偉達(dá)已經(jīng)如同老黃所說(shuō),已完全轉(zhuǎn)型成為領(lǐng)先的 AI 企業(yè)。本屆 GTC 的主題,便是 AI & 深度學(xué)習(xí)。當(dāng)然,還有劃時(shí)代的深度學(xué)習(xí)硬件 Volta。下面,便是本屆 GTC 英偉達(dá)發(fā)布的五大革命性產(chǎn)品:Project Holodeck、Volta、英偉達(dá) GPU 云、Xavier DLA,以及 Isaac 機(jī)器人模擬機(jī)。
Project Holodeck 是老黃發(fā)布的第一個(gè)產(chǎn)品,堪稱是本屆 GTC 的開胃菜。它將 VR 和 AI 的頂尖技術(shù)相結(jié)合,所構(gòu)建的 VR 社交、工作空間。它有三大特點(diǎn):
照片級(jí)逼真的視覺(jué)
物理交互
協(xié)作
其中最大的亮點(diǎn),無(wú)疑是物理交互體驗(yàn)。老黃表示,虛擬共享空間必須要遵從物理定律,否則就無(wú)從營(yíng)造真實(shí)世界般的沉浸感。相比之下,同屬 VR 社交空間應(yīng)用的 Facebook Spaces,并沒(méi)有這么強(qiáng)調(diào)物理屬性。
英偉達(dá)與頂級(jí)跑車制造商科尼塞克合作,甚至請(qǐng)科尼塞克創(chuàng)始人 Christian Koenigsegg 利用 VR 化身(上圖中的虛擬人)“現(xiàn)身”說(shuō)法。
演示中,有兩個(gè)細(xì)節(jié)值得我們注意:
當(dāng) VR 化身觸摸方向盤時(shí),其“手掌”并不會(huì)像網(wǎng)游那樣穿過(guò)方向盤,而是能實(shí)實(shí)在在地握住它。雷鋒網(wǎng)獲知,用戶還能在 Project Holodeck 里舉起東西。這充分展示了“物理交互”。
Project Holodeck 導(dǎo)入了科尼塞克最新車型(上圖)的全部三維數(shù)據(jù)——不僅僅是外觀,還有內(nèi)飾、零件。隨老黃一聲令下,整部車分解成一個(gè)個(gè)的獨(dú)立零件;展示了讓 VR “不止于社交”的可能性。
Project Holodeck 將于 9 月開放早鳥體驗(yàn)。
沒(méi)錯(cuò),Volta 終于來(lái)了。繼 Pascal (帕斯卡)之后的新一代 GPU 架構(gòu),在萬(wàn)眾期待下亮相。對(duì)于絕大多數(shù)觀眾,不論 GTC 推出了多少 AI 工具,都無(wú)法遮掩 Volta 作為本屆大會(huì)心臟的事實(shí)。
畢竟,英偉達(dá)今后二至三年的 GPU 產(chǎn)品線,全都要由 Volta 供血。雖然 Volta 架構(gòu)的游戲顯卡最快在今年底才可能與大家見(jiàn)面,但通過(guò)深度學(xué)習(xí)卡,也可一窺 Volta 的滿血性能。那么在本屆 GTC,英偉達(dá)推出了哪些基于 Volta 的產(chǎn)品?
答案是 Tesla V100,以及基于它的深度學(xué)習(xí)計(jì)算機(jī) DGX-1 和 DGX Station。
“迄今為止英偉達(dá)難度最高、最復(fù)雜的項(xiàng)目;
耗費(fèi)數(shù)千工程師數(shù)年光陰來(lái)完成;
全世界有史以來(lái)最昂貴的計(jì)算機(jī)項(xiàng)目(研發(fā)支出為 30 億美元)?!?/p>
說(shuō)的就是 Tesla V100,基于新一代 Volta 架構(gòu)。但英偉達(dá)在它身上實(shí)現(xiàn)的壯舉遠(yuǎn)不止與此:
Tesla V100 的芯片面積是驚人的 815 平方毫米,約等于一塊 Apple Watch,真正達(dá)到光刻技術(shù)的極限。老黃說(shuō):“不可能做出比這再大的 GPU 芯片……我把這看做是幾乎‘不可能實(shí)現(xiàn)的’,是制造技術(shù)的一項(xiàng)不可思議的驚人績(jī)業(yè)?!?/p>
來(lái)自三星的 16GB HBM2 顯存,帶寬達(dá)到驚人的 900 GB/s。
詳細(xì)規(guī)格見(jiàn)下圖:
相比 Pascal,Volta 有全新的張量運(yùn)算指令,這就是 Tensor Core。
它既是指令也是數(shù)據(jù)格式,是 4*4 的矩陣處理陣列。它使得 Volta 的訓(xùn)練吞吐量達(dá)到了 Pascal 的 12 倍,推理吞吐量達(dá)到 6 倍。借助它,Tesla V100 的張量運(yùn)算能力達(dá)到 120 TFLOPS。
它是 Volta 的高性能神經(jīng)網(wǎng)絡(luò)推理引擎,或者說(shuō)編譯器。目的是為推理運(yùn)算快速地優(yōu)化、驗(yàn)證、部署訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)。
老黃解釋道:”訓(xùn)練完成之后,用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的框架會(huì)生成圖。圖需要為你使用的處理器進(jìn)行優(yōu)化、編譯。我們把這稱為 TensorRT?!?/p>
眾所周知,深度學(xué)習(xí)運(yùn)算可被分為訓(xùn)練和推理兩部分。從前, N 卡只關(guān)注訓(xùn)練,而在 Tesla V100 上,英偉達(dá)終于對(duì)推理“動(dòng)真格”。老黃表示,從 Volta 開始,英偉達(dá) GPU 將對(duì)訓(xùn)練、推理兼顧,可謂是革命性的突破。如圖所示,Tesla V100 的推理運(yùn)算速度是 Skylake CPU 的十余倍不止。CPU、FPGA 和 TPU 們怕了么?
這是 Tesla K80、P100 與 V100 三代架構(gòu)的性能對(duì)比。在 Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet 三大框架上,V100 取得了數(shù)倍的性能提升。以 Caffe2 為例,訓(xùn)練時(shí)間由 K80 的 40 多小時(shí),縮減到 V100 的不到 10 小時(shí)。
深度學(xué)習(xí)超級(jí)計(jì)算機(jī) DGX-1 也把 GPU 升級(jí)為 Volta,這便是 DGX-1V。
它內(nèi)置八塊 Tesla V100,運(yùn)算能力為驚人的 960 Tensor TFLOPS。老黃表示,過(guò)去 Titan X 需花費(fèi)八天訓(xùn)練的神經(jīng)網(wǎng)絡(luò),用 DGX-1V 只需八個(gè)小時(shí)。它相當(dāng)于是“把 400 個(gè)服務(wù)器裝進(jìn)一個(gè)盒子里”。
售價(jià) 149000 美元,即日起接受預(yù)定,第三季度出貨。
DGX Station 則是縮小版的 DGX-1V,老黃稱其為“Personal DGX”,堪稱是終極深度學(xué)習(xí)PC。英偉達(dá)內(nèi)部已經(jīng)使用很久,每個(gè)工程師要么有 DGX-1V,要么有 DGX Station,再要么兩個(gè)都有。這次,老黃決心把它推向市場(chǎng)。
它內(nèi)置四塊 Tesla V100,運(yùn)算力因而是 DGX-1V 的一半。1500W 功耗,使用水冷。售價(jià) 69000 美刀。
另外一個(gè)基于 Tesla V100 的新硬件產(chǎn)品是 HGX-1。這是英偉達(dá)與微軟合作開發(fā)的公有云服務(wù)器。老黃聲稱,這是業(yè)內(nèi)首個(gè)堪稱標(biāo)桿的云圖形加速器。它內(nèi)置八塊 Tesla V100,設(shè)計(jì)時(shí)就考慮了公有云服務(wù)器必需的多種任務(wù)處理與全能性。
“這是世界上首個(gè)混合深度學(xué)習(xí)云平臺(tái)”,老黃說(shuō)。
每一名深度學(xué)習(xí)工程師大概都深有體會(huì):在一臺(tái)設(shè)備上創(chuàng)建、設(shè)置開發(fā)環(huán)境并不是一件省心的事。這花費(fèi)的時(shí)間可能是整整一天,可能是一個(gè)星期、一個(gè)月,也可能灰心喪氣干脆放棄。
為解決這一開發(fā)者的痛點(diǎn),英偉達(dá)推出了 GPU 云。它的亮點(diǎn)非常直接——在幾分鐘內(nèi)設(shè)置好本地開發(fā)環(huán)境。而這,只需要打包下載一整套英偉達(dá)優(yōu)化、整合好的深度學(xué)習(xí)軟件包。開發(fā)者所有需要的庫(kù)和框架都包含在內(nèi),并且用容器 NVDocker 隔離。
它支持全部深度學(xué)習(xí)開發(fā)框架。當(dāng)然,為利用云端成白上千 GPU 的強(qiáng)大計(jì)算力,開發(fā)者可一鍵在英偉達(dá) GPU 云設(shè)立開發(fā)環(huán)境,上傳工作進(jìn)度。
英偉達(dá) GPU 云 將在七月公測(cè)。
Xavier 是英偉達(dá)的自動(dòng)駕駛 AI 處理器。它的創(chuàng)新之處在于,整合了 CPU、GPU 以及 DLA 三大處理器的優(yōu)點(diǎn):
雷鋒網(wǎng)注:DLA 即深度學(xué)習(xí)加速器,前段時(shí)間很火的谷歌 TPU,便是 DLA。
Xavier 同時(shí)具備 CPU 的單線程性能,CUDA 的并行加速能力,以及 DLA 的計(jì)算機(jī)視覺(jué)特殊功能。
老黃宣布,為加速深度學(xué)習(xí)技術(shù)的普及和進(jìn)步,將開源 Xavier DLA 供所有開發(fā)者使用、修改。初期版本將在 7 月開放,完整版本將于 9 月公開。
Isaac (艾薩克)這個(gè)名字,來(lái)自于兩個(gè)人:一是象征物理學(xué)的艾薩克·牛頓,二是象征 AI 的艾薩克·阿西莫夫。這是英偉達(dá)傾力打造的終極機(jī)器人 AI 虛擬訓(xùn)練環(huán)境。
在真實(shí)世界人為訓(xùn)練機(jī)器人有先天的局限性:人力成本過(guò)高,風(fēng)險(xiǎn)大,耗時(shí)長(zhǎng),效率極低。解決的方案,便是在虛擬環(huán)境進(jìn)行機(jī)器人訓(xùn)練。這有點(diǎn)類似于訓(xùn)練智能體的模擬器 Deepmind Lab 和 OpenAI Gym。事實(shí)上,Isaac 直接連通 OpenAI Gym,借助后者的強(qiáng)化學(xué)習(xí)功能。
充分利用了英偉達(dá)在物理引擎上的造詣,老黃表示,Isaac 的目標(biāo)是打造一個(gè)遵從物理定律的“alternate universe”(替代空間)。虛擬訓(xùn)練空間將完全遵從現(xiàn)實(shí)世界的物理定律,除了時(shí)間。理想的情況是,在模擬機(jī)中學(xué)習(xí)過(guò)的機(jī)器人,就相當(dāng)于已經(jīng)預(yù)訓(xùn)練過(guò)。
而在時(shí)間上,機(jī)器人 AI 將以多重“分身”在 Isaac 中進(jìn)行訓(xùn)練,每輪訓(xùn)練中最聰明的那一個(gè),將進(jìn)入下一輪分配給每個(gè)智能體;再?gòu)闹羞x出表現(xiàn)最好的那一個(gè)進(jìn)入下一輪,取代上一輪的所有智能體……
如此往復(fù),以訓(xùn)練出最聰明的機(jī)器人 AI。
與GTC第一天的內(nèi)容集中在圖像處理不同,在兩個(gè)小時(shí)的演講中里,只有在開場(chǎng)不久列舉深度學(xué)習(xí)對(duì)圖像處理效果的改善以及中途演示《最終幻想》兩處與圖像處理有關(guān),其他的時(shí)間中,老黃大談特談的是AI,是深度學(xué)習(xí),是計(jì)算能力,是數(shù)據(jù)中心,是為開發(fā)者提供更有效的硬件與平臺(tái)。
在2016年,得益于人工智能紅利,英偉達(dá)股價(jià)累計(jì)漲幅接近200%,成為標(biāo)普500指數(shù)漲幅第一名。而在這次GTC大會(huì)上,老黃的演講再一次贏得了資本市場(chǎng)——在演講中,英偉達(dá)的股價(jià)一直上升,到收盤時(shí)漲幅為17.83%,市值達(dá)到了720億美元。
如同黃仁勛開場(chǎng)所言:我們需要找到摩爾定律之后的路。在摩爾定律實(shí)效、微處理器增速降低到每年10%的今天,GPU 計(jì)算的崛起已經(jīng)在引領(lǐng)著人工智能的革命。有這樣一組數(shù)據(jù)可以佐證:在過(guò)去5年中,GTC參會(huì)者增加了3倍,增長(zhǎng)到7000人;GPU開發(fā)者增長(zhǎng)11倍,增長(zhǎng)到超過(guò)50萬(wàn)人......而這一切對(duì)于英偉達(dá)來(lái)說(shuō)只是一個(gè)時(shí)代的開始。
關(guān)注雷鋒網(wǎng)微信「leiphone-sz」,回復(fù)「0511」,獲得現(xiàn)場(chǎng)完整PPT。
相關(guān)文章:
Nvidia推出視頻分析平臺(tái)Metropolis,讓你化身未來(lái)城市中的“江湖百曉生” | GTC 2017
Nvidia GTC大會(huì)首日現(xiàn)場(chǎng)直擊:立足圖形計(jì)算,更多想象 | GTC 2017
Nvidia 發(fā)布VRWorks Audio SDK,欲解決VR音效這個(gè)大難題 | GTC 2017
科大訊飛:攜手NVIDIA后,應(yīng)用領(lǐng)域效率提升了50倍 | GTC 2017
GTC大會(huì)第二日亮點(diǎn):NVIDIA將推出多用戶VR系統(tǒng),計(jì)劃培養(yǎng)100000名開發(fā)人員 | GTC 2017
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章