1
本文作者: 三川 | 2017-05-11 08:23 | 專題:GTC 2017【直播】 |
編者按:北京時間 5 月 11 日 00:00,萬眾矚目的英偉達 CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場長達兩個多小時,本場主題演講的話題涉獵面其實很廣: VR、Volta、超算、GPU 云服務、自動駕駛芯片、以及機器人訓練。英偉達也恰恰在 GTC 舉辦的同時,公布了2017年第一季度的財報。財務數(shù)據(jù)顯示,NVIDIA在2017第一季度營收同比增長48%,達到19.4億美元??磥恚ミ_已經(jīng)如同老黃所說,已完全轉型成為領先的 AI 企業(yè)。
今年的 NVIDIA GTC 開發(fā)者大會,與往年頗有些不同。
北京時間 5 月 11 日 00:00,萬眾矚目的英偉達 CEO 黃仁勛 Keynote 演講,在加州圣何塞舉行。全場長達兩個多小時,雷鋒網(wǎng)記者在媒體中第一位入場,坐在了前排中央。然而,整場演講下來,老黃并沒有一句提到游戲。
本場主題演講的話題涉獵面其實很廣: VR、Volta、超算、GPU 云服務、自動駕駛芯片、以及機器人訓練。但是,所有這些話題都有一個共同點:要么基于 AI、深度學習技術,要么為 AI、深度學習技術服務。
英偉達也恰恰在 GTC 舉辦的同時,公布了2017年第一季度的財報。財務數(shù)據(jù)顯示,NVIDIA在2017第一季度營收同比增長48%,達到19.4億美元。在過去一年里,NVIDIA致力于深度學習的計算系統(tǒng)解決方案極大推動了語音識別、機器視覺、虛擬助手、自動駕駛等領域的發(fā)展,而其在各行各業(yè)的核心開發(fā)者也成為這家“核彈公司”源源不斷的增長動力。
看來,英偉達已經(jīng)如同老黃所說,已完全轉型成為領先的 AI 企業(yè)。本屆 GTC 的主題,便是 AI & 深度學習。當然,還有劃時代的深度學習硬件 Volta。下面,便是本屆 GTC 英偉達發(fā)布的五大革命性產品:Project Holodeck、Volta、英偉達 GPU 云、Xavier DLA,以及 Isaac 機器人模擬機。
Project Holodeck 是老黃發(fā)布的第一個產品,堪稱是本屆 GTC 的開胃菜。它將 VR 和 AI 的頂尖技術相結合,所構建的 VR 社交、工作空間。它有三大特點:
照片級逼真的視覺
物理交互
協(xié)作
其中最大的亮點,無疑是物理交互體驗。老黃表示,虛擬共享空間必須要遵從物理定律,否則就無從營造真實世界般的沉浸感。相比之下,同屬 VR 社交空間應用的 Facebook Spaces,并沒有這么強調物理屬性。
英偉達與頂級跑車制造商科尼塞克合作,甚至請科尼塞克創(chuàng)始人 Christian Koenigsegg 利用 VR 化身(上圖中的虛擬人)“現(xiàn)身”說法。
演示中,有兩個細節(jié)值得我們注意:
當 VR 化身觸摸方向盤時,其“手掌”并不會像網(wǎng)游那樣穿過方向盤,而是能實實在在地握住它。雷鋒網(wǎng)獲知,用戶還能在 Project Holodeck 里舉起東西。這充分展示了“物理交互”。
Project Holodeck 導入了科尼塞克最新車型(上圖)的全部三維數(shù)據(jù)——不僅僅是外觀,還有內飾、零件。隨老黃一聲令下,整部車分解成一個個的獨立零件;展示了讓 VR “不止于社交”的可能性。
Project Holodeck 將于 9 月開放早鳥體驗。
沒錯,Volta 終于來了。繼 Pascal (帕斯卡)之后的新一代 GPU 架構,在萬眾期待下亮相。對于絕大多數(shù)觀眾,不論 GTC 推出了多少 AI 工具,都無法遮掩 Volta 作為本屆大會心臟的事實。
畢竟,英偉達今后二至三年的 GPU 產品線,全都要由 Volta 供血。雖然 Volta 架構的游戲顯卡最快在今年底才可能與大家見面,但通過深度學習卡,也可一窺 Volta 的滿血性能。那么在本屆 GTC,英偉達推出了哪些基于 Volta 的產品?
答案是 Tesla V100,以及基于它的深度學習計算機 DGX-1 和 DGX Station。
“迄今為止英偉達難度最高、最復雜的項目;
耗費數(shù)千工程師數(shù)年光陰來完成;
全世界有史以來最昂貴的計算機項目(研發(fā)支出為 30 億美元)。”
說的就是 Tesla V100,基于新一代 Volta 架構。但英偉達在它身上實現(xiàn)的壯舉遠不止與此:
Tesla V100 的芯片面積是驚人的 815 平方毫米,約等于一塊 Apple Watch,真正達到光刻技術的極限。老黃說:“不可能做出比這再大的 GPU 芯片……我把這看做是幾乎‘不可能實現(xiàn)的’,是制造技術的一項不可思議的驚人績業(yè)?!?/p>
來自三星的 16GB HBM2 顯存,帶寬達到驚人的 900 GB/s。
詳細規(guī)格見下圖:
相比 Pascal,Volta 有全新的張量運算指令,這就是 Tensor Core。
它既是指令也是數(shù)據(jù)格式,是 4*4 的矩陣處理陣列。它使得 Volta 的訓練吞吐量達到了 Pascal 的 12 倍,推理吞吐量達到 6 倍。借助它,Tesla V100 的張量運算能力達到 120 TFLOPS。
它是 Volta 的高性能神經(jīng)網(wǎng)絡推理引擎,或者說編譯器。目的是為推理運算快速地優(yōu)化、驗證、部署訓練好的神經(jīng)網(wǎng)絡。
老黃解釋道:”訓練完成之后,用于訓練神經(jīng)網(wǎng)絡的框架會生成圖。圖需要為你使用的處理器進行優(yōu)化、編譯。我們把這稱為 TensorRT。“
眾所周知,深度學習運算可被分為訓練和推理兩部分。從前, N 卡只關注訓練,而在 Tesla V100 上,英偉達終于對推理“動真格”。老黃表示,從 Volta 開始,英偉達 GPU 將對訓練、推理兼顧,可謂是革命性的突破。如圖所示,Tesla V100 的推理運算速度是 Skylake CPU 的十余倍不止。CPU、FPGA 和 TPU 們怕了么?
這是 Tesla K80、P100 與 V100 三代架構的性能對比。在 Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet 三大框架上,V100 取得了數(shù)倍的性能提升。以 Caffe2 為例,訓練時間由 K80 的 40 多小時,縮減到 V100 的不到 10 小時。
深度學習超級計算機 DGX-1 也把 GPU 升級為 Volta,這便是 DGX-1V。
它內置八塊 Tesla V100,運算能力為驚人的 960 Tensor TFLOPS。老黃表示,過去 Titan X 需花費八天訓練的神經(jīng)網(wǎng)絡,用 DGX-1V 只需八個小時。它相當于是“把 400 個服務器裝進一個盒子里”。
售價 149000 美元,即日起接受預定,第三季度出貨。
DGX Station 則是縮小版的 DGX-1V,老黃稱其為“Personal DGX”,堪稱是終極深度學習PC。英偉達內部已經(jīng)使用很久,每個工程師要么有 DGX-1V,要么有 DGX Station,再要么兩個都有。這次,老黃決心把它推向市場。
它內置四塊 Tesla V100,運算力因而是 DGX-1V 的一半。1500W 功耗,使用水冷。售價 69000 美刀。
另外一個基于 Tesla V100 的新硬件產品是 HGX-1。這是英偉達與微軟合作開發(fā)的公有云服務器。老黃聲稱,這是業(yè)內首個堪稱標桿的云圖形加速器。它內置八塊 Tesla V100,設計時就考慮了公有云服務器必需的多種任務處理與全能性。
“這是世界上首個混合深度學習云平臺”,老黃說。
每一名深度學習工程師大概都深有體會:在一臺設備上創(chuàng)建、設置開發(fā)環(huán)境并不是一件省心的事。這花費的時間可能是整整一天,可能是一個星期、一個月,也可能灰心喪氣干脆放棄。
為解決這一開發(fā)者的痛點,英偉達推出了 GPU 云。它的亮點非常直接——在幾分鐘內設置好本地開發(fā)環(huán)境。而這,只需要打包下載一整套英偉達優(yōu)化、整合好的深度學習軟件包。開發(fā)者所有需要的庫和框架都包含在內,并且用容器 NVDocker 隔離。
它支持全部深度學習開發(fā)框架。當然,為利用云端成白上千 GPU 的強大計算力,開發(fā)者可一鍵在英偉達 GPU 云設立開發(fā)環(huán)境,上傳工作進度。
英偉達 GPU 云 將在七月公測。
Xavier 是英偉達的自動駕駛 AI 處理器。它的創(chuàng)新之處在于,整合了 CPU、GPU 以及 DLA 三大處理器的優(yōu)點:
雷鋒網(wǎng)注:DLA 即深度學習加速器,前段時間很火的谷歌 TPU,便是 DLA。
Xavier 同時具備 CPU 的單線程性能,CUDA 的并行加速能力,以及 DLA 的計算機視覺特殊功能。
老黃宣布,為加速深度學習技術的普及和進步,將開源 Xavier DLA 供所有開發(fā)者使用、修改。初期版本將在 7 月開放,完整版本將于 9 月公開。
Isaac (艾薩克)這個名字,來自于兩個人:一是象征物理學的艾薩克·牛頓,二是象征 AI 的艾薩克·阿西莫夫。這是英偉達傾力打造的終極機器人 AI 虛擬訓練環(huán)境。
在真實世界人為訓練機器人有先天的局限性:人力成本過高,風險大,耗時長,效率極低。解決的方案,便是在虛擬環(huán)境進行機器人訓練。這有點類似于訓練智能體的模擬器 Deepmind Lab 和 OpenAI Gym。事實上,Isaac 直接連通 OpenAI Gym,借助后者的強化學習功能。
充分利用了英偉達在物理引擎上的造詣,老黃表示,Isaac 的目標是打造一個遵從物理定律的“alternate universe”(替代空間)。虛擬訓練空間將完全遵從現(xiàn)實世界的物理定律,除了時間。理想的情況是,在模擬機中學習過的機器人,就相當于已經(jīng)預訓練過。
而在時間上,機器人 AI 將以多重“分身”在 Isaac 中進行訓練,每輪訓練中最聰明的那一個,將進入下一輪分配給每個智能體;再從中選出表現(xiàn)最好的那一個進入下一輪,取代上一輪的所有智能體……
如此往復,以訓練出最聰明的機器人 AI。
與GTC第一天的內容集中在圖像處理不同,在兩個小時的演講中里,只有在開場不久列舉深度學習對圖像處理效果的改善以及中途演示《最終幻想》兩處與圖像處理有關,其他的時間中,老黃大談特談的是AI,是深度學習,是計算能力,是數(shù)據(jù)中心,是為開發(fā)者提供更有效的硬件與平臺。
在2016年,得益于人工智能紅利,英偉達股價累計漲幅接近200%,成為標普500指數(shù)漲幅第一名。而在這次GTC大會上,老黃的演講再一次贏得了資本市場——在演講中,英偉達的股價一直上升,到收盤時漲幅為17.83%,市值達到了720億美元。
如同黃仁勛開場所言:我們需要找到摩爾定律之后的路。在摩爾定律實效、微處理器增速降低到每年10%的今天,GPU 計算的崛起已經(jīng)在引領著人工智能的革命。有這樣一組數(shù)據(jù)可以佐證:在過去5年中,GTC參會者增加了3倍,增長到7000人;GPU開發(fā)者增長11倍,增長到超過50萬人......而這一切對于英偉達來說只是一個時代的開始。
關注雷鋒網(wǎng)微信「leiphone-sz」,回復「0511」,獲得現(xiàn)場完整PPT。
相關文章:
Nvidia推出視頻分析平臺Metropolis,讓你化身未來城市中的“江湖百曉生” | GTC 2017
Nvidia GTC大會首日現(xiàn)場直擊:立足圖形計算,更多想象 | GTC 2017
Nvidia 發(fā)布VRWorks Audio SDK,欲解決VR音效這個大難題 | GTC 2017
科大訊飛:攜手NVIDIA后,應用領域效率提升了50倍 | GTC 2017
GTC大會第二日亮點:NVIDIA將推出多用戶VR系統(tǒng),計劃培養(yǎng)100000名開發(fā)人員 | GTC 2017
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。
本專題其他文章