0
本文作者: 谷磊 | 2017-04-15 16:28 |
近日(4月12日),雷鋒網(wǎng)受邀參加了英偉達(dá)在北京國家會(huì)議中心舉行媒體發(fā)布會(huì)。會(huì)上英偉達(dá)展示了其發(fā)布不久的基于Pascal 架構(gòu)的Quadro系列顯卡,包括:GP100、P2000、P4000、P5000、P6000 等。不同于Geforce的消費(fèi)級娛樂定位,Quadro立足高端,面向?qū)I(yè)級的需求,英偉達(dá)的愿景是讓它們能夠?qū)⑴_式工作站轉(zhuǎn)變?yōu)榫哂型黄菩阅芰Φ某売?jì)算機(jī),并為不同行業(yè)的專業(yè)任務(wù)提供保障。
Quadro系列顯卡(雷鋒網(wǎng)現(xiàn)場拍攝)
Pascal 架構(gòu)的全新NVIDIA Quadro產(chǎn)品陣容致力于為企業(yè)提供視覺計(jì)算平臺,簡化設(shè)計(jì)和仿真工作流程。與上一代產(chǎn)品相比,新Quadro產(chǎn)品不僅具有超快速內(nèi)存,而且速度最多可以提升兩倍(基于SPECviewperf 12 基準(zhǔn)的計(jì)算結(jié)果)。
其中GP100為該系列的旗艦產(chǎn)品,被科技媒體和粉絲們稱為超當(dāng)量核彈。
Quadro GP100參數(shù)及系列特點(diǎn)
GP100
GP100基于 Pascal 核心,匹配16GB HBM2顯存,單精度CUDA核心數(shù) 3584個(gè),雙精度CUDA核心數(shù) 1792個(gè),半精/單精/雙精浮點(diǎn)運(yùn)算性能分別是20TFLOPS、10TFLOPS和5TFLOPS,帶寬高達(dá)720GB/s,功耗235W 。同其他新發(fā)布的專業(yè)卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、Iray VR),同時(shí)還強(qiáng)化了虛擬化、Sync II、雙路NVlink等。
這也是NVlink首次在Windows系統(tǒng)上獲得支持,此前僅僅用于IBM Power8系統(tǒng)和基于Linux的DGX-1,帶寬最高80GB/s。
這個(gè)系列官方給出的特點(diǎn)如下:
統(tǒng)一仿真、HPC、渲染和設(shè)計(jì) – GP100將前所未有的雙精度性能與16GB的高帶寬內(nèi)存(HBM2)相結(jié)合,因此用戶可以在設(shè)計(jì)過程中進(jìn)行仿真,并以前所未有的速度采集逼真的多物理場仿真。客戶能夠?qū)蓚€(gè)GP100 GPU與NVLink?技術(shù)相結(jié)合,并擴(kuò)展到32GB的HBM2,以在單一工作站上創(chuàng)建龐大的可視化計(jì)算解決方案。
擴(kuò)展后的Quadro P6000(雷鋒網(wǎng)現(xiàn)場拍攝)
探索深度學(xué)習(xí) – GP100提供超過20 TFLOPS的半精度計(jì)算,可謂在Windows和Linux環(huán)境中進(jìn)行深度學(xué)習(xí)的理想開發(fā)平臺。
將VR集成到設(shè)計(jì)和仿真工作流程中 – VR 認(rèn)證的Quadro GP100和P4000具有創(chuàng)建詳細(xì)、逼真、沉浸式環(huán)境的能力,能夠大規(guī)模實(shí)現(xiàn)更加宏大、更加復(fù)雜的設(shè)計(jì)體驗(yàn)。
盡享照片級真實(shí)感設(shè)計(jì)的優(yōu)勢 – 基于Pascal 架構(gòu)的Quadro GPU 渲染照片級真實(shí)感圖像的速度為CPU的18倍 。
創(chuàng)建廣闊的可視化工作區(qū) – 可在多達(dá)四個(gè)5K顯示器上以高分辨率和HDR顏色顯示數(shù)據(jù)。
經(jīng)濟(jì)高效地構(gòu)建超高分辨率及多顯示屏配置 – 通過將多達(dá)8個(gè)P4000 GPU和兩個(gè)Quadro Sync II顯卡相結(jié)合,可通過單一機(jī)箱實(shí)現(xiàn)多達(dá)32個(gè)4K顯示器的配置。
Sandeep Gupte
CAE(Computer Aided Engineering)指工程設(shè)計(jì)中的計(jì)算機(jī)輔助工程。英偉達(dá)專業(yè)可視化業(yè)務(wù)高級總監(jiān) Sandeep Gupte 表示:
對于這部分用戶,大部分是使用類似Ansys、ABAQUS等分析軟件求解復(fù)雜工程和產(chǎn)品的結(jié)構(gòu)力學(xué)性能。大規(guī)模的數(shù)據(jù)計(jì)算往往讓設(shè)計(jì)分析的過程十分漫長,而如果使用CPU+GPU加速的方案將會(huì)大大的節(jié)省運(yùn)算時(shí)間。
GPU 加速計(jì)算是指在完成應(yīng)用任務(wù)時(shí),同時(shí)利用GPU 和 CPU。由于GPU出色的并行任務(wù)處理能力,將應(yīng)用程序中計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到 GPU,同時(shí)仍由 CPU 運(yùn)行其余程序代碼。這樣,從用戶的角度來看,應(yīng)用程序的運(yùn)行速度明顯加快。
流言終結(jié)者中有一段很有意思的視頻,為我們直觀的展示了相比于CPU,GPU的并行計(jì)算為什么有如此令人震撼的優(yōu)勢。
Sandeep舉了個(gè)實(shí)際的例子,在現(xiàn)場一個(gè)集成了一張GP100 的工作站里,工作人員使用ABAQUS對一個(gè)模型進(jìn)行了470萬的網(wǎng)格劃分和計(jì)算,由于時(shí)間關(guān)系,現(xiàn)場并未將計(jì)算完成。這是因?yàn)轭愃七@樣大規(guī)模的計(jì)算,往往需要運(yùn)行數(shù)十個(gè)小時(shí)甚至是數(shù)十天才能完成。不過Sandeep告訴雷鋒網(wǎng),相比僅使用CPU計(jì)算的方案,GPU加速可以將計(jì)算時(shí)間將縮短為原來的1/3。
也許你覺得CAE的栗子還不夠震撼,在圖形渲染方面,英偉達(dá)中國區(qū)銷售總監(jiān)何猶卿表示,目前主流的渲染器都已經(jīng)在做GPU加速平臺,因?yàn)橐粠?K的電影畫面,如果還使用CPU渲染,需要288小時(shí),而用GPU渲染只需要3個(gè)多小時(shí)。
GPU在深度學(xué)習(xí)上的應(yīng)用
在深度學(xué)習(xí)領(lǐng)域,也是高性能GPU大展拳腳的地方,近年來深度學(xué)習(xí)的大發(fā)展除了科學(xué)家們孜孜不倦的學(xué)術(shù)探索外,和GPU運(yùn)算能力的突飛猛進(jìn)也密切相關(guān)。英偉達(dá)CEO黃仁勛曾表示:
計(jì)算機(jī)科學(xué)家綜合 Yann LeCun 的卷積神經(jīng)網(wǎng)絡(luò)、Geoff Hinton 的反向傳播算法,以及 Stochastic 的梯度下降訓(xùn)練法,加上吳恩達(dá) (Andrew Ng) 對 GPU 的大規(guī)模應(yīng)用,來加快深度神經(jīng)網(wǎng)絡(luò) (DNN) 的運(yùn)算速度,才促進(jìn)「深度學(xué)習(xí)」這項(xiàng)現(xiàn)代人工智能技術(shù)出現(xiàn)大爆炸般的發(fā)展局面。
對于人工智能未來將對設(shè)計(jì)工作產(chǎn)生的影響,Sandeep介紹了一種叫做生成式制造流程的人工智能概念設(shè)計(jì)方法。比如設(shè)計(jì)者要設(shè)計(jì)一把椅子,一般情況下需要通過CAD軟件設(shè)計(jì)出兩三個(gè)方案,然后交由決策者選擇。而有了人工智能參與后,設(shè)計(jì)者僅需提出邊界條件,例如承重多少,自重多少,尺寸如何等等,人工智能就可以自動(dòng)生成出上百種的設(shè)計(jì)方案供決策者挑選,這不但有助于遴選出最佳的設(shè)計(jì)方案,還能大大的縮短設(shè)計(jì)的周期。
在VR的應(yīng)用方面,為消費(fèi)級玩家所熟知的Geforce系列更多是針對個(gè)人娛樂的應(yīng)用,而Quadro系列則是面向?qū)I(yè)級的任務(wù)。如果僅僅是游戲,即便畫面的真實(shí)感和準(zhǔn)確性有些許偏差,也不會(huì)造成太嚴(yán)重的后果。但是如果是在工作決策中使用,那么就要求畫面盡可能的逼真,這時(shí)候就需要Quadro系列顯卡和 Iray VR了。
據(jù)Sandeep介紹, Iray 是Nvidia的一款逼真的渲染解決方案,現(xiàn)已許可給 Dassault Systèmes 和 Autodesk 等軟件廠商。 利用 Iray 應(yīng)用,連接至 Quadro 視覺計(jì)算設(shè)備(VCA)后,就可以享受逼真的渲染體驗(yàn)。 把多個(gè) Quadro VCA 結(jié)合到一起后,基于光場實(shí)時(shí)計(jì)算,操作模型或場景時(shí)還能夠捕捉到細(xì)微的光線和反射。
Sandeep還提到英偉達(dá)首次在國內(nèi)推出了QUEST計(jì)劃(Quadro Embedded System Program),即基于Quadro的嵌入式系統(tǒng)計(jì)劃,針對高性能嵌入式系統(tǒng)的開發(fā)者,開發(fā)企業(yè)可以申請加入此計(jì)劃,英偉達(dá)將和他們合作設(shè)計(jì)適用于他們解決方案的GPU。除此之外,英偉達(dá)還會(huì)提供設(shè)計(jì)包(Design Kit)、SDK、樣本代碼、訓(xùn)練等。該項(xiàng)目免費(fèi),并且沒有設(shè)置申請數(shù)量的限制,但是由于致力于一同打造品質(zhì)、可靠性和性能俱佳的高性能嵌入式解決方案,所以英偉達(dá)在合作伙伴的遴選上會(huì)比較謹(jǐn)慎。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。