近距離接觸英偉達專業(yè)級顯卡Quadro系列，都能干點啥？

本文作者：谷磊

2017-04-15 16:28

導(dǎo)語：GP100為Quadro系列的旗艦產(chǎn)品，被科技媒體和粉絲們稱為超當(dāng)量核彈

近日（4月12日），雷鋒網(wǎng)受邀參加了英偉達在北京國家會議中心舉行媒體發(fā)布會。會上英偉達展示了其發(fā)布不久的基于Pascal 架構(gòu)的Quadro系列顯卡，包括：GP100、P2000、P4000、P5000、P6000 等。不同于Geforce的消費級娛樂定位，Quadro立足高端，面向?qū)I(yè)級的需求，英偉達的愿景是讓它們能夠?qū)⑴_式工作站轉(zhuǎn)變?yōu)榫哂型黄菩阅芰Φ某売嬎銠C，并為不同行業(yè)的專業(yè)任務(wù)提供保障。

Quadro系列顯卡（雷鋒網(wǎng)現(xiàn)場拍攝）

Pascal 架構(gòu)的全新NVIDIA Quadro產(chǎn)品陣容致力于為企業(yè)提供視覺計算平臺，簡化設(shè)計和仿真工作流程。與上一代產(chǎn)品相比，新Quadro產(chǎn)品不僅具有超快速內(nèi)存，而且速度最多可以提升兩倍（基于SPECviewperf 12 基準(zhǔn)的計算結(jié)果）。

其中GP100為該系列的旗艦產(chǎn)品，被科技媒體和粉絲們稱為超當(dāng)量核彈。

Quadro GP100參數(shù)及系列特點

GP100

GP100基于 Pascal 核心，匹配16GB HBM2顯存，單精度CUDA核心數(shù) 3584個，雙精度CUDA核心數(shù) 1792個，半精/單精/雙精浮點運算性能分別是20TFLOPS、10TFLOPS和5TFLOPS，帶寬高達720GB/s，功耗235W 。同其他新發(fā)布的專業(yè)卡一樣，它的性能提升也是全方面的（比如同步多重投影、VRWorks、Iray VR），同時還強化了虛擬化、Sync II、雙路NVlink等。

這也是NVlink首次在Windows系統(tǒng)上獲得支持，此前僅僅用于IBM Power8系統(tǒng)和基于Linux的DGX-1，帶寬最高80GB/s。

近距離接觸英偉達專業(yè)級顯卡Quadro系列，都能干點啥？

這個系列官方給出的特點如下：

統(tǒng)一仿真、HPC、渲染和設(shè)計 – GP100將前所未有的雙精度性能與16GB的高帶寬內(nèi)存（HBM2）相結(jié)合，因此用戶可以在設(shè)計過程中進行仿真，并以前所未有的速度采集逼真的多物理場仿真?？蛻?strong>能夠?qū)蓚€GP100 GPU與NVLink?技術(shù)相結(jié)合，并擴展到32GB的HBM2，以在單一工作站上創(chuàng)建龐大的可視化計算解決方案。

近距離接觸英偉達專業(yè)級顯卡Quadro系列，都能干點啥？

擴展后的Quadro P6000（雷鋒網(wǎng)現(xiàn)場拍攝）

探索深度學(xué)習(xí) – GP100提供超過20 TFLOPS的半精度計算，可謂在Windows和Linux環(huán)境中進行深度學(xué)習(xí)的理想開發(fā)平臺。
將VR集成到設(shè)計和仿真工作流程中 – VR 認證的Quadro GP100和P4000具有創(chuàng)建詳細、逼真、沉浸式環(huán)境的能力，能夠大規(guī)模實現(xiàn)更加宏大、更加復(fù)雜的設(shè)計體驗。
盡享照片級真實感設(shè)計的優(yōu)勢 – 基于Pascal 架構(gòu)的Quadro GPU 渲染照片級真實感圖像的速度為CPU的18倍。
創(chuàng)建廣闊的可視化工作區(qū) – 可在多達四個5K顯示器上以高分辨率和HDR顏色顯示數(shù)據(jù)。
經(jīng)濟高效地構(gòu)建超高分辨率及多顯示屏配置 – 通過將多達8個P4000 GPU和兩個Quadro Sync II顯卡相結(jié)合，可通過單一機箱實現(xiàn)多達32個4K顯示器的配置。

GPU在CAE上的應(yīng)用

近距離接觸英偉達專業(yè)級顯卡Quadro系列，都能干點啥？

Sandeep Gupte

CAE(Computer Aided Engineering)指工程設(shè)計中的計算機輔助工程。英偉達專業(yè)可視化業(yè)務(wù)高級總監(jiān) Sandeep Gupte 表示：

對于這部分用戶，大部分是使用類似Ansys、ABAQUS等分析軟件求解復(fù)雜工程和產(chǎn)品的結(jié)構(gòu)力學(xué)性能。大規(guī)模的數(shù)據(jù)計算往往讓設(shè)計分析的過程十分漫長，而如果使用CPU+GPU加速的方案將會大大的節(jié)省運算時間。

GPU 加速計算是指在完成應(yīng)用任務(wù)時，同時利用GPU 和 CPU。由于GPU出色的并行任務(wù)處理能力，將應(yīng)用程序中計算密集部分的工作負載轉(zhuǎn)移到 GPU，同時仍由 CPU 運行其余程序代碼。這樣，從用戶的角度來看，應(yīng)用程序的運行速度明顯加快。

流言終結(jié)者中有一段很有意思的視頻，為我們直觀的展示了相比于CPU，GPU的并行計算為什么有如此令人震撼的優(yōu)勢。

Sandeep舉了個實際的例子，在現(xiàn)場一個集成了一張GP100 的工作站里，工作人員使用ABAQUS對一個模型進行了470萬的網(wǎng)格劃分和計算，由于時間關(guān)系，現(xiàn)場并未將計算完成。這是因為類似這樣大規(guī)模的計算，往往需要運行數(shù)十個小時甚至是數(shù)十天才能完成。不過Sandeep告訴雷鋒網(wǎng)，相比僅使用CPU計算的方案，GPU加速可以將計算時間將縮短為原來的1/3。

GPU在真實物理渲染（PBR）上的應(yīng)用

也許你覺得CAE的栗子還不夠震撼，在圖形渲染方面，英偉達中國區(qū)銷售總監(jiān)何猶卿表示，目前主流的渲染器都已經(jīng)在做GPU加速平臺，因為一幀4K的電影畫面，如果還使用CPU渲染，需要288小時，而用GPU渲染只需要3個多小時。

GPU在深度學(xué)習(xí)上的應(yīng)用

在深度學(xué)習(xí)領(lǐng)域，也是高性能GPU大展拳腳的地方，近年來深度學(xué)習(xí)的大發(fā)展除了科學(xué)家們孜孜不倦的學(xué)術(shù)探索外，和GPU運算能力的突飛猛進也密切相關(guān)。英偉達CEO黃仁勛曾表示：

計算機科學(xué)家綜合 Yann LeCun 的卷積神經(jīng)網(wǎng)絡(luò)、Geoff Hinton 的反向傳播算法，以及 Stochastic 的梯度下降訓(xùn)練法，加上吳恩達 (Andrew Ng) 對 GPU 的大規(guī)模應(yīng)用，來加快深度神經(jīng)網(wǎng)絡(luò) (DNN) 的運算速度，才促進「深度學(xué)習(xí)」這項現(xiàn)代人工智能技術(shù)出現(xiàn)大爆炸般的發(fā)展局面。

對于人工智能未來將對設(shè)計工作產(chǎn)生的影響，Sandeep介紹了一種叫做生成式制造流程的人工智能概念設(shè)計方法。比如設(shè)計者要設(shè)計一把椅子，一般情況下需要通過CAD軟件設(shè)計出兩三個方案，然后交由決策者選擇。而有了人工智能參與后，設(shè)計者僅需提出邊界條件，例如承重多少，自重多少，尺寸如何等等，人工智能就可以自動生成出上百種的設(shè)計方案供決策者挑選，這不但有助于遴選出最佳的設(shè)計方案，還能大大的縮短設(shè)計的周期。

GPU在VR上的應(yīng)用

近距離接觸英偉達專業(yè)級顯卡Quadro系列，都能干點啥？

在VR的應(yīng)用方面，為消費級玩家所熟知的Geforce系列更多是針對個人娛樂的應(yīng)用，而Quadro系列則是面向?qū)I(yè)級的任務(wù)。如果僅僅是游戲，即便畫面的真實感和準(zhǔn)確性有些許偏差，也不會造成太嚴重的后果。但是如果是在工作決策中使用，那么就要求畫面盡可能的逼真，這時候就需要Quadro系列顯卡和 Iray VR了。

據(jù)Sandeep介紹， Iray 是Nvidia的一款逼真的渲染解決方案，現(xiàn)已許可給 Dassault Systèmes 和 Autodesk 等軟件廠商。利用 Iray 應(yīng)用，連接至 Quadro 視覺計算設(shè)備(VCA)后，就可以享受逼真的渲染體驗。把多個 Quadro VCA 結(jié)合到一起后，基于光場實時計算，操作模型或場景時還能夠捕捉到細微的光線和反射。

QUEST計劃

Sandeep還提到英偉達首次在國內(nèi)推出了QUEST計劃（Quadro Embedded System Program），即基于Quadro的嵌入式系統(tǒng)計劃，針對高性能嵌入式系統(tǒng)的開發(fā)者，開發(fā)企業(yè)可以申請加入此計劃，英偉達將和他們合作設(shè)計適用于他們解決方案的GPU。除此之外，英偉達還會提供設(shè)計包（Design Kit）、SDK、樣本代碼、訓(xùn)練等。該項目免費，并且沒有設(shè)置申請數(shù)量的限制，但是由于致力于一同打造品質(zhì)、可靠性和性能俱佳的高性能嵌入式解決方案，所以英偉達在合作伙伴的遴選上會比較謹慎。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

相關(guān)文章