1
本文作者: 任然 | 2019-01-23 17:42 |
雷鋒網(wǎng)消息,在不久前的GTC大會慕尼黑站上,NVIDIA發(fā)布了虛擬化平臺的Virtual GPU軟件v7.x最新版。昨天,NVIDIA在北京召開溝通會,NVIDIA GPU虛擬化高級解決方案架構(gòu)師張潔,以及中國區(qū)解決方案架構(gòu)師李浩南詳細介紹了該技術(shù)的性能和特點。
如今,GPU已經(jīng)成為企業(yè)非常重要的資本和生產(chǎn)力工具,虛擬化可以很好地幫助企業(yè)充分分配GPU資源給更多的用戶。5年前,GRID虛擬GPU(vGPU)平臺,結(jié)合VMware Horizon vDGA(虛擬專用圖形加速)平臺,實現(xiàn)了針對Tesla GPU的虛擬化工作。
NVIDIA的虛擬GPU產(chǎn)品包括三款旨在應(yīng)對數(shù)字化工作環(huán)境挑戰(zhàn)的產(chǎn)品:面向知識工作者的NVIDIA GRID虛擬PC(GRID vPC)和NVIDIA GRID虛擬應(yīng)用程序(GRID vApp),以及面向設(shè)計師、工程師和建筑師的NVIDIA Quadro虛擬數(shù)據(jù)中心工作站(Quadro vDWS)。
經(jīng)過5年多的發(fā)展,vGPU從軟硬一體到單純的軟件,從一個只能支持一個明確固定型號的GPU到現(xiàn)支持最新Tesla系列的所有GPU,從對圖形圖像進行支持、解決客戶在使用圖形圖像時的重負(fù)載應(yīng)用時如何在數(shù)據(jù)中心部署的問題,到如今在虛擬GPU上實現(xiàn)GPU計算部分能力的業(yè)務(wù)。
據(jù)張潔介紹,新的GPU軟件Vgpu 7.x版通過實時遷移等功能確保了可靠性和易管理性,其新功能包括:
基于NVIDIA Quadro vDWS運行多GPU工作負(fù)載:通過在單一虛擬機(VM)中集合多達四個NVIDIA Tesla GPU的性能,可體驗到虛擬GPU性能的巨大提升,從而應(yīng)對圖形及計算密集程度最高的渲染、仿真和設(shè)計工作流程。
借助VMware vMotion的實時遷移:IT可在不會對用戶造成影響,也不需要預(yù)定停機時間的情況下遷移實時NVIDIA GPU加速虛擬機,從而節(jié)省寶貴的時間和資源。
支持NVIDIA Tesla T4 GPU:和上一代Tesla P4采用相同的低剖面、單插槽規(guī)格,卻可實現(xiàn)2倍的幀緩沖。
部署NVIDIA GPU Cloud的虛擬機上的AI工作負(fù)載:NGC為AI研究人員提供了適用于TensorFlow、PyTorch、MXNet、TensorRT等GPU加速的深度學(xué)習(xí)容器。
其中,vGPU 7.x最重要的更新在于切片模式,從過去只支持從一塊物理GPU虛擬出多臺VM,擴展為支持將多個物理GPU分配給一個VM。如果用戶對GPU的資源、對算力要求更強,可以在虛擬化平臺里實現(xiàn)多GPU,從而滿足用戶對高算力的要求。
GRID通過分時切片方式提供物理GPU上的各類資源給到系統(tǒng),調(diào)入的顯存數(shù)據(jù)相互隔離,根據(jù)不同GPU性能水平可分割為不同vGPU資源,各vGPU資源對等。vGPU調(diào)度的性能損失小、按需分配,充分發(fā)揮硬件價值。
多GPU支持的應(yīng)用場景很多,比如說在原來的圖形工作站中的一些高端場景里會配兩個GPU,如果在CD場景里,一個GPU做3D建模,一個GPU做仿真;在影視后期里,一個GPU用來做動畫建模,另外一個GPU用來做渲染,等等。
同時,vGPU 7.x配合了VMware最新版本的服務(wù)器虛擬化解決方案,vSphere 6.7 U1??膳浜蟅Mware在數(shù)據(jù)中心實現(xiàn)帶有GPU的虛擬機可實現(xiàn)動態(tài)的熱遷移,在遷移的整個過程當(dāng)中,用戶的業(yè)務(wù)是不中斷的。
此外張潔還提到,微軟推出Win10系統(tǒng)后,幾乎所有的系統(tǒng)應(yīng)用都需要GPU加速。根據(jù) LakesideSoftware, Inc 白皮書,Windows 10 所需的 CPU 資源比 Windows 7 最高要高出 32%。Chrome、Skype和 Microsoft Office 等基本辦公室工作效率應(yīng)用程序的更新版本對計算機圖形性能的要求也比以往更高。
GPU輕負(fù)載應(yīng)用對于物理機來說并不是什么問題,但是對于虛擬化桌面來說,沒有GPU加速能力將非常影響基本使用。vGPU 7.x針對輕負(fù)載應(yīng)用提供了GPU加速能力,不僅解決了這個問題,還可以提高VM的密度,從而更經(jīng)濟、更有效的部署虛擬化桌面辦公環(huán)境。
雷鋒網(wǎng)在隨后的訪談中了解到,vGPU 7.0還加入了對AI加速的支持,借助可配合簡化AI部署的NVIDIA GPU Cloud,用戶可以從云端快速地把需要做人工智能業(yè)務(wù)的用戶環(huán)境拖下來進行部署。
而在管理方面,vGPU 7.x支持無感熱遷移,管理員可根據(jù)用戶權(quán)限和資源需求量,動態(tài)分配vGPU資源給不同用戶,無需重新載入VM即可得到vGPU資源的動態(tài)響應(yīng),用戶完全不會感受到切換過程,充分保證使用連續(xù)性。
張潔向雷鋒網(wǎng)透露,NVIDIA配合虛擬化廠商做了非常多的工作,來保證GPU資源可以實現(xiàn)熱遷移:第一,通過vGPU解決方案保證從原端的物理服務(wù)器到目標(biāo)遷移的物理服務(wù)器顯存的完全同步;第二,保證GPU指令的同步,包括GPU指令緩存的同步,從而保證GPU從原服務(wù)器遷移到目標(biāo)服務(wù)器的時候保證其業(yè)務(wù)不會造成任何中斷。
GPU虛擬化是軟件,依托于GPU硬件,由于穩(wěn)定而強大的底層GPU的硬件,所以NVIDIA的軟件在快速迭代下也能保證穩(wěn)定性。未來,NVIDIA還將繼續(xù)和VMware密切合作,充分發(fā)揮雙方的優(yōu)勢共同滿足市場的需要。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。