0
本文作者: 張路 | 2019-12-12 18:31 |
雷鋒網(wǎng)AI開發(fā)者按,1999年,NVIDIA 公司發(fā)明了GPU(Graphics Processing Unit,圖形處理器),優(yōu)異的圖形處理表現(xiàn)讓它艷驚四座。
近年來(lái),GPU在大規(guī)模并行運(yùn)算上的巨大優(yōu)勢(shì),讓其成為大數(shù)據(jù)、AI以及圖形圖像處理等場(chǎng)景下不可或缺的計(jì)算引擎。
然而,一直以來(lái),囿于GPU切分難度較高,用戶不論是購(gòu)買GPU硬件,還是購(gòu)買GPU云服務(wù),都只能整塊購(gòu)買。這樣有兩個(gè)結(jié)果:
1. 使用門檻較高。GPU相對(duì)CPU價(jià)格較貴,一塊超級(jí)計(jì)算類GPU價(jià)格更是高達(dá)好幾萬(wàn),個(gè)人開發(fā)者使用門檻較高。
2. 資源浪費(fèi)。在算力需求較小的時(shí)候,一整塊GPU卡無(wú)法滿負(fù)荷運(yùn)行,造成算力浪費(fèi)。
今天,這種局面看起來(lái)被打破了,騰訊云正式對(duì)外發(fā)布基于 NVIDIA T4 的虛擬GPU(vGPU)計(jì)算產(chǎn)品GN7實(shí)例,可以為任意AI工作負(fù)載提供支持。
因此,用戶可以在云上買到規(guī)格更小的GPU計(jì)算產(chǎn)品,可以降低用戶使用GPU的成本并增加靈活度,對(duì)一些小規(guī)模算力場(chǎng)景的人工智能研發(fā)有非常大的幫助。
廣泛適用不同AI場(chǎng)景
憑借強(qiáng)大的計(jì)算能力和彈性能力,GN7實(shí)例在海量數(shù)據(jù)處理和人工智能領(lǐng)域都具有廣闊的應(yīng)用價(jià)值。它既可以滿足諸如搜索、大數(shù)據(jù)分析等需要對(duì)海量數(shù)據(jù)進(jìn)行處理的業(yè)務(wù)場(chǎng)景,也可以作為深度學(xué)習(xí)訓(xùn)練和推理的系統(tǒng)平臺(tái)。
GN7實(shí)例的虛擬化特性,也十分適合互聯(lián)網(wǎng)業(yè)務(wù)中人工智能業(yè)務(wù)的批量部署以及云游戲,AR/VR在云端的應(yīng)用。
目前,GN7實(shí)例已經(jīng)在騰訊云自有的智能鈦彈性模型服務(wù)(TI-EMS)上實(shí)現(xiàn)了應(yīng)用。該平臺(tái)通過(guò)使用vGPU做小模型推理,幫助用戶解決復(fù)雜模型部署和GPU利用成本效益等問題。
基于多精度支持,NVIDIA T4擁有可加速深度學(xué)習(xí)訓(xùn)練和推理、機(jī)器學(xué)習(xí)以及數(shù)據(jù)科學(xué)工作負(fù)載的 Tensor Core,以及豐富的平臺(tái)堆棧,包括用于深度學(xué)習(xí)的cuDNN、用于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的NVIDIA RAPIDS、用于云工作站圖形的NVIDIA Quadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結(jié)合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環(huán)境中運(yùn)行GPU加速的工作負(fù)載,從而在提高安全性和利用率的同時(shí)降低成本。
進(jìn)一步降低成本
GN7實(shí)例降低了GPU加速的初始投資成本,NVIDIA vComputeServer軟件通過(guò)對(duì)NVIDIA T4進(jìn)行虛擬化,使多臺(tái)虛擬機(jī)(VM)可以同時(shí)訪問GPU或者使一臺(tái)虛擬機(jī)可以訪問多顆 GPU,從而實(shí)現(xiàn)性能的最大化。因此,騰訊云用戶可以根據(jù)工作負(fù)載的需求靈活選擇對(duì)應(yīng)的GPU加速量。
比如在進(jìn)行簡(jiǎn)單模型推理這一類低算力需求的應(yīng)用時(shí),用戶無(wú)須再像以往必須使用單顆物理GPU,而是可以根據(jù)自身業(yè)務(wù)具體類型對(duì)GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計(jì)算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過(guò)度而產(chǎn)生成本。比如,通過(guò)使用1/2 vGPU實(shí)例規(guī)格,成本相對(duì)單卡實(shí)例降低了50%。
相比過(guò)往進(jìn)程級(jí)別的虛擬化GPU,GN7的升級(jí)點(diǎn)在于其提供的設(shè)備級(jí)虛擬化vGPU是完全模擬出來(lái)一個(gè)GPU設(shè)備,在支持GPU硬件的絕大多數(shù)特性的同時(shí),還能夠做到操作系統(tǒng)級(jí)別的隔離,而且不同的用戶使用也不用擔(dān)心資源爭(zhēng)搶的問題。
不過(guò),關(guān)于虛擬化GPU的技術(shù),AI開發(fā)者也采訪了一位業(yè)內(nèi)資深技術(shù)人士,該人士表示,這個(gè)vGPU技術(shù)其實(shí)并不難,華為、阿里也都有類似的。當(dāng)然,騰訊云和NVIDIA的深度合作還是有一定賣點(diǎn)。
AI開發(fā)者獲悉,下周在蘇州舉辦的GTC大會(huì)上,騰訊云將會(huì)演示NVIDIA GPU加速的云服務(wù),并介紹如何從云端部署AI工作負(fù)載。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。