0
本文作者: 劉偉 | 2017-05-11 15:57 |
雷鋒網(wǎng)按:上個月谷歌公布了關(guān)于TPU細節(jié)的論文,稱“TPU處理速度比當(dāng)前 GPU 和 CPU 要快 15 到 30 倍”,引發(fā)科技圈熱議。Nvidia CEO黃仁勛更是親自撰文回擊,并貼出Tesla P40 GPU 與 TPU 的性能對比圖,大有針尖對麥芒之勢。而在昨天的GTC大會上,Nvidia又發(fā)布了新一代GPU Tesla V100。這場ASIC 與GPU之爭愈發(fā)的好看了!
人工智能和機器學(xué)習(xí)對Google的重要性已經(jīng)不言而喻,為了在人工智能時代搶占先機,這位科技巨人已經(jīng)開始研發(fā)和制造自己的芯片。在去年的年度開發(fā)者大會上,谷歌對外宣布了針對其特殊AI算法進行了優(yōu)化的TPU芯片。據(jù)雷鋒網(wǎng)了解,如今已有數(shù)十種類似的定制化AI芯片陸續(xù)問世。這讓近年來在深度學(xué)習(xí)領(lǐng)域享有支配性地位的芯片供應(yīng)商Nvidia倍感壓力。
為了做出反擊,Nvidia也開始加強其新推的GPU芯片的定制化和專業(yè)性。
在周三舉行的GTC大會上,Nvidia發(fā)布了基于其下一代圖形架構(gòu)Volta的,針對服務(wù)器市場的GPU新品 Tesla V100。該芯片擁有超過210億個晶體管和5,120個計算機內(nèi)核。但是對于AI來說,最重要的是,特斯拉V100配備了640個Tensor內(nèi)核,它們是專為運行深入學(xué)習(xí)網(wǎng)絡(luò)中使用的數(shù)學(xué)運算而設(shè)計的。據(jù)官方介紹,這些Tensor內(nèi)核為Tesla V100提供了高達120 teraflops的、驚人的深度學(xué)習(xí)能力。
雷鋒網(wǎng)了解到,相比前代的Pascal架構(gòu),新芯片將深度學(xué)習(xí)訓(xùn)練速度提升了12倍,深度學(xué)習(xí)推理速度也提升了6倍。新架構(gòu)在運行深度學(xué)習(xí)應(yīng)用方面的性能,相當(dāng)于100個中央處理器(比如Intel的中央處理器)。
為了使深度學(xué)習(xí)應(yīng)用在其硬件上更加高效的運行,Nvidia提供了很多軟件工具。它發(fā)布了一款針對深度學(xué)習(xí)框架TensorFlow和Caffe的編譯器——TensorRT,用于改進推理性能。Nvidia表示,Tesla V100的推理性能要比英特爾的Skylake CPU架構(gòu)快15到25倍。
雖然Nvidia正努力讓其芯片更加適合深度學(xué)習(xí),但它的競爭對手卻可能會指出,Nvidia的最大缺陷在于,其GPU往往必須支持圖形生成功能。GPU之所被設(shè)計出來,就是用于圖形生成的。由于必須支持圖形生成功能,GPU芯片增加了大量體積,這就意味著它在一定程度上要比專用芯片更加低效。
Google在最近的一篇博客中聲稱,其TPU在推理性能上要比現(xiàn)代GPU和CPU快15-30倍,同時功耗還要低30-80倍。(Nvidia對此反駁道,谷歌是在拿TPU和舊的GPU進行比較。)事實上,這種對比并不完全公平。GPU是通用型芯片,可執(zhí)行繪圖運算工作,用途多元。TPU則屬于ASIC,也就是專為特定用途設(shè)計的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快也在情理之中。TPU和GPU之間除了性能較量,更多代表的是ASIC和通用型芯片這兩種設(shè)計思路間的博弈。
除了Nvidia和谷歌,另一大芯片巨頭Intel也加入了這場博弈。不久前,Intel以超過4億美元的價格收購了AI芯片初創(chuàng)企業(yè)Nervana,并聲稱將在2020年之前將深度學(xué)習(xí)訓(xùn)練速度提升100倍。
Nvidia表示,Tesla V100是它在深度學(xué)習(xí)領(lǐng)域更加專業(yè)化,并能夠與這些定制化芯片競爭的有力證據(jù)。Nvidia GPU工程部高級副總裁Jonah Alben在談到芯片競賽時說道:“當(dāng)你考慮到構(gòu)成一款用于深度學(xué)習(xí)訓(xùn)練的優(yōu)秀芯片的所有要素時,你會發(fā)現(xiàn)帶寬、輸入/輸出和數(shù)學(xué)運算能力都很重要。而在所有的這些方面,我們都是專家。只要我們都用相同的油漆刷作畫,就知道到底誰更強了?!?/p>
雷鋒網(wǎng)認為,盡管谷歌在定制化AI芯片領(lǐng)域走在了最前列,但Nvidia仍將在未來很多年里保持競爭力。Gartner的分析師馬克·洪(Mark Hung)說道,“目前為止,沒有任何一款A(yù)I芯片實現(xiàn)了大規(guī)模出貨。盡管對Nvidia來說,潛在的危險始終存在,但在這些公司大規(guī)模出貨AI芯片前,并不會對Nvidia造成真正的威脅?!?/p>
這些即將到來的AI芯片與Nvidia之間的明爭暗斗表明了一點,深度學(xué)習(xí)計算對更強計算能力的需求日益旺盛。幾年前GPU迎來大爆發(fā),正是因為它將深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練時間從幾個月縮短到了幾天。早在20世紀50年代就已經(jīng)誕生的深度學(xué)習(xí),由于有強大的計算能力作為后盾,此刻終于爆發(fā)出了它的潛能。但是隨著越來越多企業(yè)試圖將深度學(xué)習(xí)融入它們的產(chǎn)品和服務(wù),對更快的芯片的需求將沒有止境。
Alben說道:“以我所見,人類需要無限量的深度計算能力。越接近無限越好?!?/p>
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。