0
雷鋒網(wǎng)按:即使強如谷歌,短時間內(nèi)也無法從Nvidia口中奪過AI硬件市場這款肥肉。
圖形芯片制造商Nvidia的股價在過去一年時間里翻了三番,其GPU如今已經(jīng)成了AI領(lǐng)域最受歡迎的深度學(xué)習(xí)主流平臺。Nvidia的GPU原本是為生成電腦游戲和仿真圖形而設(shè)計的,如今卻被用來處理擁有數(shù)百萬條數(shù)據(jù)的,大型深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練中的密集計算部分。
上周Google在其年度開發(fā)者大會上,推出了第二代Tensor處理單元——Cloud TPU。據(jù)雷鋒網(wǎng)了解,這是一款用于加速Google使用的深度學(xué)習(xí)數(shù)學(xué)模型的定制化芯片。Google于兩年前將第一代TPU引入了它的服務(wù)器基站,并于去年正式對外發(fā)布。第一代TPU只能處理深度學(xué)習(xí)的推理部分,運行已經(jīng)訓(xùn)練有素的模型。Google表示,Cloud TPU比Nvidia的商用GPU更適合用于深度學(xué)習(xí)訓(xùn)練。
據(jù)雷鋒網(wǎng)了解,Google希望未來能夠通過Google Cloud向其他公司提供其AI硬件。此外,Google還計劃為開展公開AI研究的研究人員提供1000個Cloud TPU。不過,這些Cloud TPU的真正用意,似乎是為了增強Google cloud的具競爭力。在云服務(wù)市場,亞馬遜和微軟兩大巨頭已經(jīng)將Google遠遠甩在了身后,Google不得不全力尋求差異化競爭。
Cloud TPU對Nvidia的影響的是雙重的。一方面,Nvidia目前在AI硬件這片新興市場仍占據(jù)著主導(dǎo)地位,Cloud TPU則給了開發(fā)者更多的選擇。另一方面,Google 上周發(fā)布Cloud TPU時透露,其公司內(nèi)部仍然很依賴Nvidia的GPU,而且其云服務(wù)也將支持Nvidia的下一代GPU Volta。
綜合考慮,我認為Google未來在AI硬件市場將遭遇嚴峻挑戰(zhàn),主要原因有二:
首先,Cloud TPU將用戶鎖定在了TensorFlow框架以及Google Cloud云服務(wù)中。
伯恩斯坦研究公司高級分析師史蒂西·拉斯貢(Stacy Rasgon)說道:
“如果你使用的是TensorFlow框架,那么Cloud TPU很棒。但如果你不想使用TensorFlow框架呢?Nvidia的優(yōu)勢在于你不會被它的服務(wù)鎖住,這一點很重要?!?/p>
Nvidia的GPU在Google、亞馬遜、微軟和IBM等主流云服務(wù)廠商的云端都是可用的。開發(fā)者們可以根據(jù)自己的喜好自由選擇,并隨時更換云服務(wù)廠商。此外,Nvidia還對其硬件進行了優(yōu)化,能夠運行Caffe、Torch和PaddlePaddle等多種深度學(xué)習(xí)框架。AI市場目前還很年輕,誰也不知道哪種框架會最終勝出。因此,將自己束縛在Google的TensorFlow框架中,對任何一家公司來說都是冒險。
AI創(chuàng)業(yè)公司Clarifai的創(chuàng)始人兼CEO Matt Zeiler表示:
“很明顯,Cloud TPU是Google吸引你使用Google Cloud,并將你鎖定其中的一種策略?!?/p>
雖然學(xué)術(shù)圈可以免費使用Cloud TPU,但只能使用TensorFlow框架這一限制,使其魅力大打折扣。加州大學(xué)伯克利分校副教授Alexei Efros在一封電子郵件中說道:
“對我們而言,使用Cloud TPU的最大阻力就在于它只能運行TensorFlow。因為我的實驗室中用到了很多不同的軟件包,PyTorch似乎最受歡迎。Nvidia Titan X目前仍是我們的主力平臺,至于未來,我們拭目以待吧”。
即便對于那些已經(jīng)全面采用TensorFlow的創(chuàng)業(yè)公司,阻力依然存在,那就是如何獲得Cloud TPU。AI創(chuàng)業(yè)公司Bonsai的聯(lián)合創(chuàng)始人兼CEO Mark Hammond表示:
“我們的項目建立在TensorFlow框架之上,因此Cloud TPU肯定是我們正在探索的。任何使AI基礎(chǔ)架構(gòu)更好、更快、更便宜的事物,都是Bonsai和Bonsai的客戶樂見其成的。”
Google的另一大軟肋在于,它不會像Nvidia那樣直接向客戶出售芯片。Zeiler表示,很多深度學(xué)習(xí)創(chuàng)業(yè)公司都喜歡用自己的硬件訓(xùn)練,因為在云端存儲大量訓(xùn)練數(shù)據(jù)的成本可能非常高昂。比如Clarifai就選擇購買Nvidia 的GeForce游戲顯卡,在自己位于新澤西州的數(shù)據(jù)中心訓(xùn)練神經(jīng)網(wǎng)絡(luò)。Zeiler說道:
“我們之所以使用自己的硬件和GPU訓(xùn)練,就是因為它成本更低,尤其是考慮到我們擁有龐大的實驗量和數(shù)據(jù)集。”
Nvidia的真正競爭更可能來自芯片公司。目前,數(shù)十個AI芯片創(chuàng)業(yè)公司正冉冉升起,英特爾甚至為了收購頂級芯片創(chuàng)業(yè)公司Nervana,耗資超過4億美元。
Zeiler表示,隨著時間推移,TPU可能會影響到GPU市場,但影響力不僅僅來源于Google,畢竟其他芯片制造商不會干坐著。
AI芯片創(chuàng)業(yè)公司Cerebras Systems的聯(lián)合創(chuàng)始人兼CEO Andrew Feldman認為,Nvidia最大的問題在于,GPU是為生成圖形而非處理AI算法所設(shè)計的。Feldman說道:
“我不認為GPU很適合機器學(xué)習(xí),它只是比英特爾的CPU更好而已。不過GPU在過去25年間針對不同問題進行了優(yōu)化?!?/p>
Nvidia也意識到了這一點。因此它在最新的圖形芯片架構(gòu)中加入了專門的Tensor Cores計算核心。Tensor Cores針對利于深度學(xué)習(xí)操作的數(shù)學(xué)運算進行了優(yōu)化。有了Tensor Cores之后,Nvidia的GPU越來越像專業(yè)的AI處理器了,而不僅僅是用于生成圖形的工具。Nvidia加速計算副總裁Ian Buck說道:
“你將看到我們在GPU中增加更多的AI功能以及專業(yè)化功能?!?/p>
對于AI領(lǐng)域日益激烈的競爭,Nvidia表示,現(xiàn)在市場增長太快了,每家企業(yè)都有存在的價值。Buck說道:
“我認為這是一個爆炸式增長的市場,每個人都有發(fā)展的空間?!?/p>
via forbes
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。