0
在人工智能領(lǐng)域,訓(xùn)練一個先進(jìn)的機(jī)器學(xué)習(xí)模型需要投入大量的計算資源。隨著機(jī)器學(xué)習(xí)算法越來越多的應(yīng)用在各個領(lǐng)域并表現(xiàn)出優(yōu)越的性能,對于機(jī)器學(xué)習(xí)算法專業(yè)硬件的需求,也變得越來越強(qiáng)烈。
2016 年,谷歌首次公布了專為加速深層神經(jīng)網(wǎng)絡(luò)運算能力而研發(fā)的芯片——TPU,在計算性能和能耗指標(biāo)上,TPU 的表現(xiàn)都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng) CPU、GPU 組合。(我們在上個月也曾發(fā)布過一篇文章,解析 TPU 耀眼成績背后的原因)
在 5 月 19 日凌晨舉行的谷歌 I/O 2017 大會上,谷歌正式發(fā)布了第二代 TPU。新的芯片相比初代產(chǎn)品,在性能、應(yīng)用、服務(wù)方面再一次實現(xiàn)突破。
一、性能方面
新一代 TPU 能夠同時應(yīng)用于高性能計算和浮點計算。 并且最高可以達(dá)到每秒 180 萬億次的浮點運算性能。相比而言,上周英偉達(dá)剛剛推出的 GPU Tesla2 V100,每秒只能達(dá)到 120 萬億次浮點運算。
相比第一代在功能上實現(xiàn)從無到有的突破,第二代的起點相對更高,開發(fā)團(tuán)隊也能更加集中資源來提升改進(jìn) TPU 的性能。相信通過硬件、軟件的優(yōu)化,后續(xù)第三代、第四代在性能取得持續(xù)突破的可能性非常大。
二、應(yīng)用方面
第一代 TPU 沒有特別提到組合應(yīng)用、集群應(yīng)用的功能,而且自身沒有存儲空間。第二代在發(fā)布會上直接就展示了一個 包含 64 顆二代 TPU 芯片的 TPU pod 運算陣列。這個運算陣列, 最多可以為單個 ML 訓(xùn)練任務(wù)提供每秒 11.5 千萬億次的浮點計算能力,大大加速機(jī)器學(xué)習(xí)模型的訓(xùn)練。
也有專業(yè)媒體提到,新的 TPU 在左右兩側(cè)各有四個對外接口,在左側(cè)額外增加了兩個接口。這些接口未來可能允許 TPU 芯片直接連接存儲器,或者是直連高速網(wǎng)絡(luò),從而實現(xiàn)更加復(fù)雜的運算。理論上,開發(fā)者也能在此基礎(chǔ)上設(shè)計更多的功能,添加更多的擴(kuò)展。
三、服務(wù)方面
從 Cloud TPU 的命名上面,也可以直觀地了解到,新一代的 TPU 將加入谷歌云計算平臺,并對外提供云服務(wù)。這也就意味著 TPU 不再只是谷歌內(nèi)部的獨享服務(wù),而將成為任何人都能輕松分享、應(yīng)用的神器。
這里就看出谷歌比較賊的地方了,第一代剛出來的時候,藏著掖著的,還特別低調(diào)地說只打算自己內(nèi)部使用。二代研發(fā)出來,直接就上云了:硬件不對外銷售,服務(wù)可以啊。
如果是直接的硬件銷售,很多中小型的公司(比如我們公司:智慧思特)可能會更加偏向于選用 GPU:應(yīng)用范圍更廣,可以根據(jù)需要安排處理不同的任務(wù)。大型的公司(比如阿里、Facebook),ML 任務(wù)量非常大,才會考慮采購 TPU,甚至出于經(jīng)費、效率的考慮,自主組建團(tuán)隊進(jìn)行研發(fā)(比如這次谷歌自己做 TPU,F(xiàn)acebook 也有過自主研發(fā)數(shù)據(jù)中心硬件設(shè)備的報道);
對外銷售服務(wù)的話,首先是激活了中小企業(yè)的這塊需求市場,用戶只需根據(jù)使用時間進(jìn)行付費,節(jié)省了成本。另外,大型企業(yè)自身的資源利用率也有了很大的提升,攤薄了成本。比如阿里,為了應(yīng)對雙十一準(zhǔn)備的海量服務(wù)器,在閑暇時間可以對外提供云計算服務(wù)。最后,避免了跟硬件廠商(比如英偉達(dá))直接的利益沖突。
四、小結(jié)
綜合來說,TPU,尤其是 Cloud TPU 讓大型互聯(lián)網(wǎng)公司印證了自主研發(fā)硬件的可行性。
性能上,針對自主業(yè)務(wù)進(jìn)行成倍優(yōu)化,節(jié)約硬件采購、數(shù)據(jù)中心建設(shè)、時間消耗等成本;應(yīng)用上,可以靈活地與現(xiàn)有設(shè)施、設(shè)備進(jìn)行組合、擴(kuò)展;服務(wù)上,通過云實現(xiàn)資源的對外銷售,賺取收益。
對應(yīng)的,根據(jù)企業(yè)自身業(yè)務(wù)的不同,未來可能出現(xiàn)的定制化硬件設(shè)備也會不一樣。比如針對在線交易數(shù)據(jù)處理的 APU?針對在線社交互動的 FPU?
至于如何評價 Cloud TPU,大概可以算是標(biāo)志著人工智能專業(yè)硬件時代的到來吧。
版權(quán)申明:本文由智慧思特大數(shù)據(jù)編輯整理,雷鋒網(wǎng)獲得授權(quán)轉(zhuǎn)載。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。