3
本文作者: 黃鑫 | 2016-07-15 00:14 |
2012年11月23日,應(yīng)該是一個(gè)讓時(shí)任谷歌人工智能實(shí)驗(yàn)室專家的Geoff Hinton倍感欣慰的日子,在這一天,紐約時(shí)報(bào)發(fā)布了名為《Scientist See promise in Deep Learning Program》(科學(xué)家們?cè)谏疃葘W(xué)習(xí)上看到了希望)的報(bào)道,正式標(biāo)志著深度學(xué)習(xí)被學(xué)界乃至全社會(huì)完全接受,從那時(shí)開(kāi)始,Hinton大神數(shù)十年的默默堅(jiān)持,終于給深度學(xué)習(xí)帶來(lái)了一段持續(xù)至今的全盛期。
誰(shuí)也無(wú)法否認(rèn)在計(jì)算能力爆炸性增長(zhǎng)的今天,的深度學(xué)習(xí)確實(shí)取得了巨大的成就,每一個(gè)置身于AI研究行業(yè)的人或許都永遠(yuǎn)不會(huì)忘記,在李世石和AlphaGo的對(duì)決中,人們的態(tài)度由最初的漫不經(jīng)心,到中間的震驚和沉默,第四局李世石戰(zhàn)勝之后的狂喜,和最終的嘆息和敬佩??墒窃谶@股科學(xué)界“全民DL”的風(fēng)潮下,卻逐漸有人開(kāi)始對(duì)它提出了自己的質(zhì)疑。
CVPR2016上,Mobileye的CTO Amnon Shashua在演講中說(shuō)道:他認(rèn)為深度學(xué)習(xí)的研究繞了遠(yuǎn)路。因?yàn)檎嬲腁I應(yīng)該能幫人類解決人類解決不了的問(wèn)題,而目前的AI的表現(xiàn)卻僅限于人類已經(jīng)能非常明確的理解和解釋的領(lǐng)域。
同樣是在CVPR期間,巴黎高等計(jì)算機(jī)視覺(jué)研究所的主任Nikos Paragios表示,深度學(xué)習(xí)方法幾乎已經(jīng)壟斷了目前的計(jì)算機(jī)視覺(jué),甚至是AI科研領(lǐng)域的所有研究,導(dǎo)致其他的方法和基礎(chǔ)研究無(wú)人問(wèn)津,對(duì)此感到有些擔(dān)憂。
而在本屆的IJCAI上,在計(jì)算機(jī)哲學(xué)上已有數(shù)十年經(jīng)驗(yàn)的Aaron Sloman也在演講中表示,自己認(rèn)為AI作為一門(mén)科學(xué)(而不是工程學(xué))已經(jīng)在過(guò)去的二三十年間失去了方向。
今天Facebook搞了個(gè)大新聞:有多家主流媒體報(bào)道了Facebook即將建立的新數(shù)據(jù)中心和專為深度學(xué)習(xí)而研制的服務(wù)器Big Sur,而這個(gè)新聞卻反而再次喚醒了我們心中的疑問(wèn):Facebook和Google它們現(xiàn)在努力的方向,會(huì)不會(huì)錯(cuò)了?
讓我們先來(lái)看看關(guān)于Facebook這個(gè)服務(wù)器的其中一條新聞吧:
從北美的西部訪問(wèn)facebook的話,你的訪問(wèn)數(shù)據(jù)有很大可能會(huì)經(jīng)過(guò)一個(gè)位于俄勒岡州中心的高地沙漠中一塊被充斥著滿滿的杜松香氣的空氣所冷卻的服務(wù)器群。在普林維爾的市區(qū),一個(gè)有大概9000人常住著的地方,F(xiàn)acebook存儲(chǔ)著他們數(shù)以億計(jì)的數(shù)據(jù)。一行一行的電腦整齊的排列在四座總占地面積將近75000平方米(800000平方英尺)的巨型建筑里。這些建筑被設(shè)計(jì)成剛好能讓從西北吹來(lái)的干燥,并且通常相當(dāng)涼爽的風(fēng)吹進(jìn)它們之間。過(guò)道中堆疊著的服務(wù)器閃著藍(lán)色和綠色的燈,發(fā)出著單調(diào)的噪音,但在內(nèi)部它們其實(shí)每時(shí)每刻都在不間斷的處理著Facebook登陸、贊和“大笑”之類的服務(wù)進(jìn)程。
Facebook最近在普林維爾的設(shè)備中加入了一些新的機(jī)器:他們?cè)谶@里安裝了一組全新的,用來(lái)加速訓(xùn)練類似翻譯軟件、私人助手和文字理解之類程序的高性能服務(wù)器。
這些最新的“大蘇爾”服務(wù)器(Big Sur servers)是圍繞一種最初被制造用來(lái)進(jìn)行圖像處理的,以GPU的名字為大眾所知的高性能處理器而設(shè)計(jì)的。這些芯片對(duì)最近AI領(lǐng)域取得了極大發(fā)展的深度學(xué)習(xí)技術(shù)有著更好的支持。在GPU的支持下,曾經(jīng)的深度學(xué)習(xí)軟件得以處理規(guī)模和復(fù)雜程度大得多的數(shù)據(jù)集,因而在最終識(shí)別圖像和語(yǔ)音等方面應(yīng)用的效果取得了顯著的改善。
Kevin Lee,F(xiàn)acebook的一名服務(wù)器工程師說(shuō),由于擁有了更快的速度,他們得以幫Facebook的研究者們用更多數(shù)據(jù)訓(xùn)練了他們的深度學(xué)習(xí)軟件,“這些服務(wù)器都是針對(duì)AI研究和機(jī)器學(xué)習(xí)計(jì)算而特制的?!彼f(shuō),“這些GPU可以把圖片分成無(wú)數(shù)個(gè)細(xì)小的局部然后同時(shí)處理它們?!?/p>
Facebook在每臺(tái)大蘇爾服務(wù)器上放置了大概8臺(tái)NVIDIA——這種芯片的領(lǐng)導(dǎo)級(jí)制造商——制造的GPU。Lee不愿透露已經(jīng)部署了多少臺(tái)這種服務(wù)器,但是他說(shuō)Facebook至少已經(jīng)有數(shù)千個(gè)GPU投入工作了。大蘇爾服務(wù)器已經(jīng)被安放在了公司在普林維爾、阿什本和弗吉尼亞的數(shù)據(jù)中心。
由于GPU的耗電量極其龐大,F(xiàn)acebook不得不用比其它服務(wù)器更低的密度來(lái)在數(shù)據(jù)中心中布置這些服務(wù)器,否則可能會(huì)形成一些過(guò)熱的情況,不僅會(huì)對(duì)冷卻系統(tǒng)造成更大的負(fù)擔(dān),也會(huì)消耗掉更多的能量。一個(gè)2.1米(7英尺)高的機(jī)架上可以堆疊8臺(tái)大蘇爾服務(wù)器 ,而相同的機(jī)架可以容納30臺(tái)標(biāo)準(zhǔn)的Facebook服務(wù)器,如果是處理日常任務(wù)的話,它們其實(shí)可以做得更快。
Facebook遠(yuǎn)遠(yuǎn)不是唯一一家運(yùn)行著龐大的數(shù)據(jù)中心以及使用GPU來(lái)進(jìn)行機(jī)器學(xué)習(xí)研究的公司。微軟、谷歌和中國(guó)的百度都正在使用GPU來(lái)加速它們的研究進(jìn)度。
對(duì)Facebook來(lái)說(shuō)不太尋常的一件事就是它公開(kāi)了大蘇爾服務(wù)器和其它服務(wù)器的設(shè)計(jì),以及將在普林維爾建立的數(shù)據(jù)中心。他們將這些信息在一個(gè)2011年Facebook建立的以鼓勵(lì)計(jì)算機(jī)公司共同進(jìn)行低成本計(jì)算設(shè)備開(kāi)發(fā)為目的的叫做“開(kāi)源計(jì)算計(jì)劃”(Open Compute Project)的計(jì)劃中貢獻(xiàn)了出來(lái)。這項(xiàng)計(jì)劃被看做幫助了亞洲國(guó)家的硬件公司以及擠壓了像戴爾和惠普這樣的傳統(tǒng)供應(yīng)商的生存空間。
今年早些時(shí)候大蘇爾計(jì)劃公布的時(shí)候,F(xiàn)acebook人工智能實(shí)驗(yàn)室的主任燕樂(lè)存(Yann LeCun)說(shuō),他相信通過(guò)促進(jìn)更多的組織和公司建立更強(qiáng)大的進(jìn)行機(jī)器學(xué)習(xí)的基礎(chǔ)設(shè)施,這個(gè)開(kāi)源計(jì)劃可以加速相關(guān)領(lǐng)域的研究進(jìn)度。
普渡大學(xué)的一位副教授Eugenio Culurciello說(shuō),深度學(xué)習(xí)的實(shí)用性意味著這種芯片幾乎一定會(huì)被廣泛使用。他說(shuō),“這種需求已經(jīng)很大了,而且在將來(lái)也只會(huì)越來(lái)越大?!?/p>
在被問(wèn)及Facebook有沒(méi)有在著手研發(fā)自己的定制芯片時(shí),Lee說(shuō),“公司正在考慮?!?/p>
Big Sur的特點(diǎn)是什么?是每臺(tái)服務(wù)器中都裝有8個(gè)NVIDIA生產(chǎn)的高端獨(dú)立GPU。如大家所知,由于服務(wù)器的職能特點(diǎn),其實(shí)一般的服務(wù)器內(nèi)部是沒(méi)有“三大件”中的獨(dú)立GPU,只有CPU和內(nèi)存的。因?yàn)镚PU的耗電量和發(fā)熱量都太大了。而其擅長(zhǎng)的計(jì)算形式又不能對(duì)服務(wù)器的常用計(jì)算需求起到太大的幫助作用。因此不太適合用在一般的服務(wù)器中。但是Facebook卻為了深度學(xué)習(xí)而專門(mén)設(shè)計(jì)了這款帶有8個(gè)獨(dú)立GPU的服務(wù)器,甚至不惜以減少每個(gè)機(jī)架上的服務(wù)器數(shù)量來(lái)優(yōu)化對(duì)深度學(xué)習(xí)程序的計(jì)算速度??芍^是下了血本。
而互聯(lián)網(wǎng)領(lǐng)域的其他大公司也沒(méi)閑著,如文中所說(shuō),微軟、谷歌、甚至是百度都在使用GPU、甚至開(kāi)發(fā)自己的專用芯片來(lái)加速深度學(xué)習(xí)。在這些巨頭們的推動(dòng)下,深度學(xué)習(xí)算法的反應(yīng)也是越來(lái)越快,精度也越來(lái)越高。
這不是好事嗎?
答案是:我們真的沒(méi)法知道。目前的大多數(shù)深度學(xué)習(xí)模型建立的過(guò)程,都是先建立相當(dāng)有針對(duì)性的函數(shù),再用龐大的,極有針對(duì)性的數(shù)據(jù)去訓(xùn)練它們,最終得出一個(gè)很有針對(duì)性的概率選擇程序。也就是說(shuō),現(xiàn)在的深度學(xué)習(xí)AI你教它下棋,它就只會(huì)變得越來(lái)越會(huì)下棋,你教它識(shí)圖,它就只能越來(lái)越會(huì)識(shí)圖,而且它們識(shí)圖和做事的方式,說(shuō)白了是經(jīng)過(guò)一系列的判斷后判斷結(jié)論有99.8%的可能是選擇A,有0.2%的可能是選擇B,于是便選擇了A這樣的過(guò)程。當(dāng)然,它們下棋和識(shí)圖的水平會(huì)變得很厲害,甚至變得比人類還厲害。但是終究還是只能限制于那個(gè)單獨(dú)的領(lǐng)域。你要問(wèn)我們,或者問(wèn)那些專家,我們能肯定這樣的程序發(fā)展下去,就一定能發(fā)展出真正的智能嗎?至少我們覺(jué)得,這些深度學(xué)習(xí)程序真的不太像是能發(fā)展處終極形態(tài)的AI的樣子。
Facebook的服務(wù)器固然十分強(qiáng)大,但它本質(zhì)上仍然是馮諾依曼架構(gòu)下的一臺(tái)比較快的電腦而已。它的面世不過(guò)是人工智能軍備競(jìng)賽中的一環(huán),對(duì)于深度學(xué)習(xí)理論的整個(gè)發(fā)展,其實(shí)起不到什么作用。包括谷歌的TPU,和逐漸開(kāi)始走入很多人視野中的FPGA,也都只是一種“器”,雖然有“工欲善其事必先利其器”的古訓(xùn),但我們也都知道,有時(shí)候光有好的工具還是不夠的。深度學(xué)習(xí)的效果太好了,以至于讓很多專家忘了,其實(shí)人們還不知道真正的人工智能應(yīng)該怎么去實(shí)現(xiàn)。
不過(guò),確實(shí)也有不少專家都看到了這一點(diǎn)。斯坦福人工智能實(shí)驗(yàn)室負(fù)責(zé)人李飛飛最近在同硅谷頂級(jí)投資機(jī)構(gòu)a16z的合伙人Frank Chen交流時(shí)就說(shuō)道:她的下一個(gè)夢(mèng)想就是能教會(huì)機(jī)器人怎么去學(xué)習(xí),而不只是模仿訓(xùn)練數(shù)據(jù)。
而深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)公司商湯科技的執(zhí)行研發(fā)總監(jiān)曹旭東也提到過(guò):做深度學(xué)習(xí)的人其實(shí)都有一個(gè)終極的追求,就是改變現(xiàn)在深度學(xué)習(xí)比較傻的以監(jiān)督學(xué)習(xí)為主流的模式,讓機(jī)器人的行為更加聰明,可以像人一樣學(xué)習(xí)。
目前學(xué)界向這個(gè)方向努力的表現(xiàn)是大力發(fā)展半監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),努力提高深度學(xué)習(xí)的學(xué)習(xí)效率和降低對(duì)樣本的需求量。不過(guò)這一切畢竟還是在深度學(xué)習(xí)的框架內(nèi)來(lái)進(jìn)行的,誰(shuí)也說(shuō)不好無(wú)監(jiān)督學(xué)習(xí)的量變能否引起質(zhì)變。
所以也不奇怪逐漸開(kāi)始有一些人已經(jīng)開(kāi)始懷疑深度學(xué)習(xí)對(duì)AI的發(fā)展到底有沒(méi)有那么重要了。讓我們回到Facebook的服務(wù)器上。其實(shí)無(wú)論是Facebook也好,谷歌也好,微軟、亞馬遜還是百度也好。我們沒(méi)有理由責(zé)怪他們對(duì)深度學(xué)習(xí)的熱情。畢竟作為一個(gè)商業(yè)公司,深度學(xué)習(xí)已經(jīng)能在他們的研究領(lǐng)域上給他們帶來(lái)足夠多的成果收益,而他們對(duì)最終成效的渴求也正是深度學(xué)習(xí)能得到快速的發(fā)展的原因之一。
但資本的力量雖然強(qiáng)大,畢竟還是逃脫不了那一點(diǎn)逐利的本質(zhì),難免陷入對(duì)短期利益盲目的追逐。而能拋開(kāi)短期的利益著眼于長(zhǎng)期的考量和探索,正是學(xué)界相對(duì)于產(chǎn)業(yè)界在研究上最大的優(yōu)勢(shì)之一。
我們并無(wú)意否定任何人在AI的研究上做出的努力,只是我們希望給大家展現(xiàn)一個(gè)這樣的可能性,希望大家在研究和討論之余能偶爾想起它來(lái),畢竟它有可能是真實(shí)存在的:
萬(wàn)一最后能實(shí)現(xiàn)真正意義上的人工智能的方法,和深度學(xué)習(xí)一點(diǎn)關(guān)系都沒(méi)有呢?
題圖來(lái)自the verge
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。