8
本文作者: 林藠頭 | 2016-03-11 14:26 | 專(zhuān)題:人工智能和李世石的世紀(jì)之戰(zhàn) |
當(dāng)AlphaGo 落下第一子開(kāi)始,無(wú)論勝負(fù),這款執(zhí)行著諸多科學(xué)家意志的人工智能產(chǎn)品的“本體”都很值得玩味。無(wú)論多么高深的科技,都由硬件打造而成,或許AlphaGo 的本體也可以被看做是一種新型棋具。
在AlphaGo之前,Google也開(kāi)發(fā)了利用深度學(xué)習(xí)進(jìn)行簡(jiǎn)單紅白機(jī)游戲?qū)?zhàn)的人工智能技術(shù)。Linkface聯(lián)合創(chuàng)始人石建萍認(rèn)為,深度學(xué)習(xí)技術(shù)驗(yàn)證了這樣大數(shù)據(jù)輸入直接預(yù)測(cè)一個(gè)復(fù)雜問(wèn)題是可行的,之后很多問(wèn)題的解決其實(shí)都是利用了這個(gè)先驗(yàn),包括圍棋技術(shù)。AlphaGo的圍棋AI實(shí)際上是在圍棋這個(gè)特定問(wèn)題上用深度學(xué)習(xí)的思路建模,并通過(guò)Google強(qiáng)大的計(jì)算資源不斷進(jìn)行訓(xùn)練。
石建萍介紹道,在IBM“深藍(lán)”時(shí)期,人工智能實(shí)際上還是人總結(jié)規(guī)律,用算法實(shí)現(xiàn)規(guī)律,用高性能計(jì)算硬件來(lái)進(jìn)行計(jì)算的時(shí)期。“深藍(lán)”在象棋上的算法,主要依靠強(qiáng)大的計(jì)算能力窮舉所有路數(shù)來(lái)選擇最佳策略,再加上對(duì)一些明顯選擇的判斷來(lái)縮小窮舉范圍。而象棋棋盤(pán)較小,可能的策略較少,所以當(dāng)時(shí)的人工智能利用這種暴力的做法是可以戰(zhàn)勝人類(lèi)的。但是面對(duì)圍棋這種可能的策略非常多的情況,基于類(lèi)似窮舉方案的算法就無(wú)能為力了。
早在20世紀(jì)90年代,深度學(xué)習(xí)的概念就被提出,但是由于計(jì)算硬件平臺(tái)的限制,大家沒(méi)有辦法訓(xùn)練足夠深的深度學(xué)習(xí)網(wǎng)絡(luò)。這個(gè)驚為天人的想法也因此被雪藏了10多年。目前被頂級(jí)公司和研究界使用的硬件平臺(tái)大致分為三類(lèi),單機(jī)單卡或多卡GPU、GPU集群、CPU集群。使用FPGA加速深度學(xué)習(xí)也是目前業(yè)界和研究界的熱門(mén)方向。
硬件配置和具體的任務(wù)有關(guān)。例如,CPU集群適合解決稀疏鏈接的顯存無(wú)法容納的大模型。如果有問(wèn)題需要這樣的網(wǎng)絡(luò),就會(huì)對(duì)對(duì)應(yīng)的硬件平臺(tái)有所需求。目前計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)的大部分應(yīng)用都可以用單機(jī)多卡GPU來(lái)得到業(yè)界頂尖的成績(jī)。
計(jì)算機(jī)視覺(jué)界四大天王之一Yann Lecun在去年5月的采訪中提及“盡管普遍猜測(cè)Google擁有GPU的數(shù)量在8000個(gè)左右,但事實(shí)上遠(yuǎn)遠(yuǎn)不止,而且隨著圖片、視頻數(shù)據(jù)集的不斷增長(zhǎng),GPU的規(guī)模還在擴(kuò)大?!?/p>
硬件技術(shù)的進(jìn)步是人工智能算法研發(fā)得以推進(jìn)的基礎(chǔ)。SenseTime 異構(gòu)并行計(jì)算總監(jiān)劉文志表示,圍棋之類(lèi)運(yùn)算需要使用神經(jīng)網(wǎng)絡(luò)和蒙特卡羅辦法來(lái)決定下一步的落子,這需要大量的求解和搜索解空間,GPU是神經(jīng)網(wǎng)絡(luò)的很好的加速器,而需要進(jìn)行大量邏輯判斷的蒙特卡羅方法則更適合CPU。從AlphaGo和“異構(gòu)神機(jī)”的相關(guān)報(bào)道來(lái)說(shuō),劉文志認(rèn)為它們都使用了GPU+CPU 來(lái)搭建計(jì)算平臺(tái)。
最近些年基于深度學(xué)習(xí)的人工智能,已經(jīng)完全摒棄了之前基于規(guī)則的方案,通過(guò)給定的輸入輸出,新的學(xué)習(xí)方案可以自動(dòng)學(xué)習(xí)得到給定輸出需要經(jīng)過(guò)的運(yùn)算。在大量訓(xùn)練數(shù)據(jù)的指導(dǎo)下,性能不斷提升。AlphaGo 自我對(duì)弈的訓(xùn)練量多大3000萬(wàn)盤(pán),每一盤(pán)均堪稱(chēng)高手對(duì)決。諸多人類(lèi)高手窮其一生都無(wú)法企及的訓(xùn)練量,AlphaGo在短短幾年的時(shí)間內(nèi)就可以完成。
當(dāng)然,從目前的狀況來(lái)說(shuō),限制普通人體驗(yàn)到AlphaGo這類(lèi)人工智能的瓶頸仍舊是硬件。資料顯示:“目前百萬(wàn)級(jí)的訓(xùn)練數(shù)據(jù)借助GPU一般都能在幾天內(nèi)完成訓(xùn)練;實(shí)際使用時(shí),利用GPU也可以在幾十毫秒內(nèi)完成預(yù)測(cè)”。對(duì)于普通學(xué)生來(lái)說(shuō),如果想單槍匹馬研究深度學(xué)習(xí),單硬件配置一項(xiàng)就耗資不菲;對(duì)于移動(dòng)端來(lái)說(shuō),無(wú)論是存儲(chǔ)容量還是計(jì)算能力,更是無(wú)法同臺(tái)式機(jī)或服務(wù)器的GPU比,深度學(xué)習(xí)幾乎無(wú)法在移動(dòng)端的應(yīng)用。對(duì)于普通人來(lái)說(shuō),想和真正的人工智能高手較量一番,仍需要等待一些時(shí)日。
如果說(shuō)圍棋愛(ài)好者過(guò)分追求棋具是舍本求末,那似乎也只有人工智能才能做到不甚關(guān)注這些“藝術(shù)品”,“全情投入”在棋局中。由人類(lèi)壟斷對(duì)弈名局的日子一去不復(fù)返,流傳千年的人類(lèi)智慧和情感的寄托被古井無(wú)波的程序所取代,未來(lái)無(wú)論是誰(shuí)面對(duì)這位新晉的“大魔王”棋手之時(shí),定會(huì)心存芥蒂。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。