8
今天,大家都在興奮地傳播著一條消息:谷歌AI在圍棋上戰(zhàn)勝了歐洲冠軍。興奮的理由是,人工智能在被定義為最難攻克的圍棋上戰(zhàn)勝人類職業(yè)棋手。人類與AI之間的最后一堵防護墻,正在一點一點坍塌。
谷歌使用的人工智能軟件是AlphaGo,由谷歌去年收購的人工智能公司DeepMind研發(fā),其中兩個神經(jīng)網(wǎng)絡(luò)有著關(guān)鍵的作用,一個叫決策網(wǎng)絡(luò)(policy network),負責(zé)選擇下一步走法,另一個叫值網(wǎng)絡(luò)(value network),負責(zé)預(yù)測棋盤上不同的分布會帶來什么不同的結(jié)果。
此次AlphaGo戰(zhàn)勝的是歐洲圍棋冠軍樊麾(法國國家圍棋隊總教練),AlphaGo以5-0完勝。但AlphaGo真正的挑戰(zhàn)是2個月后,與韓國圍棋九段高手李世石的對弈。而樊麾雖為歐洲圍棋冠軍,但實際上也僅為二段水平。高手與頂級高手之前也存在很大差距,不知道在AlphaGo與李世石之間,隔了多少個樊麾。此前圍棋軟件ZEN、Crazystone都戰(zhàn)勝過九段圍棋高手,不過都是在對方讓子的前提下。
樊麾與AlphaGo的對弈棋譜,黑方為樊麾,白方為AlphaGo
圍棋到底有多難?在19×19的棋盤內(nèi),共有361個點,就機器學(xué)習(xí)的角度而言,圍棋的計算最大有3361次方種局面,大致的體量是10170,而已經(jīng)觀測到的宇宙中,原子的數(shù)量才1080。而相較之下,國際象棋每一步平均只有35種可能性的走法,最多只有2155種局面。
如此大的計算量無疑是對人工智能的一大挑戰(zhàn),但實際上,人工智能是與人類一樣,通過不斷模仿而戰(zhàn)勝對手的。一個圍棋愛好者向雷鋒網(wǎng)編輯表示,人工智能其實是一個模仿高手,通過記住大量高手在以往對弈中的棋譜,并不斷練習(xí),從而研究出新的招數(shù)。
“圍棋2500年,積累了很多棋譜,棋譜除了對開局定式的研究,然后就是很多高手實戰(zhàn)中下出比較有借鑒意義的棋局。計算機能夠記住3000萬步棋譜(谷歌這個就是先用這些來訓(xùn)練的),人類是記不住的,很多時候,要依靠現(xiàn)場的純腦計算。就像職業(yè)棋手懂得對現(xiàn)有棋譜進行拆解一樣,拆解過程研究出新的變化,因為有時棋譜象征著某一個招數(shù)達到最優(yōu),因為是當時最厲害那個人下出來的,但后人總可以超越,谷歌這個特點就在于能夠在棋譜訓(xùn)練中計算出新的變化(走法),否則充其量只能和人類打平手的水平。”
除了需要記住大量棋譜,人工智能還需要一個高手來讓自己不斷提高。ZEN早年就拉上日本一流高手,九段棋手武宮正樹作為陪練,2012年3月,在武宮正樹讓五子和四子的前提下,ZEN連勝兩盤。武宮正樹“宇宙流”式下棋特點,也被ZEN很好地模仿了去。因此,AlphaGo如果想戰(zhàn)勝李世石,最快的方式是找到一個同水平的高手作為陪練,最好是熟悉李世石下棋特點的人。因為,留給它的時間已經(jīng)不多了。
李世石
對于人類來說,因天分和后天努力程度,每個人提升速度會不一樣,有人20歲就能躋身世界冠軍,有人窮盡一生也入不了高手榜。但無論如何,在很多人眼里,圍棋并非一蹴而就。就比如最近引起輿論嘩然的“真瘋叔叔”的“六天速成法”,宣稱可以讓成年人在六天之內(nèi),圍棋水平從零基礎(chǔ)提高到業(yè)余1段,不過回應(yīng)他的,是來自圍棋界的各種嘲笑。
六天從零基礎(chǔ)提高到業(yè)余1段,如果放在人工智能身上,或許有這個可能。不過想要從職業(yè)二段挑戰(zhàn)職業(yè)九段,贏得可能性并不大。圍棋作為起源于中國的博弈游戲,在亞洲的流行更加廣泛,在歐美等地區(qū),圍棋的普及度還較低,這也就是為什么會出現(xiàn)一個二段棋手成為歐洲冠軍。在這種情況下,AlphaGo很難遇到一個頂級高手,也就妄論戰(zhàn)勝頂級高手了。
不過,圍棋的復(fù)雜度與挑戰(zhàn)難度,令其成為人工智能最想攻克的難題。一個多月前,DeepMind的CEO Demis Hassabis在一個視頻采訪中透露,他們的秘密團隊可能將破解圍棋。Hassabis在談到這個可能時表現(xiàn)得很興奮,因為在他看來這是個了不起的挑戰(zhàn)?!?span style="line-height: 1.8;">它不像國際圍棋那樣需要蠻力,它實際上是漂亮的,有規(guī)律可循,有形狀可追的,而這些通常是計算機不擅長的,因此它非常了不起?!?/span>
除了谷歌,F(xiàn)acebook也在進行AI攻克圍棋的測試。就在《Nature》報道了AlphaGo戰(zhàn)勝樊麾的前一天,F(xiàn)acebook也在arXiv.org上更新了一篇用卷積神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索相結(jié)合來解決圍棋問題的新論文。Facebook人工智能實驗室負責(zé)人Yann LeCun在論文中表示,作為一項非常困難的任務(wù),圍棋是一個很好的案例來驗證各種學(xué)習(xí)技能的結(jié)合,包括模式識別、問題解決和規(guī)劃等,也是一個可以用來測試新想法的工具,包括機器學(xué)習(xí)、推理和規(guī)劃的結(jié)合。因此,戰(zhàn)勝圍棋高手,不僅僅是一場游戲,更重要的是人工智能的突破。而人工智能對于人類的影響,將是無限可能的。
從國際象棋的經(jīng)驗看,1997 年人工智能第一次打敗人類后,直到2006年,人工智能在人類這里再無對手。而人工智能想要在圍棋上完全戰(zhàn)勝人類,還需要不斷地練習(xí)。至少這次,贏得可能性很小。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。