4
本文作者: 金紅 | 2016-03-09 17:55 |
大概在下午3點半之前,想來很多媒體編輯們都已經(jīng)準備好李世石勝利的新聞稿,不過隨著局勢的逆轉(zhuǎn),大家在震驚之后匆忙地修改稿件,就像我,雖然之前我對AlphaGo 贏得比賽的可能是抱有希望的,不過卻不曾想到第一局就是大獲全勝地局面。最后,當李世石投子認輸之時,所有人都沸騰了。人類的最后一道智力防線,就這樣輕易地被瓦解了。
騰訊科技直播截圖,AlphaGo 執(zhí)白棋李世石執(zhí)黑棋
在這之前,押寶李世石贏的人是占多數(shù)的,工程師們也從技術(shù)角度深度分析了這場比賽并得出AlphaGo贏的幾率較小的結(jié)論。然而,現(xiàn)實是,李世石輸了。
之前大家分析AlphaGo 無法戰(zhàn)勝李世石的原因,主要就是圍繞在圍棋的復(fù)雜計算力上。圍棋有多復(fù)雜,在19×19的棋盤內(nèi),共有3361個點,就機器學(xué)習(xí)的角度而言,圍棋的計算最大有3361種局面,大致的體量是10170,而已經(jīng)觀測到的宇宙中,原子的數(shù)量才1080。一句話就是,這已經(jīng)是超出宇宙范圍的計算量了。
這么大的計算量是機器也難以承受之重,所以AlphaGo 的方式是,記住棋譜,3361無法計算,幾千萬的棋譜還是能記住的,通過吸收這些高手留下的棋譜,AlphaGo 能夠快速學(xué)習(xí),再加上其人類無法比擬的計算力,戰(zhàn)勝人類是遲早的事兒。在之前谷歌方面透露的數(shù)據(jù)是,AlphaGo 模仿人類下棋能夠達到57%的準確率,有了這樣的模仿能力之后,AlphaGo 就能準確預(yù)測人類下一步的走法了。
原英特爾中國研究院院長、現(xiàn)馭勢科技聯(lián)合創(chuàng)始人吳甘沙評論這場對弈時如此表示,“當我聽說谷歌挪用了大量機器給AlphaGo 自己對弈時,這個結(jié)果也不在意料之外了?!?/p>
與其它神經(jīng)網(wǎng)絡(luò)一樣,DeepMind 的系統(tǒng)運行在配備了GPU的機器上。GPU最初用于渲染游戲圖像,但后來有人發(fā)現(xiàn),它們很適合深度學(xué)習(xí)。據(jù)悉,此次谷歌為了此次比賽,投入了1200臺機器,2000個GPU,大概是五個月前AlphaGo 對戰(zhàn)歐洲圍棋冠軍樊麾時的20倍,而當時的硬件設(shè)施已經(jīng)是遠超市面上所有的圍棋程序了,另外更是當年深藍計算力的3萬倍,深藍在19年前將國際象棋大師卡斯帕羅夫擊敗同樣成為人工智能的一個里程碑事件。其實這應(yīng)該算得上谷歌的一次違規(guī)行為,因為之前DeepMind 的創(chuàng)始人Hassabis 曾表示,他們只會優(yōu)化系統(tǒng),但會在與李世石的比賽中使用相同的配置。如此看來,也難怪他們會在昨天的發(fā)布會上突然放言,這次比賽李世石毫無勝算。
當然,即使擁有這樣強大的硬件配置,AlphaGo 也無法在比賽一開始計算好所有棋路,這次比賽中,我們看到AlphaGo 的下棋速度并沒有我們想象中的迅速,顯然是每一步都在計算。那么有沒有可能在足夠的硬件配置下,AlphaGo 能夠在一開始就計算好所有步法呢。對此吳甘沙對記者的回答是,不可能,“不可能一開始全部算完,那么多可能性”。看來,人類還是有勝算可能的。
在接到谷歌的挑戰(zhàn)書后,李世石只用了五分鐘就接受了挑戰(zhàn),對于這個首次公開在毫無讓子的情況下戰(zhàn)勝了職業(yè)棋手的人工智能程序,他很好奇它的極限在哪里。了解到AlphaGo 會分析自己過往的棋譜并以此來對付自己,李世石在一開始就棋風(fēng)大改,布了一個此前從未布過的局,這個也被很多人認為是使其最終輸?shù)舯荣惖闹饕?。比賽結(jié)束后,李世石在接受采訪時的回應(yīng)是,“首先作為棋手,我的大賽經(jīng)驗比較多,第一盤輸了并不會動搖我的內(nèi)心。我認為勝負才剛剛開始,我會繼續(xù)去了解對手,現(xiàn)在來評價AlphaGo 為時尚早。“
比賽結(jié)束后,李世石一臉落寞
比賽一共為五場,即使出現(xiàn)3:0的情況也仍會比下去,接下來的比賽會在10號、12號、13號和15號進行,不過在這次比賽中,其實只要AlphaGo 贏了一場就已經(jīng)意味著人工智能贏了。當然,最大的贏家將是谷歌。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。