6
本文作者: 知社學(xué)術(shù)圈 | 2016-01-29 11:22 |
【編者按】本文來自知社學(xué)術(shù)圈士奇。
美國時間1月27日,F(xiàn)acebook與Google兩家之間玩了一場沒有硝煙的戰(zhàn)爭。在相隔不到幾個小時的時間里,雙方先后公布了自家人工智能技術(shù)(AI)在圍棋軟件上的進展與水平。如此緊張的撕咬,恐怕并非巧合。我們來看看到底誰家的人工智能更強一些......
臉書的聲音
周三早上,F(xiàn)acebook創(chuàng)始人扎克伯格在自己的臉書上敲了這么一段:“……科學(xué)家們已經(jīng)花了20年教電腦兄下圍棋,現(xiàn)在我們馬上要實現(xiàn)啦 (We’re getting close)。在過去半年里,我們所創(chuàng)造的AI只用0.1秒就走一步,效果與以前那些幾年才設(shè)計出來的系統(tǒng)一樣好……”
背后的故事
Facebook去年11月就在International Conference on Learning Representations (ICLR) 上發(fā)表了論文《Better Computer Go Player with Neural Network and Long-term Prediction》作者為Yuandong Tian和Yan Zhu兩名華人。論文介紹了代號為黑暗森林的圍棋人工智能系統(tǒng)。幾乎在扎克伯格發(fā)布消息的同一時間,F(xiàn)acebook人工智能研發(fā)中心發(fā)表了該論文的更新版,中心負責(zé)人Yann LeCun也在Facebook上作了相關(guān)介紹。
該項目獨立帶頭人Yuandong Tian表示:“圍棋中極多的分支因子使得傳統(tǒng)的搜索技術(shù)難有建樹,即使在尖端硬件平臺上運行也非常乏力。如果換了黑白方,圍棋的評估體系也會有很大變化?!?/p>
(Facebook圍棋程序已達業(yè)余五段水平)
這一次,他們在新版本系統(tǒng)黑暗森林2上面加入了蒙特卡洛樹搜索,與之前的卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合后,性能有了進一步提升。對戰(zhàn)人類棋手時,黑暗森林2可以達到業(yè)余三段水平;通過7.5萬次運行后,則可以在KGS服務(wù)器上穩(wěn)定保持在業(yè)余五段水平。
谷歌的聲音
同一天,Google在官方博客中表示:“……我們很驕傲地公告天下,我們的科學(xué)家已經(jīng)搞定了圍棋,并攻克了人工智能領(lǐng)域的一項重大挑戰(zhàn) (achieved one of the grand challenges of AI)……”
兩邊的開場白都從介紹中國古代這項頭腦競技開始,Google甚至還提到了孔子和四藝。不過就后面的用詞來看,Google的技術(shù)似乎更勝一籌。
背后的故事
Google的圍棋論文可謂來得早不如來得巧。
同樣在1月27日,DeepMind團隊發(fā)表的《Mastering the game of Go with deep neural networks and tree search》作為Nature封面論文上線。
DeepMind是一個位于倫敦的人工智能團隊,2014年其公司被Google以4億英鎊的價格收購。團隊創(chuàng)始人Demis Hassabis在周三發(fā)表的官方博客中表示,他們開發(fā)的圍棋程序AlphaGo融合了高級樹狀查找和深度神經(jīng)網(wǎng)絡(luò)。通過對神經(jīng)網(wǎng)絡(luò)進行的3000萬步訓(xùn)練 (所有棋譜均來自人類專業(yè)棋手的比賽),AlphaGo預(yù)測出人類對手下一步走法的正確率已經(jīng)達到了57%,之前的紀(jì)錄是44%。
(AlphaGo 5-0 擊敗樊麾)
談到圍棋戰(zhàn)績,Google明顯應(yīng)該更驕傲一些。AlphaGo在2015年10月5日以五連勝的成績擊敗了歐洲圍棋冠軍樊麾。這次對決完全符合比賽規(guī)則,沒有任何讓棋設(shè)定。今年三月,AlphaGo將對陣世界頂尖棋手——韓國“飛禽島少年”李世乭。讓我們拭目以待。
(韓國棋手李世乭)
樊麾,2013-2015年三度歐洲圍棋冠軍
在中國,圍棋不僅是一項比賽,它還是生活的一面鏡子。我們說,假如你的棋下得有問題,那很可能是你心性的問題——棋如其人。
輸棋確實很難過。和AlphaGo對戰(zhàn)之前,我覺得我能贏。在第一局失利后,我改變了戰(zhàn)術(shù),增強了進攻,但還是輸了。問題是人類有時會犯致命的錯誤,因為我們是人。有時我們會疲憊,有時我們求勝心切,我們總有這樣那樣的壓力。電腦程序不會這樣,它非常強,也非常穩(wěn)定,簡直就像一堵墻一樣。對我來說這是很大的差別。我知道AlphaGo是個電腦,但如果沒人告訴的話,我可能會覺得它是個有點陌生卻又非常強大的對手,是個真人。
當(dāng)然,輸?shù)舯荣愖屛也惶_心,不過作為職業(yè)選手,我們輸過很多比賽。所以,失敗了就從中學(xué)習(xí),也許會有所收獲??傊畯拈L遠來講這是一件好事。
Toby Manning,英國圍棋協(xié)會司庫,樊麾人機對戰(zhàn)的裁判
圍棋玩家都知道,人工智能尚未解決圍棋這個問題。所以我想人們會希望見到電腦達到人類專業(yè)水平,但我覺得這可能還要10年的時間。在這次比賽中,我本來是看好樊麾的。
很神奇的是,在比賽過程中你很難分辨誰是人類,誰是電腦。在很多圍棋軟件的比賽中,你可以看到很多合理的棋路,然后電腦還是會瞬間崩盤。但這次不一樣,你真的很難分辨誰是誰。
AlphaGo與人類不同的一大特點是掌控時間的方式,樊麾下棋所用的時間比電腦要長。AlphaGo的路數(shù)看起來并不像人類那樣具有侵略性。它會平靜地布局,而非發(fā)起進攻或試圖吃掉一片棋子。
我認為圍棋界的主要反應(yīng)會是,就像IBM的深藍獲得國際象棋大師地位后一樣,人們希望自己能夠掌控軟件,并在自己的比賽中彌補自己的不足。
Hajin Lee,國際圍棋聯(lián)合會秘書長
當(dāng)我知道那個電腦要挑戰(zhàn)職業(yè)頂尖棋手李世乭的時候,真的很吃驚。我當(dāng)時覺得這個挑戰(zhàn)者絕對對頂級選手有多強完全沒概念。但實際上,可能我才是那個不知道這個電腦有多強的人?,F(xiàn)在我對這個比賽非常興奮。
誰會贏呢?我不知道。李世乭自己也覺得可能那電腦跟他一樣強??赡苁俏衣牭搅颂郃lphaGo的消息,我現(xiàn)在驚訝于它的強大。同時我也非常了解李世乭的水平,所以我認為他們雙方五五開吧。
我覺得圍棋是個很有內(nèi)涵的競技,我不覺得如果電腦AI擊敗了人類會對圍棋造成什么傷害。我想人們會接受自己被電腦技術(shù)超越這件事。
Jonathan Schaeffer,阿爾伯塔大學(xué)計算機科學(xué)家,Chinook設(shè)計師
我想這還不是圍棋版的深藍時刻。真正的成就是這個程序能作為選手在頂級比賽中較量的時候。深藍從1989年開始就常常戰(zhàn)勝各路大師,最后登頂則是八年之后的事情。但就目前情況來看,我認為AlphaGo和頂級人類選手之間的差距被大大縮短了??赡苤恍枰龠M行一點努力和改善,再提高一點計算能力,不出一兩年,它就能打敗人類。
就今年3月份的比賽來說,不是打擊AlphaGo團隊,我還是看好人類。我們可以把AlphaGo看成是少年天才。它突然學(xué)了一手好棋,進步神速,但畢竟還是經(jīng)驗有限。從國際象棋和西洋跳棋來看,經(jīng)驗還是很重要的。
Demis Hassabis,DeepMind創(chuàng)始人
AlphaGo正在突飛猛進,甚至?xí)阶畎舻娜祟愡x手。能夠看它在圍棋規(guī)則內(nèi)去創(chuàng)造新的東西,感覺很神奇。我們對自己創(chuàng)造的這個系統(tǒng)有種很密切的感情,特別是它被創(chuàng)造的方式——它會學(xué)習(xí),我們也會教它,它的風(fēng)格就像人一樣。和其他編出來的程序不同,你不知道它到底都會什么,因為它能夠自己學(xué)習(xí)。
用Facebook人工智能研究中心Yuandong Tian的話說,兩家公司確實存在著某種“友好”的競爭。是呀,這樣兩家公司之間的較量一定是件好事。腦海里不禁想起了去年Google Chrome團隊送給Microsoft Edge團隊的那個大蛋糕,不知道這一次是誰送給誰呢?
參考文獻
1. Nature doi:10.1038/nature.2016.19255
2. http://120.52.73.78/arxiv.org/pdf/1511.06410.pdf
3. Googleblog、Facebook、 Wired
【作者介紹】知社學(xué)術(shù)圈,由清華教授發(fā)起的海歸學(xué)者發(fā)起的公益學(xué)術(shù)交流平臺,旨在分享學(xué)術(shù)信息,整合學(xué)術(shù)資源,加強學(xué)術(shù)交流,促進學(xué)術(shù)進步。
作者文章推薦閱讀:
1、機器自學(xué)72小時堪比國際大師,深度學(xué)習(xí)到底有多厲害?
2、谷歌AlphaGo的勝利:不是計算機打敗了人類,而是人類打敗了人類
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。