丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
特寫(xiě) 正文
發(fā)私信給溫曉樺
發(fā)送

5

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

本文作者: 溫曉樺 2016-03-10 19:22
導(dǎo)語(yǔ):由于AlphaGo執(zhí)黑的先手權(quán),我們也看到了它學(xué)習(xí)和創(chuàng)新能力的一面。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

via medium

今日,圍棋“人機(jī)大戰(zhàn)”第二場(chǎng)于北京時(shí)間中午12點(diǎn)開(kāi)戰(zhàn)。下午4點(diǎn)半,韓國(guó)棋手李世乭九段再次輸給 Google 的圍棋程序 AlphaGo。本輪對(duì)戰(zhàn)的結(jié)果雖然還是讓人震驚,但人們更多地也開(kāi)始感嘆AlphaGo的優(yōu)異之處。

今日,AlphaGo的表現(xiàn)中,計(jì)算力的先決優(yōu)勢(shì)依然不變,同時(shí),由于AlphaGo執(zhí)黑的先手權(quán),我們也看到了它學(xué)習(xí)能力和創(chuàng)新能力的一面。

AlphaGo的“特異功能”:自我強(qiáng)化

在DeepMind,愛(ài)丁堡和Facebook,研究人員希望神經(jīng)網(wǎng)絡(luò)能像人類選手一樣,通過(guò)觀看棋盤(pán)學(xué)習(xí)圍棋。Facebook在最新的研究中表明,這種方法確實(shí)可行。結(jié)合深度學(xué)習(xí)與蒙特卡洛樹(shù)搜索方法,F(xiàn)acebook打敗了一些人類選手,雖然并非是Crazystone和其他頂尖選手。

但DeepMind走得更遠(yuǎn)。在經(jīng)過(guò)3000萬(wàn)步人類走法的訓(xùn)練后,它的神經(jīng)網(wǎng)絡(luò)能以57%的準(zhǔn)確度(此前記錄是44%)預(yù)測(cè)人類的下一步。然后Hassabis和團(tuán)隊(duì)通過(guò)強(qiáng)化學(xué)習(xí)技術(shù),讓這一神經(jīng)網(wǎng)絡(luò)與它自己的另一個(gè)稍有區(qū)別的版本對(duì)戰(zhàn)。兩者互搏中,系統(tǒng)會(huì)評(píng)估哪一步效果最好,即占領(lǐng)更多棋盤(pán)區(qū)域。最終,神經(jīng)網(wǎng)絡(luò)在判斷哪一步更好時(shí)會(huì)越來(lái)越優(yōu)秀。

DeepMind的研究者David Silver表示,“在與其它神經(jīng)網(wǎng)絡(luò)和它自己對(duì)戰(zhàn)數(shù)百萬(wàn)局后,AlphaGo學(xué)會(huì)了自己發(fā)現(xiàn)新策略?!?/p>

正是這種方法,AlphaGo超越了其它圍棋AI系統(tǒng),并讓?xiě)?zhàn)勝人類選手成為可能。那么,在今天的表現(xiàn)中,AlphaGo如何體現(xiàn)出這樣的能力呢?

讓人意外的開(kāi)局

今天的第二局中, AlphaGo執(zhí)黑先手,眾人也紛紛猜測(cè):它會(huì)如何開(kāi)局?會(huì)走公認(rèn)有優(yōu)勢(shì)的中國(guó)流嗎?然而,兩手之后,AlphaGo沒(méi)有選擇中國(guó)流,而直接掛角。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

隨后,按照這種定式,職業(yè)棋手通常會(huì)先在下邊完成拆邊的定型。不過(guò),AlphaGo并沒(méi)有這么做,而是走出令人眼前一亮的走法:黑棋脫先,還原成中國(guó)流布局。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

為何要脫先?為何要用這種方式完成中國(guó)流布局?在AlphaGo數(shù)據(jù)庫(kù)中,應(yīng)該有更多的選擇來(lái)參考變化。而根據(jù)接下來(lái)十幾手毫不示弱的走法看,這手脫先也許代表著機(jī)器人對(duì)布局有了新的理解。

出其不意攻其不備

除了開(kāi)局的策略展示出計(jì)算機(jī)圍棋的另類,AlphaGo在開(kāi)局后的走子也時(shí)常走出出人意料的招數(shù),形成一股“機(jī)器風(fēng)”。

比如,下圖黑1的這一手,飄防的走法在過(guò)去的棋譜中較為罕見(jiàn),但其妙處也給了人們新的啟發(fā)。這手最新的黑1余此前J16的一手遙相呼應(yīng),防守中做好進(jìn)攻的勢(shì)來(lái)。李喆六段表示:“對(duì)于黑方這步棋,作為棋手,我的震撼比看到外星人還要大?!边@一手讓對(duì)手李世乭長(zhǎng)考了一陣。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

由于掌握先手,AlphaGo進(jìn)取的一面也更清楚地展現(xiàn)了出來(lái)。比如,在左下方的局部爭(zhēng)奪上,擁有強(qiáng)大計(jì)算力的AlphaGo應(yīng)戰(zhàn)積極,非常自信。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

最優(yōu)化計(jì)算:無(wú)劫爭(zhēng)是必然還是偶然?

今天,許多人都提出了一個(gè)疑問(wèn):為何兩局結(jié)束后還沒(méi)有出現(xiàn)劫爭(zhēng)的情形?甚至推論AlphaGo不懂得打劫,且Google方面可以隱瞞。我們暫且不去猜測(cè)這種可能性,不妨看看它與AlphaGo走子毫不保留之間的聯(lián)系。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

AlphaGo今天表現(xiàn)出一個(gè)特點(diǎn)是:毫不保留。如上圖黑2,又是一手把變化走干凈的棋,與職業(yè)選手喜歡有所保留的習(xí)慣不同。對(duì)此,小編有兩個(gè)想法:一是,正因?yàn)锳lphaGo精密的計(jì)算力以及作為機(jī)器以最強(qiáng)點(diǎn)為首的原則,所以它才會(huì)每一步都走到盡,才會(huì)走出許多的“怪棋”。二是,也因?yàn)槿绱瞬艑?dǎo)致局面缺乏劫材。

曹大元九段表示,極度復(fù)雜打劫的情況本身千年難遇,哪怕是人與人之間的對(duì)弈。

人機(jī)大戰(zhàn)第二場(chǎng)綜述:“自我強(qiáng)化”比2:0更值得注意

AlphaGo能給人類圍棋帶來(lái)啟發(fā)嗎?

經(jīng)此一弈,AlphaGo在許多地方走出特別的一手,給人類棋手帶來(lái)新的思考。某些也許是失誤(但究竟什么是失誤,誰(shuí)知道呢),但某些地方,直播中的曹大元表示:不可思議,我要報(bào)警了!不過(guò),這對(duì)職業(yè)棋手也有很大的啟發(fā),可以進(jìn)行深度研究。互聯(lián)網(wǎng)進(jìn)化論提出者劉鋒則表示,通過(guò)這些跡象,也能幫助我們更好地研究AlphaGo。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)