丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
特寫(xiě) 正文
發(fā)私信給溫曉樺
發(fā)送

9

Google人工智能攻破了圍棋,然后呢?

本文作者: 溫曉樺 2016-01-28 12:17
導(dǎo)語(yǔ):它代表了一種方向:即如果AI能理解圍棋,它也會(huì)理解更多事。如果宇宙就是一局超大型的圍棋呢?

Google人工智能攻破了圍棋,然后呢?

Google日前宣布其程序AlphaGo擊敗了歐洲圍棋職業(yè)選手,這意味著人工智能技術(shù)又或得了極大的突破。

計(jì)算機(jī)目前已經(jīng)在許多智力游戲比賽上戰(zhàn)勝了人類頂級(jí)選手,包括國(guó)際象棋、五子棋、黑白棋、拼字游戲等等。而對(duì)于有著2500年歷史的東方游戲圍棋——比國(guó)際象棋要復(fù)雜得多——人類始終能夠保持在和計(jì)算機(jī)對(duì)決中的勝利。不過(guò),Google人工智能專家表示, 這個(gè)壁壘或許很快將要被打破。隨著AlphaGo在沒(méi)有任何讓子的情況下以5:0完勝法國(guó)圍棋職業(yè)二段棋手樊麾,AlphaGo將在三月份對(duì)戰(zhàn)韓國(guó)九段棋手李世乭。

今天早上,《自然》雜志發(fā)表了一篇Google DeepMind團(tuán)隊(duì)——程序AlphaGo的創(chuàng)造者撰寫(xiě)的關(guān)于深度學(xué)習(xí)系統(tǒng)的論文。根據(jù)論文描述,在AlphaGo中,DeepMind研究員在程序中錄入了大量職業(yè)棋手的棋譜——加起來(lái)多達(dá)3000萬(wàn)步——他們用增強(qiáng)學(xué)習(xí)的方法訓(xùn)練AI,讓它自己下棋,研習(xí)棋譜。不過(guò)這只是第一步。理論上,這樣的訓(xùn)練只能讓這個(gè)人工智能系統(tǒng)無(wú)法突破人類的計(jì)算。為了獲得更好的成績(jī),研究員隨后讓系統(tǒng)進(jìn)行自我博弈,計(jì)算出比基礎(chǔ)棋譜更多新的打點(diǎn)。也就是說(shuō),戰(zhàn)勝人類就要靠這些新的東西。

“這其中最重要的是,AlphaGo不僅記錄著大量的棋譜,還有一系列規(guī)則來(lái)指導(dǎo)‘思考’,”DeepMind CEO Demis Hassabis說(shuō)道,“事實(shí)上,該程序能夠通過(guò)機(jī)器學(xué)習(xí)的方式掌握比賽技巧?!?/p>

DeepMind的技術(shù)核心結(jié)合了“強(qiáng)化學(xué)習(xí)”及其他人工智能手段,這種技術(shù)能夠用于解決現(xiàn)實(shí)機(jī)器人執(zhí)行物理任務(wù)和對(duì)環(huán)境作出回應(yīng)的技術(shù)問(wèn)題。就是說(shuō),要讓機(jī)器人變得更“自然”。

視覺(jué)判斷

2014年初, Coulom的圍棋程序“瘋石(Crazystone)”在一次比賽中戰(zhàn)勝九段棋手依田紀(jì)基。但是當(dāng)時(shí)是在人類棋手讓出4子的情況下贏得比賽,而這次AlphaGo并沒(méi)有被讓子,可以說(shuō)比賽很公平。

人工智能戰(zhàn)勝人類圍棋到底有多難?即使是最強(qiáng)大的計(jì)算機(jī)系統(tǒng)也無(wú)法在合理的時(shí)間內(nèi)分析出下一步最優(yōu)的走法。1997年IBM超級(jí)計(jì)算機(jī)“深藍(lán)”則利用了蒙特卡洛搜索樹(shù)的方式做到了這一點(diǎn)?!吧钏{(lán)”能夠預(yù)測(cè)出對(duì)手下一步會(huì)怎么走,而且計(jì)算力遠(yuǎn)高于人類。但是,圍棋要復(fù)雜得多。國(guó)際象棋每一步平均只有35種可能性的走法,但是圍棋呢——在19*19的棋盤(pán)內(nèi),共有361個(gè)點(diǎn),就機(jī)器學(xué)習(xí)的角度而言,圍棋的計(jì)算最大有3^361次方種局面,大致的體量是10^170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才10^80。國(guó)際象棋最多只有2^155種局面

使用蒙特卡洛樹(shù)搜索技術(shù),Crazystone等系統(tǒng)能夠進(jìn)行更長(zhǎng)遠(yuǎn)的計(jì)算。而結(jié)合其他技術(shù)的話,它們能夠?qū)赡苄宰叻ㄟM(jìn)行刷選,然后選擇出最優(yōu)的策略。在大多數(shù)情況下,它們能夠戰(zhàn)勝人類選手,但不是最厲害的那一個(gè)。頂級(jí)大師中,走法很多時(shí)候依靠直覺(jué)——做棋除了需要計(jì)算,還有棋感——棋手能夠根據(jù)棋形分析攻防線路?!昂玫钠逍慰雌饋?lái)順手多了,”Hassabis本身也是一名圍棋手,“這其中不只有計(jì)算角力,還有審美。這也是圍棋幾千年來(lái)都讓人著迷的原因?!?/p>

因此,從2014年至2015年間,包括Facebook、愛(ài)丁堡大學(xué)、DeepMind等人工智能研究團(tuán)隊(duì)都將圍棋人工智能系統(tǒng)的突破方向瞄準(zhǔn)為——使得程序能夠模仿人類的直覺(jué)式思維。

自我強(qiáng)化

深度學(xué)習(xí)要依靠神經(jīng)網(wǎng)絡(luò)技術(shù),它是可以模擬人腦中神經(jīng)元網(wǎng)絡(luò)的軟硬件網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)不會(huì)依靠蠻力或預(yù)先輸入的規(guī)則,而是會(huì)分析大量數(shù)據(jù),“學(xué)習(xí)”特定的任務(wù)。給神經(jīng)網(wǎng)絡(luò)提供足夠的喵星人照片,它就能學(xué)習(xí)識(shí)別喵星人;提供足夠的語(yǔ)音,它也會(huì)學(xué)習(xí)理解人類的語(yǔ)言;提供足夠的圍棋走法,它也會(huì)學(xué)會(huì)圍棋。

在DeepMind,愛(ài)丁堡和Facebook,研究人員希望神經(jīng)網(wǎng)絡(luò)能像人類選手一樣,通過(guò)觀看棋盤(pán)學(xué)習(xí)圍棋。Facebook在最新的研究中表明,這種方法確實(shí)可行。結(jié)合深度學(xué)習(xí)與蒙特卡洛樹(shù)搜索方法,F(xiàn)acebook打敗了一些人類選手,雖然并非是Crazystone和其他頂尖選手。

但DeepMind走得更遠(yuǎn)。在經(jīng)過(guò)3000萬(wàn)步人類走法的訓(xùn)練后,它的神經(jīng)網(wǎng)絡(luò)能以57%的準(zhǔn)確度(此前記錄是44%)預(yù)測(cè)人類的下一步。然后Hassabis和團(tuán)隊(duì)通過(guò)強(qiáng)化學(xué)習(xí)技術(shù),讓這一神經(jīng)網(wǎng)絡(luò)與它自己的另一個(gè)稍有區(qū)別的版本對(duì)戰(zhàn)。兩者互搏中,系統(tǒng)會(huì)評(píng)估哪一步效果最好,即占領(lǐng)更多棋盤(pán)區(qū)域。最終,神經(jīng)網(wǎng)絡(luò)在判斷哪一步更好時(shí)會(huì)越來(lái)越優(yōu)秀。

DeepMind的研究者David Silver表示,“在與其它神經(jīng)網(wǎng)絡(luò)和它自己對(duì)戰(zhàn)數(shù)百萬(wàn)局后,AlphaGo學(xué)會(huì)了自己發(fā)現(xiàn)新策略,并逐漸提高了水平?!?/p>

正是這種方法幫AlphaGo超越了其它圍棋AI系統(tǒng),包括Crazystone。但事情還沒(méi)完,研究人員隨后將結(jié)果再反饋給第二個(gè)神經(jīng)網(wǎng)絡(luò)。了解前任的走法了,第二個(gè)神經(jīng)網(wǎng)絡(luò)會(huì)使用許多相同的技術(shù)來(lái)判斷每一步的后果。這一過(guò)程與深藍(lán)等舊系統(tǒng)在國(guó)際象棋上的做法類似,只是它會(huì)在下棋過(guò)程中學(xué)習(xí),分析更多數(shù)據(jù),而非暴力破解所有可能的步驟。這樣,AlphaGo不僅能戰(zhàn)勝AI,還能戰(zhàn)勝頂尖人類選手了。

計(jì)算機(jī)網(wǎng)絡(luò)

Google人工智能攻破了圍棋,然后呢?

李世乭

與其它神經(jīng)網(wǎng)絡(luò)一樣,DeepMind的系統(tǒng)運(yùn)行在配備了GPU的機(jī)器上。GPU最初用于渲染游戲圖像,但后來(lái)有人發(fā)現(xiàn),它們很適合深度學(xué)習(xí)。Hassabis表示,DeepMind系統(tǒng)在裝備了一定數(shù)量GPU芯片的單一電腦上也可以用,但與樊麾對(duì)戰(zhàn)中,他們用上了更大的計(jì)算機(jī)網(wǎng)絡(luò),其包括170個(gè)GPU和1200個(gè)標(biāo)準(zhǔn)CPU。大的計(jì)算機(jī)網(wǎng)絡(luò)訓(xùn)練了同樣的系統(tǒng)并進(jìn)行了實(shí)際對(duì)戰(zhàn),還借鑒了訓(xùn)練的結(jié)果。

盡管Hassabiss會(huì)不斷改善系統(tǒng),但待AlphaGo與韓國(guó)選手李世乭對(duì)戰(zhàn)時(shí),他們會(huì)使用相同的配置。比賽中系統(tǒng)也需要網(wǎng)絡(luò)連接,而且他們會(huì)“自己鋪設(shè)光纖”。

挑戰(zhàn)世界冠軍比挑戰(zhàn)樊麾難得多,但Coulom還是認(rèn)為DeepMind會(huì)贏。他過(guò)去數(shù)十年一直在開(kāi)發(fā)能打敗最好選手的系統(tǒng),現(xiàn)在他認(rèn)為這一目標(biāo)已經(jīng)實(shí)現(xiàn)了,他買(mǎi)GPU會(huì)贏。

接下來(lái)……

AlphaGo的重要性不言而喻。同樣的技術(shù)還能用于機(jī)器人和科學(xué)研究,以及類似于Siri的數(shù)字助理和金融系統(tǒng)。深度學(xué)習(xí)創(chuàng)業(yè)Skymind的創(chuàng)始人Chris Nicholson就認(rèn)為,技術(shù)“能用于任何對(duì)抗性問(wèn)題,任何類似于游戲且需要策略的事情,包括戰(zhàn)爭(zhēng)、商業(yè)和交易”。

對(duì)有些人來(lái)說(shuō),這是一件值得憂慮的事,特別是DeepMind的系統(tǒng)還能自己學(xué)會(huì)下圍棋。它不僅能從人類提供的數(shù)學(xué)中學(xué)習(xí),還能生成自己的數(shù)據(jù),在與自己下棋中學(xué)習(xí)。特斯拉創(chuàng)始人埃隆·馬斯克等大佬多次聲明,這類AI系統(tǒng)會(huì)最終超越人類智能,脫離掌控。

幸而DeepMind的系統(tǒng)還在Hassabis等人的控制之下。雖然他們用系統(tǒng)破解了復(fù)雜的游戲,但這仍只是個(gè)游戲。AlphaGo離人類智能還很遠(yuǎn),更不論超級(jí)智能了。下棋是一種高度結(jié)構(gòu)化的情景,系統(tǒng)也沒(méi)有人類級(jí)別的理解力。但它代表了一種方向,即如果AI能理解圍棋,它也會(huì)理解更多事。如果宇宙就是一局超大型的圍棋呢?

via Wired

作者:張馳 曉樺

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)