丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給宗仁
發(fā)送

0

經(jīng)過一年的修煉,AlphaGo的哪些能力突飛猛進(jìn)了?

導(dǎo)語:經(jīng)過一年的修煉,AlphaGo的的哪些能力突飛猛進(jìn)了?

雷鋒網(wǎng)AI科技評(píng)論按:烏鎮(zhèn)圍棋峰會(huì)第一局已經(jīng)結(jié)束了,歷時(shí)4個(gè)半小時(shí),以柯潔九段執(zhí)黑負(fù)于 AlphaGo,AlphaGo 贏四分之一子告終,這樣風(fēng)平浪靜的結(jié)果想必很多人都預(yù)測(cè)到了,不過大家從一開始就知道關(guān)注的重點(diǎn),不在于柯潔怎么輸?shù)?,而是AlphaGo已經(jīng)進(jìn)化到什么程度了,距離Deep Mind團(tuán)隊(duì)出論文來詳解AlphaGo有多強(qiáng)還有一段時(shí)間,So我們其實(shí)可以從現(xiàn)場(chǎng)觀戰(zhàn)中來看出一些端倪。

棋速

第一局棋下到一半的時(shí)候,不少棋友群里的人沸騰了,發(fā)現(xiàn)AlphaGo落子速度非??欤坎狡迓渥铀俣仍?0S-40S之間波動(dòng),對(duì)此圍棋業(yè)余5段趙老師對(duì)雷鋒網(wǎng)AI科技評(píng)論表示:“(這局棋)像安樂死,不知不覺就輸了,(相比去年)機(jī)器落子飛快但錯(cuò)誤基本沒有”。

綜合整局,AlphaGo落子表現(xiàn)冷靜、果斷,而柯潔的落子狀況較多變。最終在比賽進(jìn)行了四個(gè)多小時(shí)之后,AlphaGo贏四分之一子。

棋風(fēng)

AlphaGo1.0的時(shí)候(去年3月跟李世石對(duì)戰(zhàn)的時(shí)候),它的棋風(fēng)概括起來就是擅長記住棋譜+增強(qiáng)學(xué)習(xí)+計(jì)算能力,身上還能看到人類棋風(fēng)的影子,等AlphaGo喬裝成Master60連勝的時(shí)候,許多圍棋大師包括聶衛(wèi)平在內(nèi)開始評(píng)價(jià)其棋風(fēng)“很難揣測(cè)Master的風(fēng)格……它永遠(yuǎn)都沒有表情,永遠(yuǎn)不受情緒影響,永遠(yuǎn)一個(gè)節(jié)奏,就是要贏你?!倍裉欤谝痪制暹€沒結(jié)束的時(shí)候,搜狗王小川已在知乎上發(fā)文剖析AlphaGo2.0 棋風(fēng)“完全脫離人類經(jīng)驗(yàn)”——“而AlphaGo2.0脫離了機(jī)器對(duì)人模仿,走棋風(fēng)格也將完全脫離人的定式。在與柯潔的比賽中,會(huì)不斷出現(xiàn)我們意想不到的走棋,而且這些走棋在教科書中會(huì)被認(rèn)為是低級(jí)錯(cuò)誤或者完全不可理喻,但凡一個(gè)正常的棋手都不會(huì)這么玩,但凡一個(gè)新手這么玩都會(huì)被點(diǎn)撥這樣不對(duì)。而AlphaGo2.0會(huì)不斷制造這樣的局面,關(guān)鍵他還是對(duì)的?!?/p>

不過最后還是柯潔說了算,他在會(huì)后的采訪中用了一個(gè)很好的例子說明了AlphaGo的棋風(fēng)莫測(cè):(在回顧比賽時(shí)也對(duì)第54手的斷)時(shí),他表示了肯定:“很震驚,這在人類的下法中是不能有的。在斷之后,它把自己的腳步實(shí)地化,變得更厚,一石二鳥?!薄?/p>

算法

AlphaGo1.0的時(shí)候(去年3月跟李世石對(duì)戰(zhàn)的時(shí)候)使用的算法精髓,根據(jù)FB田淵棟看完Nature論文的解讀,由估值網(wǎng)絡(luò)評(píng)估棋局,策略網(wǎng)絡(luò)選擇落子,快速走子(Fast rollout)適當(dāng)加速,再用蒙特卡羅樹搜索把以上這三個(gè)部分連起來,形成一個(gè)完整的系統(tǒng)。

這一次雖然知乎論壇等活躍地盤已經(jīng)開始紛紛推測(cè)這次的AlphaGo2.0用了什么牛叉的算法,有了硬件的預(yù)測(cè)失誤,真相還是等Deep Mind后面來親自公布,目測(cè)算法預(yù)測(cè)這個(gè)要根據(jù)它的單機(jī)版10個(gè)GPU+TPU助力預(yù)測(cè)比較靠譜。

硬件需求降低

根據(jù)DeepMind員工發(fā)表在2016年1月Nature期刊的論文,分布式版本(AlphaGo Distributed)使用了1202個(gè)CPU和176個(gè)GPU。

不過這次比賽AlphaGo用的何種硬件配置,DeepMind在會(huì)后的新聞發(fā)布會(huì)中表示,這次比賽的AlphaGo是新版本,它改善了新的算法,主要進(jìn)步是計(jì)算量少了十倍,自我對(duì)弈更強(qiáng)。Hassabis稱,在比賽中程序是在一個(gè)單一的機(jī)器上運(yùn)作的,這與去年不一樣,當(dāng)時(shí)是分布式的。這次有更強(qiáng)大的算法,運(yùn)作起來更簡單也更好,獲得的速度更快。另外Hassabis表示,計(jì)算力可以“在Google云中獲得,用的是TPU,十個(gè)處理單位,少了十倍的計(jì)算量”。簡單點(diǎn)說,這次的AlphaGo是單機(jī)版。

迭代速度

哈薩比在此鏈接中的劍橋大學(xué)的一次演講中提到,以前從零訓(xùn)練一個(gè)AlphaGo要三個(gè)月,現(xiàn)在只需要一個(gè)星期(“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”)。

如果稱對(duì)戰(zhàn)李世石期間的版本為V18迭代版本,喬裝成Master60連勝并宣布升級(jí)完成的時(shí)刻為V25版本,現(xiàn)在的AlphaGo又是V多少版本,訓(xùn)練的時(shí)候會(huì)不會(huì)一周都不要了?這是我們明天要親自問DeepMind團(tuán)隊(duì)的。

從單人對(duì)戰(zhàn)到團(tuán)隊(duì)對(duì)戰(zhàn)

心細(xì)的朋友肯定注意到了,柯潔和AlphaGo對(duì)弈之外,5月26號(hào)上午還有一場(chǎng)配對(duì)賽,配對(duì)賽雙方---古力+AlphaGoV連笑+AlphaGo,即對(duì)弈雙方分別由一位棋手與AlphaGo組成,棋手與AlphaGo合作進(jìn)行比賽。5月26號(hào)上午下午則是陳耀華,周睿羊,羋昱延,時(shí)越,唐韋星和AlphaGo的5對(duì)1團(tuán)隊(duì)賽。

Google之所以敢這樣設(shè)置賽制,唯一的解釋就是,AlphaGo現(xiàn)在既懂人類下圍棋的那部分,又懂AI下圍棋的那部分,并可以做到融會(huì)貫通,所以它才敢挑戰(zhàn)配對(duì)賽這種跟另一個(gè)同伴高度配合的賽制,又敢挑戰(zhàn)測(cè)試自己“戰(zhàn)斗力”極限的團(tuán)體賽。AI最可怕的部分不是它單個(gè)力量有多強(qiáng),而是它開始懂得和周遭“互動(dòng)”,這樣的融匯是不是比去年3月的人機(jī)大戰(zhàn)可怕多了呢?

小結(jié):

上次AlphaGo喬裝成Master測(cè)試的時(shí)候,柯潔已經(jīng)落敗給Master過一次,他不是沒見識(shí)過AI圍棋的厲害,但結(jié)合柯潔今天在現(xiàn)場(chǎng)的冷靜表現(xiàn),和他昨晚莫名其妙地深夜感慨,我們有理由相信,這不是一場(chǎng)比AI圍棋選手和人類圍棋選手哪個(gè)更厲害的選手,DeepMind團(tuán)隊(duì)一定有些懸而未決的答案需要這場(chǎng)比賽給一個(gè)肯定的驗(yàn)證,然后再往那個(gè)方向?qū)崿F(xiàn)更深一步的探索。

雷鋒網(wǎng)AI科技評(píng)論現(xiàn)場(chǎng)報(bào)道,未經(jīng)許可,拒絕轉(zhuǎn)載。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

經(jīng)過一年的修煉,AlphaGo的哪些能力突飛猛進(jìn)了?

分享:
相關(guān)文章

專注AIR(人工智能+機(jī)器人)

專注人工智能+機(jī)器人報(bào)道,經(jīng)驗(yàn)分享請(qǐng)加微信keatslee8(請(qǐng)注明原因)。 科學(xué)的本質(zhì)是:問一個(gè)不恰當(dāng)?shù)膯栴},于是走上了通往恰當(dāng)答案的路。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說