丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
新鮮 正文
發(fā)私信給陳留
發(fā)送

8

AlphaGo 對李世石“放水”?棋手說不可能!

本文作者: 陳留 2016-03-13 19:16
導(dǎo)語:李世石出人意料地挽回了勝局。那么,AlphaGo 放水的可能性有多大?

AlphaGo 對李世石“放水”?棋手說不可能!

就在輿論普遍認(rèn)為李世石將會繼續(xù)敗北的時候,人機(jī)大戰(zhàn)的第四場,李世石出人意料地挽回了勝局,將比分改寫為“3:1”。

比賽開局階段,李世石始終落后于 AlphaGo,一直在被吊打。然而,第78手的時候,局勢峰回路轉(zhuǎn),李世石下出了關(guān)鍵的一步,一招極其冷門下出妙手。對于這一步棋,視頻觀戰(zhàn)的職業(yè)棋手古力評價為“神之一手”。

隨后,AlphaGo 一連串的差手讓棋面局勢利好于李世石。在第97步,AlphaGo 再次出現(xiàn)低級失誤,所下白子被李世石果斷吃掉。最終,經(jīng)過長達(dá)4個多小時的鏖戰(zhàn)之后,AlphaGo中盤認(rèn)輸,李世石終于在這場人機(jī)大戰(zhàn)中贏回“尊嚴(yán)”之戰(zhàn)。

AlphaGo 對李世石“放水”?棋手說不可能!

對于戲劇性的比賽結(jié)果,雷鋒網(wǎng)編輯的朋友圈出現(xiàn)了有多種觀點(diǎn)看法,其中最有代表性的一種說法是“AlphaGo 選擇性放水“。甚至還有陰謀論表示,AlphaGo 今天失利是因?yàn)楸桓拇a。那么,AlphaGo 放水的可能性有多大呢?

AlphaGo 對李世石“放水”?棋手說不可能!

雷鋒網(wǎng)第一時間針對這一問題請教了圍棋界的專業(yè)人士。對此說法, 他們都表示,“可能性為零”。至于李世石第78步的落子,完全可以稱得上是載入史冊的一次妙招!

業(yè)余圍棋5段的趙治勛(20年棋齡,并非職業(yè)9段棋手的趙治勛)表示:

李世石創(chuàng)造了歷史,第78步棋沒有一定水平看都看不懂,很高的職業(yè)水準(zhǔn)才能想得到。

棋手鮑云對于李世石第78步下法給予了很高的評價:

“配得上最高評價神之一手。

AlphaGo 程序在大優(yōu)局面的情況下被李世石的妙手打懵了,導(dǎo)致在隨后的20來步進(jìn)入瘋狗狀態(tài)。鮑云表示:

AlphaGo 前半盤大優(yōu),不是防水的態(tài)度。至于AlphaGo 第97步的表現(xiàn)可以用“瘋狗病發(fā)作”來形容。78-97步,機(jī)器應(yīng)該有足夠的(時間來)緩沖調(diào)整計(jì)算出局面走勢。97確實(shí)是很“丟狗”的一步,說明算法還是有極大的問題,抗擊打能力不足,崩潰的太脆了”。

那么,AlphaGo 為何會出現(xiàn)如此明顯的異常表現(xiàn)?

根據(jù)Alphago原論文第一作者之一的Demis Hassabis 在賽后的總結(jié),

“李世石下出白78后,AlphaGo自我感覺良好,在程序的“值網(wǎng)絡(luò)”(用于評估電腦勝率)中,誤以為勝率達(dá)到70%,直到第87步才反應(yīng)過來?!?/p>

AlphaGo 對李世石“放水”?棋手說不可能!

趙治勛猜測,很可能是蒙特卡洛算法本身的一個缺陷。“78步本身是盲點(diǎn),(李世石)小概率的選點(diǎn),很可能導(dǎo)致(AlphaGo)在正確率很高的算法上出現(xiàn)意外事件,導(dǎo)致出錯?!?/span>如果這一猜測成立,人類將可能找到每盤打敗阿爾法的策略。而谷歌公司,將需要很長的時間來修正這一“缺陷”問題。

出門問問NLP工程師李理也在微信群給出了自己的猜測:

(如果一定要猜測)我覺得可能是開局主要靠value network,因?yàn)樗阉骺臻g太大,有可能在某些特殊的局面下出現(xiàn)非常差的結(jié)果。就像之前神經(jīng)網(wǎng)絡(luò)識別圖片時也出現(xiàn)過很詭異的錯誤,還有人研究怎么構(gòu)造讓它識別出錯的例子。

同時,他也認(rèn)為這一“詭異”問題將會比較難解決,

神經(jīng)網(wǎng)絡(luò)打分是固定的,搜索有一定隨機(jī)性。而value network是異步的,調(diào)試也不簡單,得通宵加班找bug了。

PS.最新消息補(bǔ)充:

在賽后的記者招待會上,李世石談到了AlphaGo的兩個弱點(diǎn):一個是AlphaGo執(zhí)黑棋時似乎掙扎比較多,相較執(zhí)白棋時更難贏。另一個是,當(dāng)它遇到出其不意的招數(shù)時,有可能會導(dǎo)致失誤,未必是失誤,就是bug。

那么問題來了,第5場比賽,各位怎么看?是李世石再下一城還是AlphaGo 4:1 榮耀收關(guān)?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

人們總是高估短期而低估長期的科技能力!
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說