5
本文作者: 小芹菜 | 2016-03-17 11:42 |
按:作者田淵棟,F(xiàn)acebook人工智能實(shí)驗(yàn)室研究員。
(李世乭在第四局的“神之一手”)
AlphaGo的比賽以4:1的比分結(jié)束了,說幾句吧。
大家可能一直有誤解, 計(jì)算機(jī)解決問題靠暴力,而人則靠智能。其實(shí)在面對(duì)指數(shù)級(jí)別的解題空間時(shí),機(jī)器的暴力搜索所能覆蓋的范圍,不過是滄海一粟。我現(xiàn)在越來越覺得,連接主義和符號(hào)主義的合并,強(qiáng)直覺加上適當(dāng)搜索才是解決問題較好的方案。
人工智能迄今為止的歷程,就是人類認(rèn)識(shí)到這個(gè)宏大空間并且往這個(gè)方向靠攏的過程。從一開始的規(guī)則驅(qū)動(dòng)的暴力搜索,到特征驅(qū)動(dòng)的線性模型,再到數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí),越來越強(qiáng)的模式識(shí)別能力讓“直覺”兩字從神秘莫測(cè),變成了通過大量樣本能學(xué)到的模型。機(jī)器因?yàn)橛辛烁鼜?qiáng)的直覺,才能在圖像識(shí)別和圍棋上打敗人類,畢竟圍棋太難了,每一步都需要高效的剪枝才行。我在賽前說DCNN+MCTS這樣的框架大局觀非常強(qiáng),正是這個(gè)原因,不知不覺棋筋就連著了,不知不覺棋就非常厚了,怎么也斷不了。因?yàn)镸CTS是全盤估計(jì)分?jǐn)?shù)的,DCNN又長(zhǎng)于大局觀。
與大家通常的理解相反,要讓機(jī)器像人一樣作理性推理,目前還比較困難。有效的邏輯和理性思維能力同樣是依賴大量的直覺去找到正確的邏輯鏈條和理性判斷,然后再回頭驗(yàn)證。直覺的錯(cuò)誤率是很高的,就像圍棋的DCNN經(jīng)常給出不靠譜的著法一樣,需要MCTS的價(jià)值判斷來糾正。邏輯思維的強(qiáng)弱,不是說想得有多深,腦袋轉(zhuǎn)得有多快,而是在過去的經(jīng)驗(yàn)中能找到解決方案,并且能有意識(shí)地用理性去判斷解決方案的正確性,這樣的框架一但在腦里建立起來,就有了自我學(xué)習(xí)自我糾錯(cuò)的能力。人類在這方面,仍然比計(jì)算機(jī)要強(qiáng)得多。我在賽前說局部死活對(duì)殺劫爭(zhēng)會(huì)有問題,看完了五盤棋,大家也都驚嘆計(jì)算機(jī)其實(shí)不會(huì)計(jì)算,因?yàn)锳lphaGo里并沒有顯式建模局部死活對(duì)殺,而人可以依據(jù)當(dāng)前盤面的狀況,積極地改變搜索的指向,而機(jī)器會(huì)因?yàn)槿炙阉魉?,不知道在合適時(shí)候集中火力到某個(gè)重要的局部上。如何將DCNN和MCTS深度結(jié)合起來,仍然是很大的研究課題。
我以前寫過《給人工智能潑點(diǎn)冷水》,現(xiàn)在看來這點(diǎn)冷水肯定澆不滅大家的熱情。但我還是要說人工智能還有很長(zhǎng)的路要走。
圍棋是固定規(guī)則下的完全信息博弈,再加上大量的人類對(duì)局樣本,及兩位一作長(zhǎng)年對(duì)計(jì)算機(jī)圍棋的堅(jiān)持,還有谷歌大量的資源時(shí)間和人力,才造就了AlphaGo現(xiàn)在的輝煌。相比之下,人類每天在非對(duì)稱信息中過活,在未知的世界中摸索,在充滿噪音、模糊甚至錯(cuò)誤的指導(dǎo)信息中學(xué)習(xí),在稀缺樣本中尋找規(guī)律,在極窄的通訊帶寬下相互交流,依然有遠(yuǎn)超紙面數(shù)據(jù)的判斷與推理,遠(yuǎn)勝大量機(jī)器的直覺和洞察力。另一方面,對(duì)于神經(jīng)網(wǎng)絡(luò)模型的解讀,我們?nèi)匀惶幱诔跫?jí)階段,多少人問為什么計(jì)算機(jī)能下出妙手?職業(yè)棋手有自己的判斷和邏輯,并且能在一定程度上闡述清楚;可遺憾的是,人工智能研究者這邊,只能在堆完大量的數(shù)據(jù)之后,兩手一攤露出無奈的笑容。如何讓機(jī)器學(xué)會(huì)人類的各項(xiàng)能力,依舊是一座需要攀登很多年的大山。
我記得在比賽期間有張圖讓人印象深刻,一邊是需要千臺(tái)機(jī)器的AlphaGo,另一邊是李世石和一杯咖啡。大自然的鬼斧神工,一直讓人肅然起敬;而最杰出的造物,莫過于我們?nèi)祟愖约骸?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。