丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
特寫 正文
發(fā)私信給宗仁
發(fā)送

3

AlphaGo連贏兩局 該如何尋找它的破綻?

導(dǎo)語:承認失敗從來不是人類的常態(tài)。

昨天人機大戰(zhàn)的第二場,AlphaGo又贏了,一些人工智能方面的專家開始坦白地承認——技術(shù)的發(fā)展超出了我們的想象。態(tài)度更明確的,比如在騰訊直播室觀戰(zhàn)的余凱則表示“我的結(jié)論是計算機已經(jīng)超過了人類”。

但承認失敗從來不是人類的常態(tài),失敗后找出破綻再次出發(fā)才是,以一種不屈不撓的挑戰(zhàn)者精神來說,就算接下來的三盤李世石輸了,還有中國的柯潔;就算柯潔也被AlphaGo超越了,我們也不會承認AlphaGo的智力已經(jīng)全部輾壓人類,因為它就是我們自己造出來的,因為它這次連贏兩場是有客觀條件的。

知己知彼,才有勝算

先從它的從GPU說起。

眼尖的人會發(fā)現(xiàn),之前的IBM深藍不管在計算力上多么厲害,它都沒法像AlphaGo下地這么像人類的棋著,好比直播時新浪網(wǎng)友一邊看一邊驚呼“實戰(zhàn)中李世石在黑3頂?shù)臅r候,毅然搶占下邊的大官子。本以為AlphaGo要對中腹白龍展開猛攻,誰知AlphaGo竟然11位本本分分地虎一手,仔細一判斷,竟然全局還是黑棋優(yōu)勢,AlphaGo的全局判斷力非常準確?!?/p>

但從機器的角度,AlphaGo無論下地如何像人都不會有靈魂在指導(dǎo)的,有的只是基于強大CPU集群的基礎(chǔ)上多了一個強大的GPU集群,這些才是讓它依托其其深度學(xué)習(xí)能力能表現(xiàn)地如此像人的本質(zhì)所在。至于它這一次為什么表現(xiàn)地這么出色,據(jù)王小川3月9號的表述,此次谷歌此次動用了上萬臺的機器,對外宣稱1200臺,2000個GPU,比深藍計算力提高了3萬倍。

很多人不解,最初用于渲染游戲圖像的GPU怎么就會被發(fā)現(xiàn)適合深度學(xué)習(xí)呢?對此,圖靈機器人聯(lián)合創(chuàng)始人楊釗告訴雷鋒網(wǎng)

相比CPU設(shè)計為通用的計算處理,GPU更適合處理并行的相同的計算;一般情況下,GPU的核數(shù)更多,在并行處理大量數(shù)據(jù)時優(yōu)勢更加明顯;深度學(xué)習(xí)需要大量的數(shù)據(jù)運算,典型的深度神經(jīng)網(wǎng)絡(luò)有很多節(jié)點,每個節(jié)點又有很多連接,需要并在學(xué)習(xí)的過程中不斷更新迭代,這種情況下GPU更具優(yōu)勢;

如果要舉一個形象的例子,按小智機器人何勇的說法

在串行架構(gòu)下 ,計算兩個長度為1000向量的加法需要循環(huán)計算1000次,而用GPU一次就可以完成計算。

普通人都知道,GPU的全名是“圖形處理器”,按理說它應(yīng)該不是這次人機大戰(zhàn)的動力主角,但因為其在大規(guī)模并行運算環(huán)境中的出色表現(xiàn),對需要大量使用張量計算的深度學(xué)習(xí)來說能夠起到明顯的加速作用,反而使得它成為此次人機大戰(zhàn)中的耀眼新星。另外一個讓雷鋒網(wǎng)覺得有意思的東西,是余凱在解讀昨天的人機大戰(zhàn)時,提到“Alphago似乎可以掌握局面。因為基于深度學(xué)習(xí)里面采用卷積神經(jīng)網(wǎng)絡(luò),就是拿很多的濾波器,掃描棋盤,它可能拿成千上百個濾波器,得到分層的理解,上面再來一層掃描,這個機制跟人眼睛的視覺神經(jīng)網(wǎng)絡(luò)是完全一樣的。這里面很巧妙的,卷集神經(jīng)網(wǎng)絡(luò)是模擬人整個大腦的視覺神經(jīng)網(wǎng)絡(luò)的機制?!?/p>

人類臉上的一雙眼睛,比其它任何五官部位都能有助于迅速掌握全局,但這個卷積神經(jīng)網(wǎng)絡(luò)沒用攝像頭、也沒有雷達掃描。只是用一雙沒有眼睛的“眼睛”(基于模擬人整個大腦的視覺神經(jīng)網(wǎng)絡(luò)的機制),讓AlphaGo有了比賽中表現(xiàn)的“全局觀”,這似乎是非常有意思的一件事。

它跟真人神經(jīng)網(wǎng)絡(luò)的差距在哪里

AlphaGo的計算能力比人強已經(jīng)是板上釘釘?shù)氖聦崳摹八季S能力”也在趕超人類的路上,但這次人機大戰(zhàn)展開的初衷,就是我們深信它的“神經(jīng)網(wǎng)絡(luò)”跟我們真人的神經(jīng)網(wǎng)絡(luò)是有差距的,所以我們不斷測試。那它跟真人神經(jīng)網(wǎng)絡(luò)相比,還有哪些差距呢?

楊釗:

規(guī)模遠沒有人腦大,人腦800多億個神經(jīng)元,整體性能比人腦稍慢;
功耗的問題;
泛化能力(舉一反三的能力);

何勇:

目前科學(xué)界對大腦的結(jié)構(gòu)認知還是非常有限的,當前的人工神經(jīng)網(wǎng)絡(luò)就是建立在這個有限的認知上設(shè)計出來的一個高度簡化的人腦模型,所以相比人腦而言,還有 很大差距。舉個簡單的例子,其“智能”的遷移性相對于人腦有非常大的距離,比如,一個能夠擊敗人類棋手的AI很難去學(xué)習(xí)怎么去理解一篇簡單的文章。

而思必馳CTO周偉達博士則從AlphaGo的主動和被動性上分析了這個問題——與人類相比,AlphaGO需要改進的地方還有很多方面,目前深度學(xué)習(xí)大多采用有監(jiān)督的學(xué)習(xí),在無監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí)和自學(xué)能力方面需要加強;同樣由于目前深度學(xué)習(xí)大多從以往的棋局中進行學(xué)習(xí),在聯(lián)想記憶、創(chuàng)新、和推廣能力不足,等人類逐漸熟悉其棋路后,其這方面的弱勢也會顯露無遺,所以其創(chuàng)新和推廣能力方面還需要加強。

如何尋找它的破綻

在正式比賽前,有人就已經(jīng)關(guān)注到AlphaGo先讀取KGS(一個網(wǎng)絡(luò)圍棋對戰(zhàn)平臺)上面近16萬局共3000多萬步的人類走法,但這種簡單復(fù)制Copy的能力還不能滿足AlphaGo飛速進化的需求,按出門問問NLP工程師Jason的說法,它只是“基于這個在人類棋局上學(xué)習(xí)出來的SL Policy Network, 然后使用強化學(xué)習(xí)(Reinforcement Learning)的方法通過自己跟自己對弈,來進一步優(yōu)化Policy Network。”

而從李世石在前兩局的“異常棋風(fēng)”表現(xiàn)中,我們這里不妨推測出李世石已經(jīng)意識到AlphaGo已經(jīng)對自己的棋風(fēng)相當了解,他本人正在極力求變,而不是職業(yè)棋手認為的他在“消極應(yīng)戰(zhàn)”,因為我們相信以一個圍棋冠軍的智商,他絕對知道找出對手破綻的重要性,即使這個對手不是人。

至于如何保證跟自己對弈的過程中學(xué)到東西(不下一樣的棋),業(yè)余5段趙治勛表示

在算法里這個叫做加強學(xué)習(xí),通過對弈提升棋力。我學(xué)過這個算法,認為它可信而且有用。通俗來講,人不可以復(fù)制,但機器可以。兩只阿爾法圍棋的復(fù)制品0號機和1號機對弈 互不干擾 這樣的學(xué)習(xí)就是有用的 而人并不能分身自我對弈干擾嚴重,因此不能學(xué)東西。

知己知彼,方有勝算,在知道AlphaGo在此番競賽中,它擅長的是記住棋譜+加強學(xué)習(xí)+計算能力,那如果按武俠小說破招的思路,人類應(yīng)該干啥來破招?

從招式上,楊釗表示有3點     1 盡可能地使用冷招,進入冷僻局面;2 在前期利用人腦的大局觀建立優(yōu)勢,否則到了后期搜索空間變小,計算機更具優(yōu)勢; 3 創(chuàng)新棋局理論,讓其之前學(xué)習(xí)到的棋局能力減效(挺難的)。

從心理上,何勇表示AI的優(yōu)勢在于精準的計算,不像人類棋手會受生理和心理因素影響,出現(xiàn)失誤。而劣勢也顯而易見,缺乏對全局的掌控,AI的走法,更多的是基于當前棋局做出的 一個短期判斷。所以,如果跟一個善于全局布局的高手對弈,勝的可能性相對較低。

從可能性上,出門問問李理表示,很難,從我程序員的角度看,因為殘局的差距太大了,前面走子機器也不會太差。我覺得可以試試的策略就是中前期占優(yōu)勢,然后殘局導(dǎo)向簡單變化的局面。開局不要被怪招嚇到,認為是弱手就要嚴厲打擊,機器的開局不怎么樣。

從本質(zhì)上,周博士表示,目前機器智能還處在初始發(fā)展階段,機器憑借其海量的存儲能力和快速的邏輯計算能力獲得了一定的優(yōu)勢,同時在智能方面通過人工智能專家的設(shè)計具備了一定的學(xué)習(xí)能力,但其與人類相比還有很大的差距,人類并不需要太大驚小怪。人類只需要更多地了解目前機器智能的本質(zhì),在實際對弈中去了解機器的強項和弱勢,相信人類很快能找到發(fā)揮人類優(yōu)勢戰(zhàn)勝機器的方法。

小結(jié):

也許后面李世石接著輸了,也許柯潔也被AlphaGo超越了,也許以后博弈類的游戲人類再也不是機器的對手了,但我們依然覺得,把AlphaGo的原理搞清楚了,像IBM的深藍一樣讓我們對它知根知底,就是它最大的破綻。

目前網(wǎng)上分析AlphaGo的文章一大推,因為晦澀難懂,引發(fā)了人類對它的敬畏,或者說對它的恐懼,但我們?nèi)舭阉唵卫锟础?/p>

1997年的IBM深藍依靠計算力和暴力窮舉,超越了人類在國際象棋上的局限。

2009年的時候,一個叫做Hinton的老頭第一次把他研究了近30年的深度神經(jīng)網(wǎng)絡(luò)介紹給了做語音識別的學(xué)者,到了第二年語音識別領(lǐng)域就發(fā)生了巨大的突破。

于是深度學(xué)習(xí)網(wǎng)絡(luò)像開了掛一樣開始向人工智能的各個領(lǐng)域蔓延,并開始出現(xiàn)CNN、RNN等更多具體的變種。

直到2016年3月,它用在圍棋游戲上跟人類對弈。

那怎么簡單描述深度網(wǎng)絡(luò)在圍棋上的應(yīng)用呢?

“我的理解,兩個深度網(wǎng)絡(luò)的工具,Policy Network+Value Network通過評估每一步收益,用來簡化蒙特卡洛樹(AI框架)的搜索空間,取得落子最優(yōu)和時間消耗的平衡?!睏钺撊缡钦f。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

專注AIR(人工智能+機器人)

專注人工智能+機器人報道,經(jīng)驗分享請加微信keatslee8(請注明原因)。 科學(xué)的本質(zhì)是:問一個不恰當?shù)膯栴},于是走上了通往恰當答案的路。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說