2
本文作者: 逸炫 | 2016-04-16 17:49 |
基本可以確定,未來某一天你會(huì)坐上無人駕駛車。當(dāng)那一天到來,或許控制你方向盤的人工智能也已經(jīng)可以愉快地玩起Minecraft了。
聽起來很神,但是要教會(huì)學(xué)習(xí)算法——推動(dòng)未來高級(jí)人工智能的動(dòng)力——如何理解和在三維空間內(nèi)導(dǎo)航,類似Minecraft之類的開放世界游戲是一級(jí)棒的工具。實(shí)現(xiàn)這一步,對(duì)創(chuàng)造可以與真實(shí)世界進(jìn)行復(fù)雜互動(dòng)的人工智能,是非常重大的一步。
電子游戲經(jīng)常被認(rèn)為是逃避現(xiàn)實(shí)的無腦行為,但是因?yàn)橛螒蚶飵砣绱舜罅康男畔ⅰ胂肟碝inecraft里面玩家創(chuàng)造的擴(kuò)展性世界——他們尤其適合給AI當(dāng)做教材,教會(huì)他們?nèi)绾胃兄澜绮⑴c之互動(dòng)。“找個(gè)人來教AI很難,”Xerox的研究員Adrian Gaidon說,因?yàn)樗鼈儭霸谡鎸?shí)世界里還不如個(gè)嬰兒,你得什么事情都給它們解釋?!?/p>
到某一階段后,人類完全沒有這個(gè)時(shí)間和耐心。而電子游戲則沒有這個(gè)問題。你可能對(duì)它們不耐煩,但是它們對(duì)人絕不會(huì)不耐煩。
通常,被稱作“深度學(xué)習(xí)”的算法,作為現(xiàn)代人工智能的基礎(chǔ),研究員訓(xùn)練它們的方式是給它們填鴨大量的數(shù)據(jù)。這些系統(tǒng)把數(shù)據(jù)吞下,從中找尋模式。如果你想教類似AlphaGo的AI下圍棋,你把所有能找到的圍棋棋譜都喂給它吃。棋類游戲中,這是最簡(jiǎn)單的一部分。即便是最難的棋類游戲中的陰謀詭計(jì),在計(jì)算機(jī)看來也不難,AlphaGo可以從幾百萬大小的樣本庫中學(xué)習(xí)。
但是對(duì)于更復(fù)雜的任務(wù),例如說,開汽車,收集足夠的信息在物流和財(cái)務(wù)上的挑戰(zhàn)都太大了。谷歌進(jìn)行了不計(jì)其數(shù)的無人車試驗(yàn),用各種原型收集了幾百萬英里路程,完善控制汽車的AI。對(duì)于不如谷歌和百度這么土豪的公司,在有限的資源下,這種方法對(duì)研究員來說是不可行的。這讓電子游戲越來越有吸引力。在游戲世界,你可以相對(duì)劃算且快速地收集到大量信息。
18個(gè)月前,Adrien Gaidon看見最新版《刺客教條》的預(yù)告片,他忽然靈機(jī)一動(dòng)?!拔液苷痼@,因?yàn)槲乙詾檫@是一個(gè)電影的預(yù)告片,而這實(shí)際上是CGI。我有20秒鐘都被騙了。這是我第一次?!?/p>
他思考,如果現(xiàn)代游戲可以輕松騙到我,也許他們也可以去騙騙AI。所以他和Xerox的團(tuán)隊(duì)開始用電子游戲引擎Unity,給深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)輸入類似汽車、馬路和人行道等圖片,讓它學(xué)會(huì)識(shí)別真實(shí)世界中的這些物體。
研究員已經(jīng)有過成功案例。谷歌AI在學(xué)會(huì)下圍棋前,還學(xué)會(huì)了Atari游戲。其他AI項(xiàng)目還學(xué)會(huì)過《超級(jí)馬里奧》等級(jí)的游戲。不過,使用游戲引擎做三維渲染,以及在這些空間內(nèi)訓(xùn)練AI,帶來了只有最近才變得可能的復(fù)雜程度。
“游戲引擎的真正好處是,你制造像素的時(shí)候也知道這些像素對(duì)應(yīng)的是什么,”Gaidon說,“你不只是制造像素,你也在制造AI所需的指導(dǎo)?!?/p>
目前為止,Gaidon說他在Xerox的工作非常成功:“我現(xiàn)在想展示的是,這項(xiàng)技術(shù)已經(jīng)足夠成熟,可以用計(jì)算機(jī)里的數(shù)據(jù)來訓(xùn)練其他計(jì)算機(jī)軟件。”
微軟同樣也看到了這其中的價(jià)值。公司最近宣布,下半年會(huì)發(fā)布Malmo項(xiàng)目,一個(gè)可以“讓計(jì)算機(jī)科學(xué)家用Minecraft設(shè)計(jì)AI實(shí)驗(yàn)”的開源平臺(tái)。在其復(fù)雜度和開放度之外,Minecraft提供了AI實(shí)驗(yàn)的新方法,Malmo項(xiàng)目的研究負(fù)責(zé)人Katja Hoffman說。
“你玩Minecraft的時(shí)候,你實(shí)際在這個(gè)復(fù)雜的3D世界里,”Hoffman說,“你從你的感官輸入里感知到世界,你的交互方式包括通過走來走去、放置模塊、建造東西還有跟其他人物互動(dòng)。這種充滿刺激的性質(zhì),與我們和真實(shí)世界的交互方式相似。”
Hoffman和團(tuán)隊(duì)希望,他們的工具可以將研究推向比Gaidon團(tuán)隊(duì)更加激進(jìn)的方向。在類似Malmo項(xiàng)目中學(xué)到的技能,她相信可以讓AI不僅學(xué)會(huì)在Minecraft中走動(dòng),并且學(xué)會(huì)在我們的真實(shí)世界中行動(dòng)?!拔覀冋J(rèn)為這是個(gè)非?;A(chǔ)的AI研究項(xiàng)目,我們希望大致理解,個(gè)體如何與周圍環(huán)境互動(dòng)、并理解周圍環(huán)境。”她說,“在真實(shí)世界和限制更多的游戲之間,Minecraft是一個(gè)完美的中間點(diǎn)。”
然而,從模擬到現(xiàn)實(shí)的轉(zhuǎn)變是非常復(fù)雜的。游戲中的模擬通常不像真實(shí)人類一樣行動(dòng),而且游戲世界是為了簡(jiǎn)單易懂而造的,并不是為了百分百復(fù)制真實(shí)世界。另外,任何個(gè)體,人類或其他的,如何建造出對(duì)空間現(xiàn)實(shí)的認(rèn)知,目前仍然是一個(gè)謎。
“如何開發(fā)出,對(duì)環(huán)境能建構(gòu)出有意義的內(nèi)在表征的智能個(gè)體,我們?cè)谶@條路上還處于非常早期的階段。”Hoffman說,“對(duì)人類來說,我們好像整合了我們所有的各種感官。我想,關(guān)聯(lián)各種信息來源,是一個(gè)非常有趣的研究挑戰(zhàn)?!?/p>
當(dāng)科學(xué)家終于搞明白AI如何能建構(gòu)某個(gè)環(huán)境的內(nèi)部表征,它的形式也許會(huì)出乎人們的意料。這種形式有可能是前所未見的?!斑@也許和我們大腦中實(shí)際的情況非常不同?!盚offman說。
這應(yīng)該沒那么出人意料。人們想飛,但是真的飛起來的方式,與鳥兒飛行的方式完全不同?!拔覀兪艿进B和昆蟲的飛行方式啟發(fā)。但真正重要的是,我們理解實(shí)際的機(jī)制,例如如果創(chuàng)造正確的壓力,或者把物體從地面飛起來的正確速度?!?/p>
對(duì)于AI也一樣。計(jì)算機(jī)感知世界的方式已經(jīng)是與人類完全不同。舉個(gè)例子,最近倫敦的ScanLAB項(xiàng)目讓我們知道了,無人車的激光掃描“眼”如何看這個(gè)城市。結(jié)果非常奇異,幽靈與破碎圖像的“平行景觀”,城市景觀交織在“感知機(jī)器的錯(cuò)覺與幻覺“中。
同樣的,谷歌最近的例子證明,AlphaGo是以人類理解不了的方式去理解古老的圍棋。
那么,下一代“感知機(jī)器”眼中的世界又是什么樣的呢?通過虛擬空間算法建造出來的模型、方法和技術(shù)——把它們應(yīng)用到我們的城市、公園和家里,它們會(huì)看見什么呢?我們?cè)谝愿辛Φ姆椒ń虝?huì)AI理解世界。電子游戲可以幫助機(jī)器實(shí)現(xiàn)這種理解。但是,當(dāng)這種理解實(shí)現(xiàn)的時(shí)候,到時(shí)我們也許就已經(jīng)看不懂了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。