10
本文作者: 恒亮 | 2016-11-05 09:12 |
還記得谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的人工智能機(jī)器人阿爾法狗(AlphaGo)與圍棋職業(yè)九段李世石的大戰(zhàn)么?現(xiàn)在DeepMind對(duì)人工智能機(jī)器人又有了新的想法:打游戲。
近日,DeepMind宣布,與暴雪娛樂(lè)達(dá)成了合作協(xié)議,將共同開(kāi)發(fā)界面,讓人工智能研究員可以將機(jī)器學(xué)習(xí)軟件與《星際爭(zhēng)霸2》這款游戲連接在一起。讓人工智能技術(shù)去玩《星際爭(zhēng)霸2》,未來(lái)不排除與人類(lèi)玩家展開(kāi)新一輪“人機(jī)”大戰(zhàn)的可能。
DeepMind尚未開(kāi)發(fā)出專(zhuān)業(yè)的《星際爭(zhēng)霸》軟件。該公司研究科學(xué)家 Oriol Vinyals 表示:“我們目前距離挑戰(zhàn)高手玩家還有很遠(yuǎn)的距離。”不過(guò)最新宣布的消息表明,該公司計(jì)劃將《星際爭(zhēng)霸》作為機(jī)器學(xué)習(xí)技術(shù)又一新的突破口。
Oriol Vinyals表示,人工智能研究員對(duì)《星際爭(zhēng)霸》感興趣是因?yàn)椋鄬?duì)于象棋和圍棋,游戲內(nèi)的環(huán)境更接近于“復(fù)雜的真實(shí)世界”。他表示:“能夠勝任《星際爭(zhēng)霸》的軟件需要有效地運(yùn)用存儲(chǔ),有能力去進(jìn)行長(zhǎng)期規(guī)劃,以及使計(jì)劃適應(yīng)最新信息?!倍軌蛘莆者@些技能,勝任《星際爭(zhēng)霸》的機(jī)器學(xué)習(xí)系統(tǒng)“最終也將適用于真實(shí)世界任務(wù)”。
在《星際爭(zhēng)霸》中,玩家需要在蟲(chóng)族、人族和神族3個(gè)種族中選擇其一,而每個(gè)種族都有各自的優(yōu)勢(shì)和劣勢(shì)。在游戲中玩家需要發(fā)展經(jīng)濟(jì),開(kāi)拓新的領(lǐng)土,防止敵人隨時(shí)可能的入侵,并試圖對(duì)敵人造成盡可能多的傷害。成功的玩家需要記住關(guān)于地點(diǎn)的大量信息,即使這些地點(diǎn)在地圖上沒(méi)有顯示。
另外,《星際爭(zhēng)霸》的難度還在于玩家對(duì)對(duì)手行動(dòng)的直觀了解非常少,甚至需要憑借經(jīng)驗(yàn)去推測(cè)敵人可能采取的策略,例如在哪里開(kāi)礦,在哪里打怪,這與圍棋和象棋不同。此外,《星際爭(zhēng)霸》并非回合制游戲,機(jī)器學(xué)習(xí)系統(tǒng)需要面對(duì)持續(xù)變化的環(huán)境。對(duì)于《星際爭(zhēng)霸》,玩家一方面需要制定長(zhǎng)線策略,一方面也要運(yùn)用好短線戰(zhàn)術(shù)。讓軟件同時(shí)具備這兩方面的能力將是一個(gè)非常大的挑戰(zhàn)。
Facebook和微軟的研究人員此前也曾發(fā)表論文,介紹了如何讓人工智能系統(tǒng)去掌握早期版本的《星際爭(zhēng)霸》。事實(shí)上,能夠操控《星際爭(zhēng)霸》游戲的機(jī)器人軟件已被研發(fā)成功,但到目前為止這些系統(tǒng)還無(wú)法擊敗人類(lèi)的高手玩家。
相關(guān)閱讀:
谷歌 DeepMind 的可微分神經(jīng)計(jì)算機(jī) DNC 怎么樣?看 Facebook AI 研究員田淵棟、賈揚(yáng)清怎么說(shuō)
只訓(xùn)練一次數(shù)據(jù)就能識(shí)別出物體,谷歌全新 AI 算法“單次學(xué)習(xí)”
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。