10
本文作者: 恒亮 | 2016-11-05 09:12 |
還記得谷歌DeepMind團(tuán)隊(duì)開發(fā)的人工智能機(jī)器人阿爾法狗(AlphaGo)與圍棋職業(yè)九段李世石的大戰(zhàn)么?現(xiàn)在DeepMind對人工智能機(jī)器人又有了新的想法:打游戲。
近日,DeepMind宣布,與暴雪娛樂達(dá)成了合作協(xié)議,將共同開發(fā)界面,讓人工智能研究員可以將機(jī)器學(xué)習(xí)軟件與《星際爭霸2》這款游戲連接在一起。讓人工智能技術(shù)去玩《星際爭霸2》,未來不排除與人類玩家展開新一輪“人機(jī)”大戰(zhàn)的可能。
DeepMind尚未開發(fā)出專業(yè)的《星際爭霸》軟件。該公司研究科學(xué)家 Oriol Vinyals 表示:“我們目前距離挑戰(zhàn)高手玩家還有很遠(yuǎn)的距離?!辈贿^最新宣布的消息表明,該公司計劃將《星際爭霸》作為機(jī)器學(xué)習(xí)技術(shù)又一新的突破口。
Oriol Vinyals表示,人工智能研究員對《星際爭霸》感興趣是因?yàn)?,相對于象棋和圍棋,游戲?nèi)的環(huán)境更接近于“復(fù)雜的真實(shí)世界”。他表示:“能夠勝任《星際爭霸》的軟件需要有效地運(yùn)用存儲,有能力去進(jìn)行長期規(guī)劃,以及使計劃適應(yīng)最新信息。”而能夠掌握這些技能,勝任《星際爭霸》的機(jī)器學(xué)習(xí)系統(tǒng)“最終也將適用于真實(shí)世界任務(wù)”。
在《星際爭霸》中,玩家需要在蟲族、人族和神族3個種族中選擇其一,而每個種族都有各自的優(yōu)勢和劣勢。在游戲中玩家需要發(fā)展經(jīng)濟(jì),開拓新的領(lǐng)土,防止敵人隨時可能的入侵,并試圖對敵人造成盡可能多的傷害。成功的玩家需要記住關(guān)于地點(diǎn)的大量信息,即使這些地點(diǎn)在地圖上沒有顯示。
另外,《星際爭霸》的難度還在于玩家對對手行動的直觀了解非常少,甚至需要憑借經(jīng)驗(yàn)去推測敵人可能采取的策略,例如在哪里開礦,在哪里打怪,這與圍棋和象棋不同。此外,《星際爭霸》并非回合制游戲,機(jī)器學(xué)習(xí)系統(tǒng)需要面對持續(xù)變化的環(huán)境。對于《星際爭霸》,玩家一方面需要制定長線策略,一方面也要運(yùn)用好短線戰(zhàn)術(shù)。讓軟件同時具備這兩方面的能力將是一個非常大的挑戰(zhàn)。
Facebook和微軟的研究人員此前也曾發(fā)表論文,介紹了如何讓人工智能系統(tǒng)去掌握早期版本的《星際爭霸》。事實(shí)上,能夠操控《星際爭霸》游戲的機(jī)器人軟件已被研發(fā)成功,但到目前為止這些系統(tǒng)還無法擊敗人類的高手玩家。
相關(guān)閱讀:
谷歌 DeepMind 的可微分神經(jīng)計算機(jī) DNC 怎么樣?看 Facebook AI 研究員田淵棟、賈揚(yáng)清怎么說
只訓(xùn)練一次數(shù)據(jù)就能識別出物體,谷歌全新 AI 算法“單次學(xué)習(xí)”
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。