0
雷鋒網(wǎng)按:這里是,AI研習(xí)社編譯的 Two minutes paper 專(zhuān)欄,每周帶大家用碎片時(shí)間閱覽前沿技術(shù),了解 AI 領(lǐng)域的最新研究成果。
原標(biāo)題:OpenAI + DOTA2- 180 Years of Learning Per Day
翻譯 | 董丹丹 整理 | MY
一個(gè)聞?wù)邆穆?tīng)者落淚的舊聞:人工智能在有限規(guī)則的 1V1 比賽中擊敗了一些人類(lèi)頂級(jí)玩家,當(dāng)時(shí)的獎(jiǎng)金池是 2000 萬(wàn)美金。這是 AI 史上一個(gè)巨大的里程碑。我們注意觀看當(dāng)時(shí)的頂級(jí)玩家的表情。
之后旁邊的人員激動(dòng)萬(wàn)分前來(lái)握手,我們的玩家臉上笑嘻嘻,心里···。心疼!人類(lèi)玩家慘被 AI 虐殺,什么里程碑,人家只是個(gè)想要好好玩游戲的寶寶!你卻對(duì)我使外掛?
我們都知道,DOTA 這類(lèi)游戲需要長(zhǎng)線(xiàn)策略規(guī)劃,由于信息不完整,并且游戲擁有高維、持續(xù)的行為空間,這些特征對(duì)人工智能來(lái)說(shuō)是無(wú)法逾越的噩夢(mèng)。但是在 1V1 獲勝后,下一個(gè)里程碑是在標(biāo)準(zhǔn)的 5V5 比賽中擊敗了人類(lèi)團(tuán)隊(duì)。
人工智能始終在通過(guò)自我對(duì)抗訓(xùn)練進(jìn)行學(xué)習(xí),每天如此,80% 的游戲是自己與自己對(duì)抗,20% 是與過(guò)去的自己對(duì)抗。并且在 5V5 比賽中,這五個(gè)機(jī)器人之間雖然沒(méi)有明確的溝通渠道,但是他們已經(jīng)能預(yù)測(cè)未來(lái)行為和情形,并且能理解伏擊對(duì)手等許多游戲中的重要元素。
可能會(huì)有人說(shuō)這些算法之所以能夠打敗人類(lèi),是因?yàn)樗鼈兊狞c(diǎn)擊速度更快,但事實(shí)上 DOTA2 對(duì)這個(gè)指標(biāo)并不那么敏感,點(diǎn)擊得越頻繁并不意味著能獲得更多的勝利。此外,這些機(jī)器人每分鐘大概執(zhí)行 150-170 個(gè)動(dòng)作,這與一位中級(jí)水平的人類(lèi)玩家是一致的。
哎,還能不能愉快玩耍了?
雷鋒網(wǎng)雷鋒網(wǎng)
視頻原址:https://www.youtube.com/watch?v=yEOEqaEgu94
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。