0
本文作者: 王起端 | 2021-08-27 15:25 |
雷鋒網(wǎng)消息,IEEE 2021游戲會(huì)議(IEEE CoG 2021)格斗游戲AI競(jìng)賽(FTGAIC 2021)的成績(jī)不久前正式揭曉。
網(wǎng)易互娛AI Lab 在競(jìng)賽的兩個(gè)賽道、三個(gè)角色,共六個(gè)項(xiàng)目中均斬獲第一,以150分的總成績(jī)滿(mǎn)分奪冠,一舉擊敗來(lái)自中、日、韓等多個(gè)國(guó)家的頂級(jí)學(xué)府和科研強(qiáng)隊(duì),其中包括曾連續(xù)獲得四次冠軍和一次亞軍的日本參賽隊(duì)伍,以及去年奪冠的中國(guó)科學(xué)院自動(dòng)化研究所,成為9年競(jìng)賽史上首個(gè)滿(mǎn)分全勝的隊(duì)伍。
IEEE CoG 2021是專(zhuān)注于游戲領(lǐng)域的人工智能?chē)?guó)際會(huì)議,每年都有來(lái)自全球各地的專(zhuān)家學(xué)者和開(kāi)發(fā)人員匯聚于此,共同探討游戲技術(shù)與設(shè)計(jì)相關(guān)的前沿話(huà)題和未來(lái)趨勢(shì)。FTGAIC作為大會(huì)官方舉辦的雙人格斗游戲AI實(shí)時(shí)對(duì)抗競(jìng)賽,由于其兼具挑戰(zhàn)性和趣味性,自2013年首次推出便吸引海內(nèi)外強(qiáng)隊(duì)踴躍參加。
據(jù)了解,該競(jìng)賽要求參賽算法控制三種不同屬性的格斗角色,使其在16.67ms的反應(yīng)時(shí)間內(nèi)從56個(gè)離散動(dòng)作中做出最佳決策,進(jìn)而在有限時(shí)間內(nèi)快速擊敗對(duì)方算法控制的智能體。
值得一提的是,該賽題旨在實(shí)時(shí)雙人零和博弈問(wèn)題,屬于非完美信息博弈,在同步?jīng)Q策的過(guò)程中智能體無(wú)法準(zhǔn)確獲取對(duì)方正要采取的動(dòng)作行為,因此會(huì)對(duì)其有效決策行為造成影響。此外,競(jìng)賽中兩個(gè)角色的屬性對(duì)于參賽選手而言是未知的,這也大大增加了研發(fā)的難度。
并且,網(wǎng)易互娛AI Lab創(chuàng)新性地使用了自研的分布式深度強(qiáng)化學(xué)習(xí)框架和自博弈訓(xùn)練范式的PPO算法,該自研框架具有良好的適應(yīng)性和可擴(kuò)展性,支持不同規(guī)模的分布式訓(xùn)練,同時(shí)也支持自博弈訓(xùn)練范式。相比往屆冠軍隊(duì)伍都采用的啟發(fā)式搜索算法,深度強(qiáng)化學(xué)習(xí)算法無(wú)需基于專(zhuān)業(yè)知識(shí)對(duì)所有搜索空間進(jìn)行約減,只需在原始的狀態(tài)空間和動(dòng)作空間進(jìn)行訓(xùn)練,大幅提高了AI設(shè)計(jì)效率。
另外,為了避免受到游戲角色屬性被修改的影響,網(wǎng)易互娛AI Lab在訓(xùn)練時(shí)還對(duì)角色屬性進(jìn)行了隨機(jī)修改,獲得了更為魯棒的策略。最終,在Speedrunning模式下,網(wǎng)易互娛AI Lab的AI擊敗內(nèi)置MCTS AI的平均用時(shí)僅為第二名的二分之一左右。而在Standard模式下,網(wǎng)易互娛AI Lab的AI使用三個(gè)不同角色與其他參賽隊(duì)對(duì)戰(zhàn)的勝率分別達(dá)到了 98.3%,96.7%,100%。
網(wǎng)易互娛AI Lab(BlackMamba)與其他參賽隊(duì)的時(shí)間對(duì)比
網(wǎng)易互娛AI Lab(BlackMamba)與其他參賽對(duì)手的勝利局?jǐn)?shù)對(duì)比
在大賽上,網(wǎng)易互娛AI Lab另辟蹊徑,以深度強(qiáng)化學(xué)習(xí)方法替代搜索性算法(蒙特卡洛樹(shù)搜索、演化算法)奪得競(jìng)賽冠軍,打破了后者在該比賽近五年的統(tǒng)治地位,證明了網(wǎng)易互娛AI Lab在游戲AI領(lǐng)域的技術(shù)優(yōu)勢(shì)和工程實(shí)力。
從過(guò)去的國(guó)際象棋和圍棋等回合制雙人零和博弈,到如今更加復(fù)雜的實(shí)時(shí)策略型游戲,游戲AI一直在推動(dòng)人工智能的核心發(fā)展。網(wǎng)易互娛AI Lab也一直將游戲AI作為研究的核心領(lǐng)域之一,希望能夠?qū)⒀芯砍晒床傅接螒蛑腥?不斷豐富和提升玩家的游戲體驗(yàn),同時(shí)也希望AI+游戲的研究成果能夠被延伸至游戲外的更廣泛的應(yīng)用領(lǐng)域,向通用型人工智能探索和邁進(jìn)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。