丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

0

中科院自動(dòng)化所拿下星際爭(zhēng)霸AI競(jìng)賽第四名,順便發(fā)布了一個(gè)訓(xùn)練AI“大局觀”的數(shù)據(jù)集

本文作者: 楊曉凡 編輯:郭奕欣 2017-10-13 10:09
導(dǎo)語(yǔ):RTS AI 時(shí)代的新一支序曲

中科院自動(dòng)化所拿下星際爭(zhēng)霸AI競(jìng)賽第四名,順便發(fā)布了一個(gè)訓(xùn)練AI“大局觀”的數(shù)據(jù)集

雷鋒網(wǎng) AI 科技評(píng)論按:上周日,互動(dòng)數(shù)字娛樂(lè)AI大會(huì)(AIIDE)2017中的星際爭(zhēng)霸AI競(jìng)賽落下帷幕。這一競(jìng)賽是即時(shí)戰(zhàn)略(RTS)游戲AI比賽中最重要的比賽之一,暴雪、DeepMind和Facebook人工智能研究院等機(jī)構(gòu)也有贊助。兩周的車(chē)輪戰(zhàn)中共進(jìn)行了41580場(chǎng)1v1比賽,28個(gè)參賽AI中每?jī)蓚€(gè)之間也平均比賽了110場(chǎng)。

DeepMind 和 Facebook 近兩年在星際爭(zhēng)霸AI研發(fā)上動(dòng)作頻頻,F(xiàn)acebook 也拿出名為 CherryPi 的機(jī)器學(xué)習(xí)AI親自參加了這場(chǎng)比賽,但只以69%的勝率拿到第6名。面對(duì)這樣的戰(zhàn)績(jī),多家外媒不免對(duì) Facebook 發(fā)出了“雷聲大雨點(diǎn)小”的嘲笑,不過(guò)機(jī)器學(xué)習(xí)在RTS游戲中的探索畢竟只是剛剛開(kāi)始,大可不必心急。

比賽冠軍是一位獨(dú)立參加的星際爭(zhēng)霸愛(ài)好者,來(lái)自澳大利亞的程序員Chris Coxe,依靠手工編碼、基于預(yù)定義規(guī)則和情境判斷的AI獲得了最高勝率83%,從而獲得冠軍;不僅如此,排名前三的AI都是由獨(dú)立參賽的星際爭(zhēng)霸愛(ài)好者開(kāi)發(fā)的,大多數(shù)排名靠前的個(gè)人參賽AI也都是和Chris Coxe類似的手工編碼、基于規(guī)則的AI。

同時(shí)雷鋒網(wǎng) AI 科技評(píng)論發(fā)現(xiàn),也有多個(gè)來(lái)自中國(guó)的AI參加了這次比賽,除了個(gè)人名義參加的Sijia Xu和他的AI“Overkill”之外,中科院自動(dòng)化研究所更是有三支隊(duì)伍參賽,復(fù)雜系統(tǒng)管理與控制國(guó)家重點(diǎn)實(shí)驗(yàn)室有兩支,一支是在讀博士生朱圓恒、趙冬斌研究員的團(tuán)隊(duì)和他們的AI“Juno”,另一支是唐振濤團(tuán)隊(duì),他們的AI名為“killall”;還有一支團(tuán)隊(duì)來(lái)自智能感知與計(jì)算研究中心,他們的AI“cpac”首次參賽就以71%的勝率拿下了第4名。

智能感知與計(jì)算研究中心“cpac”團(tuán)隊(duì)共有13名成員,開(kāi)發(fā)這個(gè) AI 用了幾個(gè)月的時(shí)間,其中有新的游戲策略,也融合了部分機(jī)器學(xué)習(xí)功能。根據(jù)他們介紹,他們訓(xùn)練了一個(gè)多層感知網(wǎng)絡(luò)用于在生產(chǎn)隊(duì)列為空的時(shí)候造兵。

在這個(gè) AI 的開(kāi)發(fā)過(guò)程中,他們還一并發(fā)布了一個(gè)新的數(shù)據(jù)集 MSC(Macro-management in StarCraft),論文署名為在讀博士生武慧凱、副研究員張俊格、研究員黃凱奇。

中科院自動(dòng)化所拿下星際爭(zhēng)霸AI競(jìng)賽第四名,順便發(fā)布了一個(gè)訓(xùn)練AI“大局觀”的數(shù)據(jù)集

MSC 基于暴雪今年開(kāi)放的 SC2LE 平臺(tái),作者們?cè)谡撐闹斜硎具@個(gè)平臺(tái)的好處是有目前為止最大的replay數(shù)據(jù)集、這些replay的質(zhì)量更高格式更標(biāo)準(zhǔn),而且 SC2LE 還有官方的支持和積極的更新。

MSC 數(shù)據(jù)集的目標(biāo)是提供預(yù)定義的、根據(jù)特征分割過(guò)的replay,用于游戲中宏觀操作(比賽策略&“大局觀”,Macro-management)的訓(xùn)練和評(píng)估。SC2LE中現(xiàn)有的replay雖然數(shù)量很多,但是沒(méi)辦法直接用來(lái)學(xué)習(xí)和測(cè)試;MSC則把replay過(guò)濾、解析、采樣、提取操作特征,并形成訓(xùn)練、驗(yàn)證、測(cè)試三個(gè)數(shù)據(jù)集,就可以供研究人員方便地訓(xùn)練模型,數(shù)據(jù)集自身也就成為了公開(kāi)、標(biāo)準(zhǔn)的模型對(duì)比手段。

中科院自動(dòng)化所拿下星際爭(zhēng)霸AI競(jìng)賽第四名,順便發(fā)布了一個(gè)訓(xùn)練AI“大局觀”的數(shù)據(jù)集

MSC基于 CS2LE 的80萬(wàn)場(chǎng)replay中已經(jīng)公開(kāi)的約6萬(wàn)4千場(chǎng),按照上圖中的流程進(jìn)行處理,形成三個(gè)數(shù)據(jù)集。在預(yù)處理中剔除了過(guò)短、APM(每分鐘操作數(shù))過(guò)低以及選手的MMR(比賽積分)過(guò)低的比賽。

除了數(shù)據(jù)集之外,論文中也一并提出了一個(gè)基準(zhǔn)模型,展示了在全局局面評(píng)估和單位建造預(yù)測(cè)任務(wù)中的表現(xiàn);其它游戲策略、序列建模、不確定性建模、不平衡數(shù)據(jù)集學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、規(guī)劃和樹(shù)搜索等RTS游戲中常出現(xiàn)的子任務(wù)也可以從這個(gè)數(shù)據(jù)集中受益。

詳細(xì)內(nèi)容和數(shù)據(jù)集請(qǐng)參見(jiàn)原論文和項(xiàng)目地址

論文地址:https://arxiv.org/abs/1710.03131 

項(xiàng)目地址:https://github.com/wuhuikai/MSC 

雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

中科院自動(dòng)化所拿下星際爭(zhēng)霸AI競(jìng)賽第四名,順便發(fā)布了一個(gè)訓(xùn)練AI“大局觀”的數(shù)據(jù)集

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)