丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

0

2018年星際爭霸AI挑戰(zhàn)賽中科院自動化所奪得季軍,三星與FB獲冠亞軍

本文作者: 楊曉凡 2018-11-24 17:26
導語:星際爭霸AI近年進展迅速,機器學習技術在策略類游戲中的應用越來越深入,但是距離AlphaZero時刻尚存距離,這一天究竟何時到來?

2018年星際爭霸AI挑戰(zhàn)賽中科院自動化所奪得季軍,三星與FB獲冠亞軍

雷鋒網 AI 科技評論消息,2018 年 11 月 13-17 日,AAAI 人工智能與交互式數(shù)字娛樂大會 (AI for Interactive Digital Entertainment) 在阿爾伯塔大學舉辦。會上宣布了一年一度的星際爭霸 AI 挑戰(zhàn)賽結果;這也是即時戰(zhàn)略(RTS)游戲 AI 比賽中最重要的比賽之一。

第八屆(2018 年) AIIDE StarCraft AI Competition 星際爭霸 AI 挑戰(zhàn)賽共有 27 支團隊參賽,包括知名機構如三星、中科院自動化所、Facebook 等,知名高校如 Stanford University,以及許多獨立參賽隊伍。挑戰(zhàn)賽使用 12 臺計算機進行了大約 2 星期的比賽。經過每個 bot 平均大約 2600 局、每組對手平均大約 100 局,共 34694 局車輪戰(zhàn) 1v1 比賽之后,三星、Facebook 以及中科院自動化研究所分別以 95.91%、90.86%、87.11% 的勝率榮獲前三名。

AIIDE StarCraft AI 挑戰(zhàn)賽自 2011 年起已連續(xù)舉辦八屆,該競賽以星際爭霸 1 為載體,以促進和評估用于實時戰(zhàn)略游戲(RTS)的人工智能水平為目的。近年來,它更是成為博弈對抗、強化學習、模仿學習、多任務學習等乃至通用人工智能算法研究的主要平臺和工具。由于包括對手不確定在內的信息不完全以及狀態(tài)動作空間巨大等問題,使得星際爭霸AI較圍棋AI更極具挑戰(zhàn)性,因此也吸引了包括DeepMind、Facebook、三星、斯坦福大學、中國科學院自動化研究所在內的國內外頂尖研究機構投入研究,相關核心技術可以廣泛應用在金融學、經濟學、生物學、政治學和軍事等領域。

前三名方案介紹

第三名 中科院自動化所,神族 bot 「CSE」

在 2017 年的星際爭霸 AI 挑戰(zhàn)賽中,來自中科院自動化所的 AI「CPAC」就以 71% 的勝率獲得了第四名的成績。雷鋒網 AI 科技評論報道文章請見《中科院自動化所拿下星際爭霸 AI 競賽第四名,順便發(fā)布了一個訓練 AI“大局觀”的數(shù)據(jù)集》。

今年的比賽中,由中科院自動化所智能系統(tǒng)與工程研究中心(CRISE)開發(fā)的神族 bot「CSE」以 87.11% 的勝率獲得季軍。據(jù)了解,該中心為自動化所獨立建制的科研部門,致力于研究博弈對抗與自主進化智能研究,包括感知智能與認知決策智能?!窩SE」的作者包括:張俊格、郭瑋、尹奇躍、詹東、王琦瑋、胡益琿、申生奇和黃凱奇。2017年的CPAC也是由該團隊主要人員開發(fā)。

「CSE」使用的種族是神族(Protoss),采用的是規(guī)則和學習聯(lián)合驅動的方式。比如何時采用隱刀偷襲吸納了人類玩家的經驗知識;在建造隊列為空的時候,「CSE」使用深度學習來預測待構建單位,等等。

第二名 Facebook,蟲族 bot「CherryPi」

相比去年比賽中的 69% 勝率、第六名成績,來自 Facebook 的「CherryPi」今年有了大幅改進,取得了 90.86% 的勝率。「CherryPi」首先對于每個種族的對手有 8~13 種預先準備的不同的策略,利用比賽是多場 1v1 比賽的特點,它會根據(jù)與對手的過往比賽的勝率選擇最優(yōu)的策略。除此之外,它還使用了一個預訓練的機器模型,根據(jù)當前比賽狀態(tài)估算不同可用策略的勝率,然后在某些狀況下切換為勝率最高的策略。這種切換的設計也產生了「混合策略」的效果?!窩herryPi」中使用的機器學習技術還包括用于繞開障礙物、避戰(zhàn)與放風箏的尋路搜索算法、根據(jù)人類數(shù)據(jù)學習建筑布置、離線強化學習與在線學習等?!窩herryPi」也是今年唯一一個使用了 GPU 計算能力的 bot。

第一名 三星,人族 bot 「SAIDA」

我們都知道星際爭霸在韓國尤為盛行,自 2002 年來,韓國職業(yè)星際選手陸續(xù)加入了職業(yè)戰(zhàn)隊,并由包括三星、SK Telecom 等知名公司贊助?!窼AIDA」的成功很有可能來自其職業(yè)星際選手的助力。

根據(jù)介紹,「SAIDA」bot 的核心是使用了一個穩(wěn)定的游戲策略,它會首先考慮防守,然后在游戲中期伺機一波帶走對方。他們認為這種策略能應對絕大多數(shù)對手的策略,弱點也最少。

「SAIDA」也應用了一些 AI 技術。在 UAlbertaBot 的技術基礎上(下文還會提到),他們使用了一個有限狀態(tài)機來控制單位和建筑。每個單位和建筑在每種戰(zhàn)局下都有一個特定的狀態(tài)。并且使用了多個搜索算法來尋找敵方基地或者可以建造建筑的區(qū)域。

在開發(fā)過程中「SAIDA」還探索了使用 CNN 和編解碼器結構向人類選手學習進攻時機、在局部游戲中用多智能體強化學習方法學習單位微操,不過這些技術并沒有添加到此次參加比賽的版本中。

詳細排名

包含了所有團隊的成績以及詳細比賽數(shù)據(jù)的官方成績表單如下圖。

2018年星際爭霸AI挑戰(zhàn)賽中科院自動化所奪得季軍,三星與FB獲冠亞軍

比賽中其它有趣事項

  • 作為比賽中勝率最高的 bot,「SAIDA」面對人類選手的表現(xiàn)如何呢?三星團隊找業(yè)余選手和職業(yè)選手進行了測試,「SAIDA」可以擊敗業(yè)余選手,輸給了職業(yè)選手。不過他們認為差距并不大,擊敗職業(yè)選手的曙光就在前方。

  • 主辦方補刀:既然已經出現(xiàn)了能擊敗人類的 bot 了,那么未來業(yè)余選手也許再也沒有獲勝的機會了也說不定呢……

  • 絕大多數(shù)參賽團隊都使用固定的種族,2016、2017、2018 三年中都僅僅有一支團隊可以「隨機種族」。顯然單一種族意味著放棄了廣度,可以把已經發(fā)現(xiàn)的有效的策略挖得更深,也就更容易取得好成績。2017、2018 年的隨機種族方案都來自加拿大紐芬蘭紀念大學的 UAlbertaBot,今年他們僅以 34.71% 的勝率位列 19 位。基于 UAlbertaBot 然后獲得冠軍的三星「SAIDA」顯然只是借用了技術,用以實現(xiàn)自己的策略。

  • 「SAIDA」使用的策略顯然有極大的優(yōu)勢。根據(jù)挑戰(zhàn)賽主辦方提供的勝率波動圖表,在一開始的比賽中「SAIDA」就取得了最高勝率的位置,并一直穩(wěn)定保持到了最后。Facebook 的亞軍「CherryPi」與中科院自動化所的季軍「CSE」在剛開始時有交替波動,然后也很快穩(wěn)定了下來。

2018年星際爭霸AI挑戰(zhàn)賽中科院自動化所奪得季軍,三星與FB獲冠亞軍

圖中藍色線為「SAIDA」,黑色線為「CherryPi」,綠色線為「CSE」。

「CherryPi 」的 GitHub 地址:https://github.com/TorchCraft/TorchCraft

「Locutus」的 GitHub 地址:https://github.com/bmnielsen/Locutus/

雷鋒網 AI 科技評論報道。

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

2018年星際爭霸AI挑戰(zhàn)賽中科院自動化所奪得季軍,三星與FB獲冠亞軍

分享:
相關文章

讀論文為生

日常笑點滴,學術死腦筋
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說