0
本文作者: AI科技評論 | 2020-04-22 12:47 | 專題:ICLR 2019 |
CVPR 2020 系列論文解讀公開課第四期,就在4月23日(本周四)20:00 整(北京時(shí)間)進(jìn)行。
AI科技評論出品
針對目前國際疫情形勢越發(fā)嚴(yán)峻,無法現(xiàn)場參會(huì)進(jìn)行學(xué)術(shù)交流的情況,AI研習(xí)社聯(lián)合AI科技評論組織策劃了頂會(huì)系列專題活動(dòng),這其中就包括【ICLR 2020 專題】系列活動(dòng)。而【ICLR 2020系列論文解讀公開課】更是其中重要的組成部分,除此之外,專題還包括系列論文文字解讀,會(huì)議數(shù)據(jù)分析,會(huì)議資源下載等。
本次直播為【ICLR 2020 系列論文解讀公開課】第八期,此論文錄用為ICLR 2020 論文《 Action Semantics Network: Considering the Effects of Actions in Multiagent Systems》,我們有幸邀請到了天津大學(xué)王維塤博士,帶來關(guān)于“動(dòng)作語義網(wǎng)絡(luò),考慮多智能體系統(tǒng)中動(dòng)作的影響”的分享。
論文地址: https://openreview.net/forum?id=ryg48p4tPH
講師介紹
王維塤
天津大學(xué)一年級博士生,導(dǎo)師為郝建業(yè)副教授,研究興趣為:深度強(qiáng)化學(xué)習(xí),多智能體深度強(qiáng)化學(xué)習(xí) 及其 在現(xiàn)實(shí)世界的運(yùn)用。曾在阿里巴巴(定向廣告),網(wǎng)易游戲伏羲實(shí)驗(yàn)室進(jìn)行實(shí)習(xí),并在相應(yīng)會(huì)議如:AAAI,AAMAS,ICLR,CIKM,DAI等上發(fā)表多篇相關(guān)論文,并獲得DAI 2019 最佳論文獎(jiǎng)。
更多信息請見個(gè)人主頁:http://wwxfromtju.github.io
分享時(shí)間
4月23日(周四) 20:00整(北京時(shí)間)
分享主題
動(dòng)作語義網(wǎng)絡(luò):考慮多智能體系統(tǒng)中動(dòng)作的影響
分享背景
從Alpha Go起,深度強(qiáng)化學(xué)習(xí)引起了學(xué)術(shù)界與業(yè)界的廣泛關(guān)注。多智能體深度強(qiáng)化學(xué)習(xí)(MADRL)因其在現(xiàn)實(shí)世界中廣泛的潛在應(yīng)用,近期成為了學(xué)界熱點(diǎn)。
以往的工作為了促進(jìn)多智能體的協(xié)調(diào),將各種多智能體協(xié)調(diào)機(jī)制引入深度學(xué)習(xí)體系中,然而,它們并沒有明確考慮多智能體之間的動(dòng)作語義,即不同的動(dòng)作對其他智能體的影響是不同的。
在這篇論文中,提出了一種新的網(wǎng)絡(luò)體系結(jié)構(gòu),稱為動(dòng)作語義網(wǎng)絡(luò)( Action Semantics Network),能夠顯示地表示智能體之間的動(dòng)作語義。
本次分享將展示如何將動(dòng)作語義網(wǎng)絡(luò)與深度強(qiáng)化學(xué)習(xí)(DRL)算法相結(jié)合來提高它們的性能,并展示在星際爭霸II、Neural MMO、逆水寒等游戲中的訓(xùn)練效果。
分享提綱
1.多智能體系統(tǒng)的基本介紹與當(dāng)前深度多智能體的進(jìn)展與相應(yīng)研究
2.Action Semantics Network的研究動(dòng)機(jī)
3. Action Semantics Network的網(wǎng)絡(luò)介紹及相應(yīng)實(shí)驗(yàn)效果,展示逆水寒的訓(xùn)練效果(星際爭霸2, OpenAl Neural MMO)
如何報(bào)名?
方式一:
直達(dá)直播地址:http://mooc.yanxishe.com/open/course/793
方式二:
掃碼添加【AI研習(xí)社頂會(huì)小助手】微信:AIyanxishe2,進(jìn)群獲取直播鏈接和直播PPT。
疫情拉開了大家的距離,但是學(xué)術(shù)交流是不會(huì)就因?yàn)橐咔楸蛔钃醯?,我們愿架起這座學(xué)者之間的橋梁,以最短路徑,讓更多學(xué)者能更快的參與其中,促進(jìn)學(xué)術(shù)交流,讓知識真正流動(dòng)!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。