丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給camel
發(fā)送

0

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

本文作者: camel 2019-10-27 21:22
導(dǎo)語(yǔ):一個(gè)嶄新的高水平交流平臺(tái)

雷鋒網(wǎng)AI科技評(píng)論按:近年來,隨著中國(guó)的學(xué)術(shù)實(shí)力不斷增強(qiáng),越來越多的學(xué)術(shù)頂會(huì)移步中國(guó),例如IJCAI、IROS、EMNLP、ICDM等學(xué)術(shù)頂會(huì)今年都在國(guó)內(nèi)舉辦。而針對(duì)多智能體系統(tǒng)而舉辦的國(guó)際分布式人工智能會(huì)議(Distributed AI,DAI)則更進(jìn)一步的代表,不僅僅首屆會(huì)議選址中國(guó),且其發(fā)起人中多數(shù)也都是華人學(xué)者。

其中南洋理工大學(xué)安波(大會(huì)共同主席)、清華大學(xué)唐平中(程序委員會(huì)共同主席)、南京大學(xué)高陽(yáng)(Workshop 主席)、MSRA 秦濤(工業(yè)論壇主席)、南京大學(xué)俞揚(yáng)(贊助主席)、天津大學(xué)郝建業(yè)(宣傳主席)都在組織者之列,圖靈獎(jiǎng)得主姚期智院士也擔(dān)任大會(huì)名譽(yù)主席并將做主旨報(bào)告。

之所以由華人推動(dòng)并成立這個(gè)會(huì)議,其背后則是我國(guó)分布式人工智能的研究群體日益壯大,工業(yè)界的應(yīng)用越來越頻繁,國(guó)內(nèi)學(xué)術(shù)界迫切需要舉辦一個(gè)新的高水平交流平臺(tái)。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

2019年10月13-15日,第一屆國(guó)際分布式AI大會(huì)在北京國(guó)家會(huì)議中心成功召開。雷鋒網(wǎng)了解到,本次會(huì)議共有 1 個(gè)workshop、2個(gè)tutorial、3個(gè)特邀主旨報(bào)告、3個(gè)工業(yè)主旨報(bào)告、6個(gè)工業(yè)特邀報(bào)告以及48個(gè)oral演講。本次會(huì)議,作為首屆DAI會(huì)議,共接收37篇投稿論文,其中13篇被收錄(長(zhǎng)論文 11 篇、短論文 3 篇)。此外,為了豐富本次會(huì)議的內(nèi)容,會(huì)議組織方也邀請(qǐng)了來自AAAI,AAMAS,IJCAI,NeurIPS,ICML,ACL,KDD等頂會(huì)的35篇論文做口頭報(bào)告。

一、德?lián)?amp;圍棋,全天講解

會(huì)議從13日開始,上下午分別有一個(gè)tutorial。有意思的是,上午tutorial的講者是著名德?lián)銩I研究者Noam Brown,而下午的講者是在圍棋AI領(lǐng)域極為著名的華人學(xué)者田淵棟。

德?lián)銩I大師:Noam Brown

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

Noam Brown 是Facebook人工智能實(shí)驗(yàn)室的研究科學(xué)家,他在計(jì)算博弈論和機(jī)器學(xué)習(xí)方面成果顯著,最為著名的則是2017年研發(fā)了雙人無限撲克Libratus ,以及2019年研發(fā)了多人無限撲克Pluribus,分別戰(zhàn)勝了人類頂級(jí)玩家,轟動(dòng)一時(shí)。其中,Libratus 也被《科學(xué)》雜志列入 12 項(xiàng)年度突破性科學(xué)成果之一,Pluribus 則登上《科學(xué)》雜志的封面。

在tutorial中,Brown講述了“不完美信息”情況下的游戲AI。在傳統(tǒng)游戲AI(例如國(guó)際象棋、圍棋等),所有的信息對(duì)于博弈雙方來講都是已知的,人工智能所需做的是盡可能快地搜尋最優(yōu)解,隨著AlphaGo在圍棋上的突破,完美信息游戲AI已經(jīng)達(dá)到了巔峰。但在現(xiàn)實(shí)世界中的諸多決策往往是不完全展現(xiàn)在參與者面前的,例如撲克,我們并不知道對(duì)手手中牌的信息。Brown在tutorial中首先解釋了為什么過去用于完美信息游戲的策略(搜索算法)在不完美信息游戲中會(huì)崩潰,然后介紹了集中克服相應(yīng)挑戰(zhàn)的新算法,特別是涵蓋虛擬游戲和反事實(shí)后悔最小化算法(counterfactual regret minimization algorithms),以及用于不完美信息游戲的搜索技術(shù)。

圍棋AI大師:田淵棟

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚 

田淵棟則從強(qiáng)化學(xué)習(xí)的角度對(duì)游戲AI中的方法、工具、應(yīng)用以及其他等方面做了全面回顧。田淵棟是Facebook在圍棋研究領(lǐng)域的負(fù)責(zé)人,在今年初田淵棟將基于AlphaZero研究工作而開發(fā)的ELF OpenGo 預(yù)訓(xùn)練模型與代碼完全開源,成為圍棋AI的首次開源,極大地促進(jìn)了圍棋AI的廣泛研究和應(yīng)用。

在tutorial中,田淵棟對(duì)最新的強(qiáng)化學(xué)習(xí)方法(A3C,APE-X,R2D2,SAC,自學(xué)習(xí)等)及其在游戲和其他應(yīng)用中的用法進(jìn)行了廣泛的回顧,并提出了一個(gè)全新的強(qiáng)化學(xué)習(xí)工具ReLA。田淵棟介紹說,ReLAx與之前他們開源所使用的ELF相比,在PyTorch C++ API中能夠利用本機(jī)向量支持,具有高效的批處理功能,且能夠執(zhí)行并行網(wǎng)絡(luò)轉(zhuǎn)發(fā)。田淵棟在隨后通過更加詳細(xì)的應(yīng)用案例講解了ReLA的應(yīng)用,值得游戲AI研發(fā)的人員仔細(xì)研究。

二、特邀主旨報(bào)告

本次會(huì)議的另一大亮點(diǎn)是由姚期智、Victor R. Lesser、劉鐵巖組成的特邀主旨報(bào)告陣容。

姚期智:Fintech: A Meeting of Minds Between Computer Science and Economics 

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

姚期智是世界著名的計(jì)算機(jī)學(xué)家,2000年圖靈獎(jiǎng)得主。其主要研究方向?yàn)橛?jì)算理論及其在密碼學(xué)和量子計(jì)算中的應(yīng)用。其在1995年便提出了分布式量子計(jì)算模型,后來成為分布式量子算法和量子通訊協(xié)議安全性的基礎(chǔ)。在本次會(huì)議中,姚期智作為首個(gè)特邀報(bào)告嘉賓做了主題為《Fintech: A Meeting of Minds Between Computer Science and Economics》的報(bào)告。

姚期智認(rèn)為金融科技可以看做是數(shù)字時(shí)代經(jīng)濟(jì)學(xué)和計(jì)算機(jī)科學(xué)的一次融合,在金融科技的主要技術(shù)基礎(chǔ)包含了計(jì)算機(jī)科學(xué)的可靠分布式計(jì)算和密碼學(xué)以及金融學(xué)方面的有效金融活動(dòng)機(jī)制等。在報(bào)告中,姚期智從以上的角度,探討了拍賣以及區(qū)塊鏈領(lǐng)域的一些最新工作。例如是否可以從競(jìng)標(biāo)者愿意支付的拍賣中獲得更多收益?當(dāng)投標(biāo)人比其他人更具風(fēng)險(xiǎn)承受能力時(shí)會(huì)有更多的收入嗎?他隨后還介紹了有關(guān)區(qū)塊鏈費(fèi)用的一些最新結(jié)果。他認(rèn)為這些結(jié)果有助于揭示經(jīng)濟(jì)學(xué)中的寫結(jié)構(gòu)性問題,而這些問題的答案在以往并不明顯。以下是姚期智在演講最后的總結(jié):

 首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

Victor R. Lesser:Reflections on DAI History and Coordination Technology

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

Victor R. Lesser 可謂是多智能體系統(tǒng)領(lǐng)域的創(chuàng)始人之一。他的重點(diǎn)研究領(lǐng)域包括復(fù)雜 AI 系統(tǒng)的控制和組織等,在多智能體和「黑板」系統(tǒng)等領(lǐng)域做出了突出貢獻(xiàn)。他曾擔(dān)任 AAAI 創(chuàng)始 Fellow、IEEE Fellow、多智能體系統(tǒng)國(guó)際會(huì)議(ICMAS)的首屆主席、國(guó)際智能體及多智能體系統(tǒng)協(xié)會(huì)(IFAAMAS)創(chuàng)始主席等;2007 年,為了表彰他在多智能體系統(tǒng)領(lǐng)域做出的杰出貢獻(xiàn),IFAAMAS 還專門設(shè)立了以他的名字命名的「Victor Lesser 杰出論文獎(jiǎng)」。此外,他還獲得了 2009 年 IJCAI「卓越研究獎(jiǎng)」等重要獎(jiǎng)項(xiàng)。作為多智能體系統(tǒng)領(lǐng)域的創(chuàng)始人,Lesser的報(bào)告主題為《Reflections on DAI History and Coordination Technology》,全面回顧了分布式AI和協(xié)作技術(shù)的研究歷史。

Lesser 回顧說,上世紀(jì) 70 年代后期,分布式人工智能這個(gè)新領(lǐng)域開始興起,研究?jī)?nèi)容包括分布式問題求解、規(guī)劃、組織控制、協(xié)商、協(xié)作等。最早在1980年 MIT 舉辦首次分布式人工智能研討會(huì),當(dāng)時(shí)僅有 22 人參加;直到1995年才舉辦第一個(gè)相關(guān)的國(guó)際性會(huì)議ICMAS(International Conference on Multi-Agent Systems)。隨后分布式AI的研究逐漸蓬勃發(fā)展。Lesser列舉了80年代人們對(duì)分布式AI的看法,并指出當(dāng)時(shí)“Agents' Views can be uncertain, incomplete and Out-of-Date”,盡管這么多年已經(jīng)過去,用戶的帶寬呈指數(shù)增長(zhǎng),agent仍然必須應(yīng)對(duì)有限且過時(shí)的網(wǎng)絡(luò)狀態(tài)視圖。隨后Lesser講述了他個(gè)人對(duì)于協(xié)作在多智能體中的作用。并強(qiáng)調(diào)說“協(xié)作過去是、現(xiàn)在是、將來也將仍然是分布式AI中重要且具有挑戰(zhàn)性的問題”。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

劉鐵巖:Towards AI-powered Industrial Digital Transformations

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

劉鐵巖是微軟亞洲研究院副院長(zhǎng),IEEE Fellow。作為機(jī)器學(xué)習(xí)和信息檢索領(lǐng)域的知名專家,他近年來在深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、分布式機(jī)器學(xué)習(xí)等方面也頗有建樹。值得一提的是,他帶領(lǐng)的微軟團(tuán)隊(duì)就在不久前為 AI 領(lǐng)域帶來了一項(xiàng)突破性的成果——世界最強(qiáng)的麻將 AI「Suphx」在日本在線麻將競(jìng)技平臺(tái)「天鳳」晉級(jí)十段。不過他在本次報(bào)告中并沒有介紹他們所研制的麻將AI,而是以主題為《Towards AI-powered Industrial Digital Transformations》介紹了微軟亞洲研究院如何利用人工智能幫助傳統(tǒng)企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型。

劉鐵巖首先介紹了他們與共同基金公司AMC和保險(xiǎn)公司中國(guó)太平在AI投資方面的合作,據(jù)劉鐵巖介紹,他們開發(fā)的AI投資模型實(shí)現(xiàn)了超額的回報(bào)以及非常好的風(fēng)險(xiǎn)控制。隨后他介紹了微軟亞洲研究院與世界上最大的海洋運(yùn)輸公司東方海外的合作,其發(fā)明的“競(jìng)爭(zhēng)性強(qiáng)化學(xué)習(xí)”的技術(shù)解決了他們?cè)诳杖萜髦匦路胖玫膯栴},極大地降低了東方海外的運(yùn)營(yíng)成本。劉鐵巖介紹說,隨著AI技術(shù)的發(fā)展,將會(huì)有越來越多的行業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型,AI科學(xué)家和領(lǐng)域?qū)<覒?yīng)當(dāng)充分合作以共同促進(jìn)世界的進(jìn)步。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

除了以上三位大會(huì)特邀主旨報(bào)告外,會(huì)議還邀請(qǐng)了螞蟻金服副總裁漆遠(yuǎn)、微軟亞洲軟件技術(shù)中心首席科學(xué)家姜大昕、滴滴出行副總裁葉杰平分別就分布式AI在各自行業(yè)的應(yīng)用做了特邀分享:

 首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

螞蟻金服副總裁漆遠(yuǎn)

報(bào)告主題:Multi-agent Machine Learning for All-Inclusive Finance

 首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

微軟亞洲研究院軟件技術(shù)中心首席科學(xué)家姜大昕

報(bào)告主題:Question Answering in Bing

 首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

滴滴出行副總裁葉杰平

報(bào)告主題:AI for Transportation


三、最佳論文

本屆 DAI 大會(huì)在14日晚宴上宣布了最佳論文獎(jiǎng)與最佳論文榮譽(yù)提名獎(jiǎng)項(xiàng)。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

最佳論文獎(jiǎng)

本屆最佳論文獲獎(jiǎng)?wù)邽?Weixun Wang、Jianye Hao、Yixi Wang、Matthew E. Taylor 。其中 Weixun Wang、Jianye Hao、Yixi Wang 來自天津大學(xué),Matthew E. Taylor 來自華盛頓州大學(xué)。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

標(biāo)題:Achieving Cooperation Through Deep Multiagent Reinforcement Learning in Sequential Prisoner's Dilemmas

作者:Weixun Wang, Jianye Hao, Yixi Wang, Matthew E. Taylor

論文地址:http://www.adai.ai/dai/paper/29.pdf

該論文考慮了一個(gè)多智能體交互的問題??紤]到真實(shí)世界更多的是一個(gè)多智能體問題,采用傳統(tǒng)的「感知」方法是不夠的,需要多智能體研究來更好地模擬真實(shí)情況。迭代囚徒困境已經(jīng)指導(dǎo)了社會(huì)困境問題方面的研究多年。然而,這一問題只分成了兩種原子行為:合作和對(duì)抗。在真實(shí)世界的囚徒困境中,這些選擇可能會(huì)有所延伸,而且不同的策略可能會(huì)帶來一連串連鎖反應(yīng),從而影響合作的程度。在本文中,研究者提出了一種名為序列囚徒困境(SPD)的問題,以便更好地捕捉前述特征。

在文章中,作者提出了一個(gè)深度多智能體強(qiáng)化學(xué)習(xí)方法,可以探索在 SPD 問題中相互合作的演變過程。研究者的方法分為兩步:第一步是線下過程,通過不同的合作級(jí)別整合策略,然后訓(xùn)練一個(gè)合作等級(jí)檢測(cè)網(wǎng)絡(luò)。第二步是在線過程,一個(gè)智能體基于檢測(cè)到的對(duì)方的合作等級(jí),逐漸調(diào)整并選擇自身的策略。研究者認(rèn)為,他們提出的方法可以在兩個(gè)有代表性的二維 SPD 問題中展示:「蘋果-梨」問題和「水果收集」問題。實(shí)驗(yàn)結(jié)果說明,研究提出的方法可以讓智能體避免被具有掠奪性的對(duì)手剝削,同時(shí)和有合作意向的對(duì)手達(dá)成合作。

最佳論文榮譽(yù)提名獎(jiǎng)

本屆 DAI 大會(huì)最佳論文榮譽(yù)提名獎(jiǎng)授予給谷歌研究院(Google Research)的 Song Zuo,他從線性規(guī)劃的新穎視角解讀了邁爾森的最優(yōu)拍賣理論。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)洹?AI 頂級(jí)研究者齊聚

標(biāo)題:Rediscovery of Myerson's Auction via Primal-Dual Analysis

作者:Song Zuo

論文地址:http://www.adai.ai/dai/paper/36.pdf

最優(yōu)拍賣理論是由邁爾森(Myerson)于 1981 年提出的,該理論力圖解決在給定信息分布的情況下,如何設(shè)計(jì)出某種制度來最大限度地激勵(lì)經(jīng)濟(jì)活動(dòng)的參與人,也就是最優(yōu)合同的設(shè)計(jì)問題。2007年Myerson憑借這套理論獲得了該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。

在這篇文章中,作者用完全不同的方法(線性變成和原始對(duì)偶分析)重新發(fā)現(xiàn)了Myerson的最優(yōu)拍賣。具體來說,他同時(shí)考慮了貝葉斯(貝葉斯激勵(lì)兼容+貝葉斯個(gè)人理性)和支配策略(支配策略激勵(lì)+事后個(gè)人比例)的實(shí)現(xiàn)方式,其中所有購(gòu)買者都具有加法估值和準(zhǔn)線性公用事業(yè)和所有估值均分布在有限支持下。當(dāng)購(gòu)買者價(jià)值為一維且獨(dú)立分布時(shí),可以直接證明貝葉斯實(shí)施線性程序的雙重目標(biāo)不超過主導(dǎo)策略實(shí)施線性程序的雙重目標(biāo)。換句話說,在貝葉斯和主導(dǎo)策略實(shí)施下的最優(yōu)收入是相同的。

據(jù)論文作者觀察,若把雙重計(jì)劃解釋為最大化的虛擬福利,便可將Myerson的最優(yōu)拍賣直接解釋為“主導(dǎo)策略”線性計(jì)劃。此外,作者還描述了BIC = DSIC的充分必要條件,即貝葉斯實(shí)現(xiàn)的最佳收益等于主導(dǎo)策略實(shí)現(xiàn)的最佳收益(BRev = DRev)。條件是當(dāng)且僅當(dāng)獨(dú)立于虛擬價(jià)值函數(shù)的 DSIC 和后 IR 虛擬福利達(dá)到最大值時(shí)才能獲得最優(yōu) DSIC 收益 DR-EV(一個(gè)買家的虛擬價(jià)值獨(dú)立于其他買家的估價(jià))。

雷鋒網(wǎng)報(bào)道。

相關(guān)文章:

姚期智、劉鐵巖主講,Noam Brown、田淵棟講習(xí),首屆國(guó)際分布式AI學(xué)術(shù)會(huì)議議程全公布

中國(guó)學(xué)術(shù)力量不容小覷,首屆華人帶頭的國(guó)際分布式人工智能學(xué)術(shù)會(huì)議將于北京召開

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

首屆國(guó)際分布式AI會(huì)議在京召開,姚期智、Lesser坐鎮(zhèn),德?lián)?、圍?AI 頂級(jí)研究者齊聚

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說