0
雷鋒網 AI 科技評論消息,第 32 屆 AAAI 大會(AAAI 2018)日前在美國新奧爾良拉開帷幕,會議時間為 2 月 2 日至 7 日。
作為人工智能領域最悠久、涵蓋內容最廣泛的學術會議之一,歷屆 AAAI 都吸引了全世界的人工智能相關領域的研究者參與,會議的論文內容也豐富多彩。近年來參加 AAAI 的中國學者和以及投稿 AAAI 的中國論文也都有明顯增加,這也印證了 AAAI 對中國學者們的吸引力。實際上,來自中國的論文投遞數在 2017 年為 785 篇,僅以微弱優(yōu)勢超越美國,但在今年實現了 58%的驚人提升,以 1242 篇論文當仁不讓地成為 AAAI 2018 的「學術論文第一產地」。但從錄用論文的數量來說,中美兩國仍然不相上下,均有 260 余篇論文被收錄,可見來自中國的投稿數雖然有了大幅提升,但在質量上仍然有進步的空間。
AAAI 2018 今年共收到論文投稿 3808 篇,接受論文 938 篇,接受率 24%。大會評出杰出論文、杰出學生論文各一篇,杰出論文提名、杰出學生論文提名各一篇,以及經典論文一篇。盡管《Memory-Augmented Monte Carlo Tree Search》獲得杰出論文的消息早已傳播開來,但論文內容還是直到上周末才公開發(fā)表;另外,這篇來自阿爾伯塔大學的論文的三位作者中也有兩位是華人。
杰出論文 Outstanding Paper:《Memory-Augmented Monte Carlo Tree Search》
記憶增強的蒙特卡洛樹搜索
論文摘要:這篇論文提出并評估了記憶增強蒙特卡洛樹搜索(M-MCTS),這一方法為在線實時搜索提出了一種新的利用泛化性的方式。記憶增強蒙特卡洛樹搜索的關鍵思路是把蒙特卡洛樹搜索和一個記憶結構組合起來,記憶結構中的每個存儲位置都可以包含某個特定狀態(tài)的信息。通過綜合類似的狀態(tài)的估計結果,這些記憶可以生成逼近的估計值。作者們展示了,在隨機情況下,基于記憶的逼近值有更高可能性比原始的蒙特卡洛樹搜索表現更好。作者們也在圍棋游戲中評估了記憶增強蒙特卡洛樹搜索,實驗結果表明,在同樣的模擬步數下記憶增強蒙特卡洛樹搜索也比原始版本有更好的表現。
論文地址:https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf
杰出學生論文 Outstanding Student Paper:《 Counterfactual Multi-Agent Policy Gradients》
反事實多智能體策略梯度
論文摘要:許多現實世界中的問題,比如網絡數據包的路由,或者自動駕駛汽車之間的協(xié)調,都可以很自然地看作合作性的多智能體系統(tǒng)問題來建模。這就對新的強化學習方法提出了強烈的需求,以便為這些系統(tǒng)高效地學習到區(qū)中心化的運行策略。出于這個目的,作者們提出了一種新的多智能體的“執(zhí)行者-批評者”方法:反事實多智能體策略梯度(COMA)。COMA 中使用一個中心化的批評者估計Q函數和區(qū)中心化的執(zhí)行者,從而優(yōu)化智能體的運行策略。除此之外,為了解決多智能體間互相建立信任的問題,它使用了一個會把單個智能體的動作邊緣化的反事實基準線,同時還能保證其它智能體的動作不變。COMA 中使用了一個批評式的表征,從而使得這個反事實基準線可以在單個前饋流程中進行高效的計算。作者們在星際爭霸游戲的單位控制測試環(huán)境中評估了 COMA 的表現,使用了非常便于分別觀察的去中心化變量。與這個環(huán)境下的其它多智能體執(zhí)行者-批評者方法相比,COMA 的平均表現有顯著提高,而且 COMA 得到的最好的智能體的表現可以和頂尖的具有全狀態(tài)數據的中心化控制方法相提并論。
杰出論文提名 Outstanding Paper, Honorable Mention:《Generalized Adjustment Under Confounding and Selection Biases》
對選擇偏倚和混雜偏倚的泛化調節(jié)處理方法
論文摘要:選擇偏倚和混雜偏倚是限制常見推理方法在大尺度環(huán)境下使用的最常見的兩個障礙。在這篇論文中,作者們泛化了后門調節(jié)的想法,以便同時處理這兩種偏倚,并且在不引入選擇偏倚的情況下利用可能的外部數據(比如來自人口調查的數據)。作者們介紹了調節(jié)對(adjustment pair)的思路,并展示了通過調節(jié)方法識別因果關系的完整圖形條件。作者們還進一步設計了一個算法,以多項式形式列出所有可以處理的調節(jié)對,對于希望評估以部分可處理的調節(jié)對的特定屬性(常見屬性包括開銷、變化、測量難度)的研究人員來說這會很有用。最后,作者們描述了一種統(tǒng)計性的估計過程,一旦確認了某個設置是可以處理的就可以執(zhí)行這個過程;它可以用來處理有限樣本中的多種問題。
論文地址:https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf
杰出學生論文提名 Outstanding Student Paper, Honorable Mention:《Adapting a Kidney Exchange Algorithm to Align with Human Values》
改造出和人類的價值一致的腎臟分配算法
論文摘要:如何高效分配有限的資源是經濟學和計算機科學兩個領域共有的經典問題。對于腎臟移植手術來說,通常會由一個中央市場把一切正常的腎臟捐贈者分配給等待腎臟的病人。在腎臟分配中,病人和捐贈者首先由委員會通過特設的權重決定優(yōu)先級,然后輸入一個分配算法,由它決定哪個病人會分配到哪個捐贈者 —— 以及決定哪個病人分配不到捐贈者。在這篇論文中,作者們提出了一種端到端的方法用于在腎臟分配中根據每個病人的檔案估計權重。作者們首先從人類被試者獲取了一組他們認為可以用于決定病人優(yōu)先級的屬性(比如醫(yī)療特征,生活方式等等)。然后作者們根據不同病人的檔案向被試者提問對比問題,并根據他們的回答嚴格地計算出各個屬性的權重。作者們展示了如何在腎臟分配市場的分配算法中使用這些權重。作者們接著在模擬環(huán)境下評估了這些權重的影響,發(fā)現他們算出的權重的精確值其實影響很小,實際上需要的只是由權重計算出的檔案的排序。不過,與完全不給病人排優(yōu)先級的情況相比,帶有權重的算法還是取得了更好的表現,確實有部分類別的病人從前述的測試者的價值評價中獲得了優(yōu)先匹配(或者延后匹配)。
經典論文 Classic Paper:《Algorithm and Tool for Automated Ontology Merging and Alignment》
自動本體合并和對齊的算法及工具
這篇論文來自 2000 年的第 17 屆 AAAI 大會。這次頒獎是為了表彰這篇論文在本體匹配和集成研究方面的先驅性貢獻,論文中分析了這個問題的具體情況,并提出了首個創(chuàng)新的解決方案。
論文作者 Natasha Fridman Noy 應邀在會議上進行了演講,介紹了論文內容以及這個問題研究的后續(xù)變遷,雷鋒網 AI 科技評論也將為大家整理呈現演講內容。請期待后續(xù)報道。
雷鋒網 AI 科技評論報道
相關文章:
AAAI 2018全揭秘:1242篇中國投遞論文領跑全球,錄用數和美國平分秋色
AAAI 2018 六大前瞻亮點搶先看,BATJ、滴滴聚首學術頂會|AAAI 2018
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。