德?lián)銩I之父請(qǐng)來(lái)了最棒的博弈論學(xué)者們，他們能與 AI 擦出怎樣的火花？｜ AAAI 2018

本文作者：趙青暉

編輯：郭奕欣

2018-02-04 14:40

專(zhuān)題：AAAI 2018

導(dǎo)語(yǔ)：非對(duì)稱(chēng)信息博弈與 AI 聯(lián)系得越發(fā)緊密。

美國(guó)當(dāng)?shù)貢r(shí)間 2 月 3 日，AAAI 2018 在第一天的預(yù)熱之后逐漸熱鬧了起來(lái)。雷鋒網(wǎng) AI 科技評(píng)論在前瞻報(bào)道中提到過(guò)，本次大會(huì)將會(huì)有 15 個(gè) Workshop 陸續(xù)進(jìn)行，其中《非對(duì)稱(chēng)信息博弈的 AI（ AI for Imperfect-Information Games）》就是其中一個(gè)。這一 workshop 的組織者包括 CMU 的 Noam Brown, DeepMind 的 Marc Lanctot 還有南加州大學(xué)博士生、曾獲谷歌 PhD 獎(jiǎng)研金的徐海峰。

就像 AlphaGo 讓大家更加熟知深度學(xué)習(xí)，大家對(duì)非對(duì)稱(chēng)信息博弈開(kāi)始了解并熟悉，很大程度也是因?yàn)?2017 年初，CMU 計(jì)算機(jī)系在讀博士生 Noam Brown 和計(jì)算機(jī)系教授 Tuomas Sandholm 聯(lián)合研發(fā)的 Libratus 在單挑無(wú)限注德州撲克（ heads-up no-limit hold’em）人機(jī)對(duì)戰(zhàn)中完勝人類(lèi)選手。在去年的 NIPS 2017 上，最佳論文正是由他倆的合作論文《Safe and Nested Subgame Solving for Imperfect-Information Games》所摘得。雷鋒字幕組也曾對(duì)這一論文解讀視頻進(jìn)行獨(dú)家編譯。

正像 Noam Brown 和 Tuomas Sandholm 在 Reddit 上所表達(dá)的那樣：深度學(xué)習(xí)遠(yuǎn)非人工智能的全部，非對(duì)稱(chēng)信息博弈也與 AI 聯(lián)系得越發(fā)緊密?！阜菍?duì)稱(chēng)信息博弈」常被用來(lái)模擬涉及隱藏信息的各種戰(zhàn)略交互（例如談判，拍賣(mài)等）和安全交互中。由于隱藏信息的存在，解決這些事件需要的方法與傳統(tǒng)的對(duì)稱(chēng)信息（比如國(guó)際象棋或棋類(lèi)游戲）完全不同。盡管在一些研究「非對(duì)稱(chēng)信息模擬」的領(lǐng)域取得了相當(dāng)大的進(jìn)展，但是每個(gè)領(lǐng)域所使用的技術(shù)盡管具有普遍性，卻仍然相對(duì)孤立。它們之間存在充分的跨學(xué)科交流的機(jī)會(huì)，讓研究人員們會(huì)通過(guò)已經(jīng)在一個(gè)領(lǐng)域中流行的方法的新應(yīng)用、或使用建立在不同領(lǐng)域中已有方法來(lái)創(chuàng)建新的技術(shù)。

本場(chǎng) Workshop 的主要話題幾乎包含了「非對(duì)稱(chēng)信息博弈的 AI」相關(guān)的大部分內(nèi)容，包括新近用于 AAAI 年度計(jì)算機(jī)撲克比賽（ACPC），用于解決大型不完美信息游戲的可伸縮算法，游戲中的對(duì)手建模和開(kāi)發(fā)，一般和多于兩個(gè)的算法建模和分析信息非對(duì)稱(chēng)在游戲中的作用，戰(zhàn)略信號(hào)（又名說(shuō)服），在不完整信息的戰(zhàn)略環(huán)境中進(jìn)行探索與開(kāi)發(fā)，以及一些與非對(duì)稱(chēng)信息博弈有關(guān)的其他主題的研究。

?研究者們將分享他們?cè)谘芯?AI 在非對(duì)稱(chēng)信息博弈中的理論和實(shí)踐方面當(dāng)前的研究成果，也提出有關(guān)如何改善相關(guān)領(lǐng)域算法的構(gòu)想，推動(dòng)該領(lǐng)域的 AI 研究。

這場(chǎng) Workshop 持續(xù)了一整天，原計(jì)劃是早上 9:30 開(kāi)場(chǎng)，下午 5:00 結(jié)束，有 8 個(gè)演講者對(duì)他們的研究成果進(jìn)行分享，每人限時(shí)半小時(shí)，以下是原定議程：