繼 AlphaGo 之后又一突破：人工智能 Libratus 戰(zhàn)勝德州撲克頂級(jí)選手

本文作者：周翔

2017-01-31 13:32

導(dǎo)語(yǔ)：由于對(duì)方的“底牌信息”是隱藏信息，對(duì)于計(jì)算機(jī)來(lái)說(shuō)，就是在處理一種“非完整信息博弈”。而圍棋對(duì)弈雙方的信息是完整的、對(duì)稱的，并沒(méi)有隱藏的信息。

雷鋒網(wǎng)消息：當(dāng)?shù)貢r(shí)間1月30日，在賓夕法尼亞州匹茲堡的Rivers賭場(chǎng)，卡耐基梅隆大學(xué)（CMU）開發(fā)的人工智能系統(tǒng)Libratus戰(zhàn)勝四位德州撲克頂級(jí)選手，獲得最終勝利。

據(jù)官網(wǎng)介紹，此次由4名人類職業(yè)玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou對(duì)戰(zhàn)人工智能程序Libratus，賽程為20天，一共進(jìn)行了12萬(wàn)手牌的比賽。

2015年，CMU曾組織了首場(chǎng)“大腦對(duì)抗人工智能”賽事。在當(dāng)時(shí)的賽事中，代表CMU出戰(zhàn)的是另外一款人工智能系統(tǒng)“Claudico”，同樣也有4名職業(yè)撲克玩家參加了比賽，然而，Claudico并未獲得最終勝利。

不過(guò)CMU學(xué)認(rèn)為，當(dāng)時(shí)撲克職業(yè)玩家與Claudico僅進(jìn)行了8萬(wàn)手牌的比賽，就統(tǒng)計(jì)學(xué)角度來(lái)講并無(wú)法證明人類職業(yè)撲克玩家或人工智能具有優(yōu)勢(shì)。這也是本輪巡回賽中比賽的牌局?jǐn)?shù)量增加50%的原因。

德州撲克的玩法：每個(gè)玩家有2張牌作為“底牌”，同時(shí)還有5張公共牌。玩家用自己的2張底牌和5張公共牌結(jié)合在一起，選出5張牌，不論手中的牌使用幾張（甚至可以不用手中的底牌），湊成最大的成牌，跟其他玩家比大小。按照“Card Ranking”決定最后的勝者。

由于對(duì)方的“底牌信息”是隱藏信息，對(duì)于計(jì)算機(jī)來(lái)說(shuō)，就是在處理一種“非完整信息博弈”。而圍棋對(duì)弈雙方的信息是完整的、對(duì)稱的，并沒(méi)有隱藏的信息。Libratus此次戰(zhàn)勝頂級(jí)人類德州撲克選手，具有非常重要的意義。

計(jì)算機(jī)正確決定，依賴于對(duì)方“底牌信息”情況下的概率分布，這種“底牌信息”可以通過(guò)對(duì)手過(guò)去的行為顯露出來(lái)。比如有時(shí)玩家采取“詐?！保˙luffing），對(duì)手有時(shí)手里并沒(méi)有強(qiáng)牌，但還是作出全額下注志在必得的行為，計(jì)算機(jī)這時(shí)要根據(jù)對(duì)方過(guò)去的博弈表現(xiàn)，來(lái)判斷對(duì)手有強(qiáng)牌的概率。

相應(yīng)的，對(duì)手也會(huì)推斷我方的底牌信息，所以這里就是一個(gè)“遞歸推理”（recursive reasoning），一個(gè)玩家無(wú)法輕易推理博弈狀況。

繼圍棋和德州撲克之后，人工智能的下一站會(huì)是哪個(gè)游戲呢？

雷鋒網(wǎng)雷鋒網(wǎng)

【招聘】雷鋒網(wǎng)堅(jiān)持在人工智能、無(wú)人駕駛、VR/AR、Fintech、未來(lái)醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國(guó)際新聞、具有一定的科技新聞選題能力，翻譯及寫作能力優(yōu)良的外翻編輯加入。

簡(jiǎn)歷投遞至 wudexin@leiphone.com，工作地北京。

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

4人收藏

相關(guān)文章

周翔

編輯

發(fā)私信

當(dāng)月熱門文章