1
本文作者: 周翔 | 2017-01-31 13:32 |
雷鋒網(wǎng)消息:當(dāng)?shù)貢r(shí)間1月30日,在賓夕法尼亞州匹茲堡的Rivers賭場(chǎng),卡耐基梅隆大學(xué)(CMU)開發(fā)的人工智能系統(tǒng)Libratus戰(zhàn)勝四位德州撲克頂級(jí)選手,獲得最終勝利。
據(jù)官網(wǎng)介紹,此次由4名人類職業(yè)玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou對(duì)戰(zhàn)人工智能程序Libratus,賽程為20天,一共進(jìn)行了12萬(wàn)手牌的比賽。
2015年,CMU曾組織了首場(chǎng)“大腦對(duì)抗人工智能”賽事。在當(dāng)時(shí)的賽事中,代表CMU出戰(zhàn)的是另外一款人工智能系統(tǒng)“Claudico”,同樣也有4名職業(yè)撲克玩家參加了比賽,然而,Claudico并未獲得最終勝利。
不過(guò)CMU學(xué)認(rèn)為,當(dāng)時(shí)撲克職業(yè)玩家與Claudico僅進(jìn)行了8萬(wàn)手牌的比賽,就統(tǒng)計(jì)學(xué)角度來(lái)講并無(wú)法證明人類職業(yè)撲克玩家或人工智能具有優(yōu)勢(shì)。這也是本輪巡回賽中比賽的牌局?jǐn)?shù)量增加50%的原因。
德州撲克的玩法:每個(gè)玩家有2張牌作為“底牌”,同時(shí)還有5張公共牌。玩家用自己的2張底牌和5張公共牌結(jié)合在一起,選出5張牌,不論手中的牌使用幾張(甚至可以不用手中的底牌),湊成最大的成牌,跟其他玩家比大小。按照“Card Ranking”決定最后的勝者。
由于對(duì)方的“底牌信息”是隱藏信息,對(duì)于計(jì)算機(jī)來(lái)說(shuō),就是在處理一種“非完整信息博弈”。而圍棋對(duì)弈雙方的信息是完整的、對(duì)稱的,并沒(méi)有隱藏的信息。Libratus此次戰(zhàn)勝頂級(jí)人類德州撲克選手,具有非常重要的意義。
計(jì)算機(jī)正確決定,依賴于對(duì)方“底牌信息”情況下的概率分布,這種“底牌信息”可以通過(guò)對(duì)手過(guò)去的行為顯露出來(lái)。比如有時(shí)玩家采取“詐?!保˙luffing),對(duì)手有時(shí)手里并沒(méi)有強(qiáng)牌,但還是作出全額下注志在必得的行為,計(jì)算機(jī)這時(shí)要根據(jù)對(duì)方過(guò)去的博弈表現(xiàn),來(lái)判斷對(duì)手有強(qiáng)牌的概率。
相應(yīng)的,對(duì)手也會(huì)推斷我方的底牌信息,所以這里就是一個(gè)“遞歸推理”(recursive reasoning),一個(gè)玩家無(wú)法輕易推理博弈狀況。
繼圍棋和德州撲克之后,人工智能的下一站會(huì)是哪個(gè)游戲呢?
雷鋒網(wǎng)雷鋒網(wǎng)
【招聘】雷鋒網(wǎng)堅(jiān)持在人工智能、無(wú)人駕駛、VR/AR、Fintech、未來(lái)醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國(guó)際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。
簡(jiǎn)歷投遞至 wudexin@leiphone.com,工作地 北京。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。