1
本文作者: 周翔 | 2017-01-31 13:32 |
雷鋒網(wǎng)消息:當(dāng)?shù)貢r間1月30日,在賓夕法尼亞州匹茲堡的Rivers賭場,卡耐基梅隆大學(xué)(CMU)開發(fā)的人工智能系統(tǒng)Libratus戰(zhàn)勝四位德州撲克頂級選手,獲得最終勝利。
據(jù)官網(wǎng)介紹,此次由4名人類職業(yè)玩家Jason Les、Dong Kim、Daniel McAulay 和Jimmy Chou對戰(zhàn)人工智能程序Libratus,賽程為20天,一共進行了12萬手牌的比賽。
2015年,CMU曾組織了首場“大腦對抗人工智能”賽事。在當(dāng)時的賽事中,代表CMU出戰(zhàn)的是另外一款人工智能系統(tǒng)“Claudico”,同樣也有4名職業(yè)撲克玩家參加了比賽,然而,Claudico并未獲得最終勝利。
不過CMU學(xué)認為,當(dāng)時撲克職業(yè)玩家與Claudico僅進行了8萬手牌的比賽,就統(tǒng)計學(xué)角度來講并無法證明人類職業(yè)撲克玩家或人工智能具有優(yōu)勢。這也是本輪巡回賽中比賽的牌局數(shù)量增加50%的原因。
德州撲克的玩法:每個玩家有2張牌作為“底牌”,同時還有5張公共牌。玩家用自己的2張底牌和5張公共牌結(jié)合在一起,選出5張牌,不論手中的牌使用幾張(甚至可以不用手中的底牌),湊成最大的成牌,跟其他玩家比大小。按照“Card Ranking”決定最后的勝者。
由于對方的“底牌信息”是隱藏信息,對于計算機來說,就是在處理一種“非完整信息博弈”。而圍棋對弈雙方的信息是完整的、對稱的,并沒有隱藏的信息。Libratus此次戰(zhàn)勝頂級人類德州撲克選手,具有非常重要的意義。
計算機正確決定,依賴于對方“底牌信息”情況下的概率分布,這種“底牌信息”可以通過對手過去的行為顯露出來。比如有時玩家采取“詐唬”(Bluffing),對手有時手里并沒有強牌,但還是作出全額下注志在必得的行為,計算機這時要根據(jù)對方過去的博弈表現(xiàn),來判斷對手有強牌的概率。
相應(yīng)的,對手也會推斷我方的底牌信息,所以這里就是一個“遞歸推理”(recursive reasoning),一個玩家無法輕易推理博弈狀況。
繼圍棋和德州撲克之后,人工智能的下一站會是哪個游戲呢?
雷鋒網(wǎng)雷鋒網(wǎng)
【招聘】雷鋒網(wǎng)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時間提供海外科技動態(tài)與資訊。我們需要若干關(guān)注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。
簡歷投遞至 wudexin@leiphone.com,工作地 北京。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。