1
2010年南非世界杯,神奇的章魚保羅因成功連續(xù)預(yù)測了8場賽事而名揚(yáng)世界。
八年,彈指一揮間(沒忘記你,巴西世界杯)。這一屆的世界杯冠軍又將花落誰家?顯然,章魚保羅已然指望不上了,但新的技術(shù)已經(jīng)迫不及待地登場,8年后的俄羅斯世界杯,人工智能登場了。
來自德國多特蒙德技術(shù)大學(xué)的 Andreas Groll 和他的同事給出了一個(gè)答案。
他們使用了一種結(jié)合機(jī)器學(xué)習(xí)和傳統(tǒng)統(tǒng)計(jì)學(xué)的叫做“隨機(jī)森林”(Random Forest) 的算法,來分析最有可能奪冠的球隊(duì)。
隨機(jī)森林算法可以分析大型數(shù)據(jù)集,同時(shí)避免了其他數(shù)據(jù)挖掘算法的缺陷。傳統(tǒng)的數(shù)據(jù)挖掘算法假設(shè)未來事件可以由決策樹決定,該決策樹通過引用一組訓(xùn)練數(shù)據(jù)來計(jì)算每個(gè)分支的結(jié)果。然而,決策樹有一個(gè)問題,即在分支過程的后一階段,由于訓(xùn)練數(shù)據(jù)稀疏,容易產(chǎn)生巨大變化,從而導(dǎo)致決策嚴(yán)重扭曲,產(chǎn)生過度擬合問題。
隨機(jī)森林算法則不同。它不是計(jì)算每個(gè)分支的結(jié)果,而是計(jì)算隨機(jī)分支的結(jié)果,如此計(jì)算多次,每次都有不同的隨機(jī)選擇的分支,最終結(jié)果是所有這些隨機(jī)建構(gòu)的決策樹的平均值。
這種方法有顯著的優(yōu)點(diǎn)。它不存在困擾普通決策樹的過度擬合問題,并且可以顯示關(guān)鍵變量。因此,如果一個(gè)特定的決策樹包含許多參數(shù),很容易看出哪些參數(shù)對結(jié)果的影響最大,而弱變量可以被忽略。
Groll 和他的同事正是用這種方法來模擬 2018 世界杯。他們對球隊(duì)可能進(jìn)行的每一場比賽的結(jié)果進(jìn)行建模,并利用結(jié)果構(gòu)建出最有可能的比賽進(jìn)程。
Groll 和 co 選定了一系列可能決定結(jié)果的潛在因素進(jìn)行建模:一國 GDP 和人口數(shù)、國際足聯(lián)對國家隊(duì)的排名、球隊(duì)本身屬性(比如隊(duì)員平均年齡、擁有的歐冠球員的數(shù)量、是否有主場優(yōu)勢等)。
下圖顯示了球隊(duì)在整個(gè)比賽中的賠率,包括最有可能獲勝的球隊(duì)。根據(jù)研究人員的計(jì)算,西班牙最有可能勝出,概率為 17.8%,略高于德國。
雷鋒網(wǎng)注:AI 預(yù)測的世界杯排名
如果德國隊(duì)在小組賽階段獲勝,在 16 隊(duì)淘汰賽階段更有可能遭遇強(qiáng)敵,算法得出德國進(jìn)入四分之一決賽的幾率為 58%。相比之下,西班牙不太可能在最后的 16 強(qiáng)中面臨強(qiáng)大的對手,因此有 73% 的機(jī)會(huì)進(jìn)入四分之一決賽。
但是!在 Groll 和 co 對整個(gè)比賽進(jìn)行了 10 萬次模擬后發(fā)現(xiàn),在比賽開始的時(shí)候,西班牙機(jī)會(huì)最大,但如果德國打進(jìn)四分之一決賽,冠軍就會(huì)易主。
昨晚想必大家已經(jīng)興奮地看完了第一場比賽,東道主俄羅斯 5-0 完勝沙特阿拉伯,但遺憾的是,根據(jù)他們的預(yù)測,這兩支球隊(duì)都不可能進(jìn)入四分之一決賽。
當(dāng)然,有人對這些預(yù)測持懷疑態(tài)度。由于足球比賽隨機(jī)性太強(qiáng),這種精確的比賽過程在實(shí)際比賽中可能性太小。
此外,他們的機(jī)器學(xué)習(xí)算法顯然沒有預(yù)測到,西班牙會(huì)在球隊(duì)首戰(zhàn)前兩天解雇并更換主教練。
梅西曾經(jīng)說過:“在足球中,如果沒有嚴(yán)謹(jǐn)和精確,才能和優(yōu)雅就沒有意義。”
高盛在編制 2018 年世界杯的預(yù)測時(shí),似乎把他的話放在了心上。
該公司使用機(jī)器學(xué)習(xí)來運(yùn)行 200,000 個(gè)模型,挖掘團(tuán)隊(duì)和個(gè)人球員屬性數(shù)據(jù),以幫助預(yù)測特定的比賽得分。然后,高盛模擬了 100 萬次比賽的變化分析,計(jì)算出每個(gè)球隊(duì)的晉級(jí)概率。
下圖顯示了高盛如何看待世界杯比賽進(jìn)程。每個(gè)國家旁邊的數(shù)字代表該球隊(duì)是否能超過對手,并利用機(jī)器學(xué)習(xí)算法進(jìn)行比賽迭代。
雷鋒網(wǎng)注:高盛預(yù)測圖
以下是高盛得出的關(guān)鍵結(jié)論:
預(yù)計(jì)巴西將以 1.70:1.41 的比分擊敗德國,贏得第六次世界杯冠軍;
盡管法國舉起獎(jiǎng)杯的幾率比德國高,但預(yù)計(jì)在半決賽中與巴西的對決將使其無法贏得冠軍;
英格蘭有望進(jìn)入四分之一決賽階段,高盛表示將輸給德國;
西班牙和阿根廷預(yù)計(jì)將落后,都將在四分之一決賽中失利;
盡管俄羅斯是世界杯主辦國,但預(yù)計(jì)不會(huì)從小組賽中出線;
沙特阿拉伯是黑馬,在小組賽階段會(huì)領(lǐng)先于俄羅斯(顯然已經(jīng)預(yù)測錯(cuò)了)
雷鋒網(wǎng)注:俄羅斯進(jìn)球,普京得意攤手
via: MIT Technology Review ;Business Insider ;Motherboard
相關(guān)文章:
世界杯今晚開波!不光球迷和小龍蝦,中國的移動(dòng)支付也去了俄羅斯
人工智能“世界杯”360奪冠 刷新谷歌微軟保持的“世界記錄”
機(jī)器人世界杯不夠刺激?日本機(jī)器人相撲大賽足以讓你血脈賁張!| 新智造
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。