0
雷鋒網(wǎng) AI 源創(chuàng)評論按:近日在 kaggle 官網(wǎng)上,谷歌云與美國大學(xué)生體育協(xié)會(NCAA)再一次聯(lián)合推出「瘋狂三月」籃球冠軍預(yù)測大賽。
任何開發(fā)者只要能夠通過 AI 來預(yù)測 NCAA「瘋狂三月籃球賽」的冠軍,就有機(jī)會獲得由 Google 提供的$25,000 高額獎金。當(dāng)然,該比賽屬于 Kaggle 上最著名的 Featured 比賽類型,難度可不低。
圖片來源: DiAnte Squire on Unsplash
相信大部分開發(fā)者都對 Kaggle 并不陌生,這是全球頂級的權(quán)威性數(shù)據(jù)科學(xué)競賽平臺,為全世界的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的愛好者、研究者和創(chuàng)業(yè)者提供了公平公正的競賽平臺。
不論你是數(shù)據(jù)科學(xué)小白,還是數(shù)據(jù)科學(xué)高手,在 kaggle 上都可以收獲到自己想要的知識、技巧、經(jīng)驗、榮譽(yù),或是高額獎金。
kaggle 官網(wǎng)主頁
針對基礎(chǔ)入門參賽者,通??梢栽?Started 類型比賽中,學(xué)習(xí)初學(xué)者項目以及積攢經(jīng)驗;而針對高級數(shù)據(jù)科學(xué)玩家,高額獎金的 Featured 類型比賽,或者實驗研究為主的 Research 類型比賽,都是不錯的選擇。
除此之外,想招募合適人才的公司,也可在 kaggle 平臺上發(fā)表需求相關(guān)性強(qiáng)的 Recruitment 類型比賽。當(dāng)然,平臺上也有少量超高難度的 Masters 類型比賽,適合大師級別人物參加。
Kaggle 官網(wǎng)地址:
每年三月,有一項賽事將吸引全世界籃球迷的眼光,那就是 NCAA 的瘋狂三月。NCAA 男子籃球聯(lián)賽分為三個級別,瘋狂三月是 NCAA 男子籃球第一級別聯(lián)賽錦標(biāo)賽,也就是季后賽,采用單場淘汰制。因而結(jié)合其每年在三月進(jìn)行的時間特點,這一比賽獲得了「瘋狂三月」的稱號。
作為如此大型的賽事,比賽最終的冠軍當(dāng)然也是飽受關(guān)注。自 AI 迅速發(fā)展以來,研究學(xué)者們就一直希望能夠通過對大數(shù)據(jù)的科學(xué)分析,在金融、醫(yī)療、股市甚至偶然性極強(qiáng)的競技賽事中獲得準(zhǔn)確的預(yù)測結(jié)果。而谷歌云與 NCAA 聯(lián)合舉辦的「瘋狂三月」籃球冠軍 AI 預(yù)測大賽,也正是希望將數(shù)據(jù)科學(xué)與賽事預(yù)測完美結(jié)合,更好的發(fā)展數(shù)據(jù)科學(xué)領(lǐng)域。
本次比賽要求參賽者具有較高的數(shù)據(jù)科學(xué)研究水平,同時也提供了較高的獎金,屬于 Featured 類型的競賽。比賽分為了兩個階段,在第一階段內(nèi),參賽者可根據(jù)歷史數(shù)據(jù)構(gòu)建和測試模型,這一階段不計入最終得分,截止日期為 3 月 14 日;而進(jìn)入第二階段后,參賽者所提交結(jié)果將計入最終得分,并在 3 月 19 日前(格林尼治標(biāo)準(zhǔn)時間)需提交 2020 賽事最終預(yù)測結(jié)果。當(dāng)然,選手也可跳過一階段直接進(jìn)入二階段。
數(shù)據(jù)分析圖表
但值得注意的是,「瘋狂三月」之所以讓球迷們極度瘋狂,其緊張激烈的淘汰賽制也是其中非常重要的原因之一。不同于常見的淘汰模式,該籃球賽形式采用的是「突然死亡法」——WIN OR GO HOME,也就「一場定勝負(fù)」。因此,即使是 NBA 巨星,如果在一場比賽中表現(xiàn)不佳,同樣會被淘汰出局,徹底無緣冠軍爭奪。正是這樣的賽制,也大大增加了結(jié)果預(yù)測的難度。
不過簡而言之,參與 AI 預(yù)測大賽的獲獎規(guī)則即:參賽者通過出題方給予的訓(xùn)練集(包括:男籃與女籃.CSV 類型的文本數(shù)據(jù)集)建立模型,再利用測試集準(zhǔn)確預(yù)測出本次籃球賽的詳細(xì)結(jié)果。
籃球場建模示例
同時,Kaggle 團(tuán)隊將在「瘋狂三月」整個籃球賽賽中刷新排行榜,最終排名前五參賽者將依次獲得:第一名$ 10,000、第二名$ 7,000、第三名$ 5,000、第四名$ 2,000、第五名$ 1,000 的獎金。
「瘋狂三月」籃球冠軍預(yù)測大賽地址:
https://www.kaggle.com/c/google-cloud-ncaa-march-madness-2020-division-1-mens-tournament
目前,在比賽官網(wǎng)上已陸陸續(xù)續(xù)有一些通用代碼、EDA(電子設(shè)計自動化)以及其它預(yù)測模型相關(guān)的文章發(fā)布,并向數(shù)據(jù)科學(xué)愛好者們提供了解讀。其中,Rmarkdown 向我們詳細(xì)展示了本次大賽介紹、賽前準(zhǔn)備、使用數(shù)據(jù)以及預(yù)測規(guī)則等,而一些在數(shù)據(jù)科學(xué)領(lǐng)域還不夠老練的開發(fā)者,也可以從中獲益良多。
圖片來源:NCAA 官方網(wǎng)站
在過去幾年人工智能還未取得較快發(fā)展的時候,已經(jīng)出現(xiàn)了眾多采用大數(shù)據(jù)分析的方法,來對未來的一些結(jié)果進(jìn)行預(yù)測,包括:股市、賽況、交易等領(lǐng)域,同時取得了較為科學(xué)準(zhǔn)確的結(jié)果。
而現(xiàn)如今人工智能(AI)領(lǐng)域的快速發(fā)展,可以預(yù)見的是,數(shù)據(jù)科學(xué)也將對社會帶來更大的影響,甚至一些學(xué)者認(rèn)為,它將驅(qū)動經(jīng)濟(jì)增長,為改善生活質(zhì)量帶來更多機(jī)會。
盡管我們暫時無法驗證數(shù)據(jù)科學(xué)發(fā)展的最終結(jié)果是好是壞,但對于 AI 預(yù)測這一功能的實力,依舊值得我們重視并加以利用。而這些具有商業(yè)意義的 AI 競賽,更是我們將技術(shù)與理論落地的極佳實踐環(huán)境。在今后的日子里,雷鋒網(wǎng) AI 源創(chuàng)評論也將持續(xù)報道更多相關(guān)賽事,期待你的關(guān)注。
Kaggle 官網(wǎng)詳細(xì)方案解讀:
https://www.kaggle.com/headsortails/jump-shot-to-conclusions-march-madness-eda
雷鋒網(wǎng) AI 源創(chuàng)評論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。