丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

GitHub 干貨 | 各大數(shù)據(jù)競賽 Top 解決方案開源匯總

本文作者: 叢末 編輯:汪思穎 2018-11-16 14:40
導(dǎo)語:這是一篇干貨滿滿的匯總文~

AI 科技評論編者按:現(xiàn)在,越來越多的企業(yè)、高校以及學(xué)術(shù)組織機(jī)構(gòu)通過舉辦各種類型的數(shù)據(jù)競賽來「物色」數(shù)據(jù)科學(xué)領(lǐng)域的優(yōu)秀人才,并借此激勵他們?yōu)槟骋粩?shù)據(jù)領(lǐng)域或應(yīng)用場景找到具有突破性意義的方案,也為之后的數(shù)據(jù)研究者留下有價(jià)值的經(jīng)驗(yàn)。

Smilexuhc 在 GitHub 社區(qū)對各大數(shù)據(jù)競賽名列前茅的解決方案進(jìn)行了整理,包括純數(shù)據(jù)競賽、自然語言處理(NLP)領(lǐng)域數(shù)據(jù)賽事的 Top 解決方案。對這些賽事感興趣的小伙伴可以一起來看一下這篇干貨滿滿的匯總貼:

純數(shù)據(jù)競賽

1.2018 科大訊飛 AI 營銷算法大賽

本次大賽要求參賽者基于提供的訊飛 AI 營銷云的海量廣告投放數(shù)據(jù),通過人工智能技術(shù)構(gòu)建來預(yù)測模型預(yù)估用戶的廣告點(diǎn)擊概率。比賽提供了 5 類數(shù)據(jù),包括基礎(chǔ)廣告投放數(shù)據(jù)、廣告素材信息、媒體信息、用戶信息和上下文信息,總共為 1001650 初賽數(shù)據(jù) 和 1998350 條復(fù)賽數(shù)據(jù)(復(fù)賽訓(xùn)練數(shù)據(jù)為:初賽數(shù)據(jù)+復(fù)賽數(shù)據(jù))。

Rank1:https://zhuanlan.zhihu.com/p/47807544

2.2018 IJCAI 阿里媽媽搜索廣告轉(zhuǎn)化預(yù)測

本次比賽要求參賽者以阿里電商廣告為研究對象,基于提供的淘寶平臺的海量真實(shí)交易數(shù)據(jù),通過人工智能技術(shù)構(gòu)建來預(yù)測模型預(yù)估用戶的購買意向。本次比賽為參賽者提供了 5 類數(shù)據(jù),包括基礎(chǔ)數(shù)據(jù)、廣告商品信息、用戶信息、上下文信息和店鋪信息。用于初賽的數(shù)據(jù)包含了若干天的樣本;最后一天的數(shù)據(jù)用于結(jié)果評測,對選手不公布;其余日期的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),提供給參賽選手。

3.2018 騰訊廣告算法大賽

本次算法大賽的題目源自一個基于真實(shí)業(yè)務(wù)場景的廣告技術(shù)產(chǎn)品——騰訊社交廣告 Lookalike 相似人群拓展。本題目要求參賽者基于提供的幾百個種子人群、海量候選人群對應(yīng)的用戶特征,以及種子人群對應(yīng)的廣告特征,構(gòu)建算法準(zhǔn)確標(biāo)定測試集中的用戶是否屬于相應(yīng)的種子包。

出于業(yè)務(wù)數(shù)據(jù)安全保證的考慮,比賽所提供的所有數(shù)據(jù)均為脫敏處理后的數(shù)據(jù)。整個數(shù)據(jù)集分為訓(xùn)練集和測試集:訓(xùn)練集中標(biāo)定了人群中屬于種子包的用戶與不屬于種子包的用戶(即正負(fù)樣本),測試集將檢測參賽選手的算法能否準(zhǔn)確標(biāo)定測試集中的用戶是否屬于相應(yīng)的種子包,訓(xùn)練集和測試集所對應(yīng)的種子包完全一致。初賽和復(fù)賽所提供的種子包除量級有所不同外,其他的設(shè)置均相同。

4.2018 高校大數(shù)據(jù)挑戰(zhàn)賽—快手活躍用戶預(yù)測 

本次大賽要求參賽者基于脫敏和采樣后的數(shù)據(jù)信息,預(yù)測未來一段時間活躍的用戶。參賽隊(duì)伍需要設(shè)計(jì)相應(yīng)的算法進(jìn)行數(shù)據(jù)分析和處理,比賽結(jié)果按照指定的評價(jià)指標(biāo)使用在線評測數(shù)據(jù)進(jìn)行評測和排名。大賽提供的數(shù)據(jù)為脫敏和采樣后用戶行為數(shù)據(jù),日期信息進(jìn)行統(tǒng)一編號,第一天編號為 01,第二天為 02,以此類推,所有文件中列使用 tab 分割。

5.2018JDATA 用戶購買時間預(yù)測

本次大賽要求參賽者基于給定的近 3 個月購買過目標(biāo)商品的用戶以及他們在前一年的瀏覽、購買、評價(jià)等數(shù)據(jù)信息,自行設(shè)計(jì)數(shù)據(jù)處理相關(guān)操作、訓(xùn)練模型,從而預(yù)測未來 1 個月內(nèi)最有可能購買目標(biāo)品類的用戶,并預(yù)測他們在考察時間段內(nèi)的首次購買日期。數(shù)據(jù)主要包括用戶基本信息、SKU 基本信息、用戶行為信息、用戶下單信息及評價(jià)信息。

Rank9:https://zhuanlan.zhihu.com/p/45141799

6.2018 DF 風(fēng)機(jī)葉片開裂預(yù)警

本次大賽要求參賽者基于風(fēng)機(jī) SCADA 實(shí)時數(shù)據(jù),通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、統(tǒng)計(jì)分析等方法建立葉片開裂早期故障檢測模型,對葉片開裂故障進(jìn)行提前告警。比賽提供的數(shù)據(jù)集包括訓(xùn)練集和測試集:訓(xùn)練集一共有 25 類風(fēng)機(jī)共 4 萬個樣本,測試集沒有風(fēng)機(jī)編號,共 8 萬個樣本。

Rank2:https://github.com/SY575/DF-Early-warning-of-the-wind-power-system

7.2018 DF 光伏發(fā)電量預(yù)測

本次大賽要求參賽者在分析光伏發(fā)電原理的基礎(chǔ)上,論證輻照度、光伏板工作溫度等影響光伏輸出功率的因素,通過實(shí)時監(jiān)測的光伏板運(yùn)行狀態(tài)參數(shù)和氣象參數(shù)建立預(yù)測模型,預(yù)估光伏電站瞬時發(fā)電量,并根據(jù)光伏電站 DCS 系統(tǒng)提供的實(shí)際發(fā)電量數(shù)據(jù)進(jìn)行對比分析,驗(yàn)證模型的實(shí)際應(yīng)用價(jià)值。

比賽提供訓(xùn)練集 9000 個點(diǎn),測試集 8000 個,包括光伏板運(yùn)行狀態(tài)參數(shù)(太陽能電池板背板溫度、其組成的光伏陣列的電壓和電流)和氣象參數(shù)(太陽能輻照度、環(huán)境溫濕度、風(fēng)速、風(fēng)向等)。

Rank1:https://zhuanlan.zhihu.com/p/44755488?utm_source=qq&utm_medium=social&utm_oi=623925402599559168 (這一方案也可查看微信文章:《XGBoost+LightGBM+LSTM:一次機(jī)器學(xué)習(xí)比賽中的高分模型方案》https://mp.weixin.qq.com/s/Yix0xVp2SiqaAcuS6Q049g

8.AI 全球挑戰(zhàn)者大賽—違約用戶風(fēng)險(xiǎn)預(yù)測

本次大賽要求參賽者基于馬上金融平臺提供的近 7 萬貸款用戶的基本身份信息、消費(fèi)行為、銀行還款等數(shù)據(jù)信息,建立準(zhǔn)確的風(fēng)險(xiǎn)控制模型,來預(yù)測用戶是否會逾期還款。

Rank1:https://github.com/chenkkkk/User-loan-risk-prediction

9.2016 融 360-用戶貸款風(fēng)險(xiǎn)預(yù)測

本次大賽要求參賽者基于由融 360 與平臺上的金融機(jī)構(gòu)合作的提供近 7 萬貸款用戶的基本身份信息、消費(fèi)行為、銀行還款等數(shù)據(jù)信息,建立準(zhǔn)確的風(fēng)險(xiǎn)控制模型,來預(yù)測用戶是否會逾期還款。

Rank7:https://github.com/hczheng/Rong360

10.2016 CCF-020 優(yōu)惠券使用預(yù)測

本次大賽要求參賽者基于給定的用戶在 2016 年 1 月 1 日至 2016 年 6 月 30 日之間真實(shí)線上線下消費(fèi)行為,預(yù)測用戶在 2016 年 7 月領(lǐng)取優(yōu)惠券后 15 天以內(nèi)是否核銷。比賽評測指標(biāo)采用 AUC,先對每個優(yōu)惠券單獨(dú)計(jì)算核銷預(yù)測的 AUC 值,再對所有優(yōu)惠券的 AUC 值求平均作為最終的評價(jià)標(biāo)準(zhǔn)。

Rank1: https://github.com/wepe/O2O-Coupon-Usage-Forecast

11.2016 CCF-農(nóng)產(chǎn)品價(jià)格預(yù)測

本次大賽要求參賽者基于 2016 年 6 月以前的農(nóng)產(chǎn)品價(jià)格數(shù)據(jù),預(yù)測 7 月的農(nóng)產(chǎn)品價(jià)格。本題目初賽基于全國各農(nóng)場品交易市場的價(jià)格數(shù)據(jù),復(fù)賽則加上天氣等多源數(shù)據(jù)。

Rank2: https://github.com/xing89qs/CCF_Product 

12.2016 CCF-客戶用電異常

國家電網(wǎng)通過對用戶及所屬變壓器進(jìn)行異常監(jiān)測,并通過現(xiàn)場檢修人員根據(jù)異常情況對用戶進(jìn)行抽檢,并反饋檢查結(jié)果,如發(fā)現(xiàn)為竊電用戶,將反饋竊電用戶信息。本賽題要求參賽者通過提供的相關(guān)數(shù)據(jù)與檢查人員檢查結(jié)果,建立竊電檢測模型,識別用戶竊電行為。

Rank4: https://github.com/AbnerYang/2016CCF-StateGrid

13.2016 CCF-搜狗的用戶畫像比賽

本題目初賽時要求參賽者基于給出的 2 萬用戶的百萬級搜索詞,以及經(jīng)過調(diào)查得到的真實(shí)性別、年齡段、學(xué)歷這一訓(xùn)練集,通過機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘技術(shù)構(gòu)建分類算法對另外 2 萬人群的搜索關(guān)鍵詞進(jìn)行分析,并給出其性別、年齡段、學(xué)歷等用戶屬性信息。復(fù)賽時,訓(xùn)練集與測試集規(guī)模均擴(kuò)展至 10 萬用戶。

14.2016 CCF-聯(lián)通的用戶軌跡

精準(zhǔn)營銷是互聯(lián)網(wǎng)營銷和廣告營銷的新方向,特別是在用戶身處特定的地點(diǎn)、商戶,如何根據(jù)用戶畫像進(jìn)行商戶和用戶的匹配,并將相應(yīng)的優(yōu)惠和廣告信息通過不同渠道進(jìn)行推送,成為了很多互聯(lián)網(wǎng)和非互聯(lián)網(wǎng)企業(yè)的新發(fā)展方向。本賽題以其中一個營銷場景為例,要求參賽者基于提供的用戶位置信息、商戶分類與位置信息等數(shù)據(jù),完成用戶畫像的刻畫并進(jìn)行商戶匹配。

RankX: https://github.com/xuguanggen/2016CCF-unicom

15.2016 CCF-Human or Robots

僅 2016 上半年,AdMaster 反作弊解決方案認(rèn)定平均每天能有高達(dá) 28% 的虛假流量,即由機(jī)器人模擬和黑 IP 等手段導(dǎo)致的非人惡意流量。本賽題要求參賽者通過用戶行為日志,自動檢測出這些虛假流量。

Rank6: https://github.com/pickou/ccf_human_or_robot

16.菜鳥-需求預(yù)測與分倉規(guī)劃

本賽題要求參賽者以歷史一年海量買家和賣家的數(shù)據(jù)為依據(jù),預(yù)測某商品在未來二周全國和區(qū)域性需求量。參賽者需要用數(shù)據(jù)挖掘技術(shù)和方法精準(zhǔn)刻畫商品需求的變動規(guī)律,對未來的全國和區(qū)域性需求量進(jìn)行預(yù)測,同時考慮到未來的不確定性對物流成本的影響,做到全局的最優(yōu)化。比賽提供商品從 2014年 10 月 10 日到 2015 年 12 月 27 日的全國和區(qū)域分倉數(shù)據(jù)。

Rank6: https://github.com/wepe/CaiNiao-DemandForecast-StoragePlaning 

Rank10: https://github.com/xing89qs/TianChi_CaiNiao_Season2

自然語言處理(NLP)

1.2018 DC 達(dá)觀-文本智能處理挑戰(zhàn) 

此次比賽要求參賽者基于達(dá)觀數(shù)據(jù)提供的一批長文本數(shù)據(jù)和分類信息,結(jié)合當(dāng)下最先進(jìn)的 NLP 和人工智能技術(shù),深入分析文本內(nèi)在結(jié)構(gòu)和語義信息,構(gòu)建文本分類模型,實(shí)現(xiàn)精準(zhǔn)分類。比賽提供的數(shù)據(jù)包含訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集 2 個 csv 文件。

2. 智能客服問題相似度算法設(shè)計(jì)——第三屆魔鏡杯大賽

本次大賽要求參賽者基于拍拍貸提供的智能客服聊天機(jī)器人真實(shí)數(shù)據(jù),以自然語言處理和文本挖掘技術(shù)為主要探索對象,利用這些資源開發(fā)一種提高智能客服的識別能力和服務(wù)質(zhì)量的算法。

3.2018JD Dialog Challenge 任務(wù)導(dǎo)向型對話系統(tǒng)挑戰(zhàn)賽

本次大賽要求參賽者基于京東用戶與京東人工客服真實(shí)對話數(shù)據(jù)(脫敏后)以及給定的對話數(shù)據(jù)進(jìn)行分析,構(gòu)建端到端的任務(wù)驅(qū)動型多輪對話系統(tǒng),輸出滿足用戶需求的答案——該答案需要能正確、完整且高效地解決問題,為用戶帶來簡單、省心、智能的購物咨詢體驗(yàn)。

Rank3: https://github.com/zengbin93/jddc_solution_4th

4.2018CIKM AnalytiCup – 阿里小蜜機(jī)器人跨語言短文本匹配算法競賽

本次大賽關(guān)注短文本匹配在語言適應(yīng)的問題,源語言為英語,目標(biāo)語言為西班牙語。比賽要求參賽者建立跨語言短文本匹配模型,來提升智能客服機(jī)器人的能力。

另外,Smilexuhc 還為大家提供了兩篇經(jīng)驗(yàn)文章,大家感興趣的話可以一并收藏向前輩們?nèi)∪〗?jīng)。

經(jīng)驗(yàn)文章

Via:https://github.com/Smilexuhc/Data-Competition-TopSolution

此前,雷鋒網(wǎng) AI 科技評論也對一些數(shù)據(jù)競賽進(jìn)行了報(bào)道,感興趣的同學(xué)可以前往閱讀往期報(bào)道:

京東 AI Fashion-Challenge 挑戰(zhàn)賽冠軍方案詳解(風(fēng)格識別+時尚單品搜索):http://www.ozgbdpf.cn/news/201809/LBNzpCx58L98oK7M.html

    ICPR 圖像識別與檢測挑戰(zhàn)賽冠軍方案出爐,基于偏旁部首來識別 Duang 字:http://www.ozgbdpf.cn/news/201808/CkFtca7oz5h2oCp8.html

    KDD Cup 2018 冠軍「 first floor to eat latiao」:為什么取這個隊(duì)名?因?yàn)榇蠹叶紣劾睏l:http://www.ozgbdpf.cn/news/201808/srcNcc3AWQTTJl4z.html

    「2018 機(jī)器閱讀理解技術(shù)競賽」落下帷幕,看奇點(diǎn)機(jī)智如何從 800 多支隊(duì)伍中殺出重圍:http://www.ozgbdpf.cn/news/201805/zB0caxkxv73YF8F9.html

    看阿里 AliOS 神燈團(tuán)隊(duì)在推薦系統(tǒng)上的獨(dú)門秘籍:http://www.ozgbdpf.cn/news/201804/du0koPNyTZwLSb7x.html

    專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì),年內(nèi)會將該算法投入實(shí)用:http://www.ozgbdpf.cn/news/201803/B5qXDGkp5JUrJYWQ.html

    Kaggle 大神 Eureka 的高手進(jìn)階之路:http://www.ozgbdpf.cn/news/201803/QtcJFW9OoDI8CMWA.html

    亞馬遜 Alexa Prize 比賽冠軍團(tuán)隊(duì)專訪:聊天機(jī)器人的突破與創(chuàng)新:http://www.ozgbdpf.cn/news/201801/ySAXM1p2Qhy20vts.html

    KDD Cup 2017雙料冠軍是如何煉成的?我們向Convolution團(tuán)隊(duì)討教了他們的「成功方法論」:http://www.ozgbdpf.cn/news/201708/KVadVGXYYIudv6lr.html

    圖鴨科技 CVPR 2018 圖像壓縮挑戰(zhàn)賽奪冠,獲獎?wù)撐娜庾x:http://www.ozgbdpf.cn/news/201806/sFpN5c4zd0Z0fw32.html 雷鋒網(wǎng)雷鋒網(wǎng)

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

    GitHub 干貨 | 各大數(shù)據(jù)競賽 Top 解決方案開源匯總

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說