0
本文作者: 張夢(mèng)華 | 2020-04-05 10:47 | 專題:KDD 2019 |
全球疫情嚴(yán)峻,各類賽事、會(huì)議能取消則取消,不取消的也紛紛改為線上進(jìn)行,但學(xué)術(shù)頂會(huì)的步伐卻未因此受阻。近日,ACM SIGKDD 公布了 KDD Cup 2020( 國(guó)際知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘競(jìng)賽)的賽事安排。
KDD Cup 2020 將延續(xù) 2019 年的三個(gè)賽道:常規(guī)機(jī)器學(xué)習(xí)賽道、自動(dòng)化機(jī)器學(xué)習(xí)賽道、強(qiáng)化學(xué)習(xí)賽道,阿里、Biendata 分別主辦了常規(guī)機(jī)器學(xué)習(xí)賽道的賽道一和賽道二,第四范式、滴滴則分別主辦了后兩個(gè)賽道,而第四范式也是連續(xù)第二年主辦自動(dòng)化機(jī)器學(xué)習(xí)賽道。所有的比賽都將在 3 月-4 月進(jìn)行,獎(jiǎng)金池更是達(dá)到了 12 萬美金。
本次 KDD Cup 主席團(tuán)中也有著兩張華人面孔:清華計(jì)算機(jī)系教授唐杰和滴滴技術(shù)副總裁葉杰平。唐杰曾任 KDD 2018 大會(huì)副主席,并獲得當(dāng)年的杰出貢獻(xiàn)獎(jiǎng);葉杰平則從 2005 開始便成為 KDD 的???,并在 2013 年獲得 KDD 最佳論文獎(jiǎng),而其和學(xué)生在 KDD 中過的論文總數(shù)超過 60 篇。
同時(shí),ACM SIGKDD 和 KDD 2020 組委會(huì)也表示,將以參會(huì)者和志愿者的健康、安全為首要考慮,在現(xiàn)行慣例之外,采取有效措施,根據(jù)疫情變化,探索可用方案,以保證賽事的有序進(jìn)行。
KDD Cup 2020 賽項(xiàng)
? 常規(guī)機(jī)器學(xué)習(xí)賽道(ML 賽道 1) 「現(xiàn)代電子商務(wù)平臺(tái)挑戰(zhàn)賽」(于 2020 年 3 月 30 日開放)
? 常規(guī)機(jī)器學(xué)習(xí)賽道(ML 賽道 2) 「圖片對(duì)抗性攻防」(于 2020 年 4 月 15 日開放)
? 自動(dòng)化機(jī)器學(xué)習(xí)賽道(AutoML 賽道) 「用于圖表示學(xué)習(xí)的 AutoML」(于 2020 年 3 月 30 日開放)
? 強(qiáng)化學(xué)習(xí)競(jìng)賽賽道(RL 賽道) 「學(xué)習(xí)按需移動(dòng)平臺(tái)上的調(diào)度和重定位」(2020 年 4 月 2 日開放)
常規(guī)機(jī)器學(xué)習(xí)賽道(ML 賽道 1)
賽道關(guān)鍵字:學(xué)習(xí)表示,遷移學(xué)習(xí),圖像、視頻和文本處理
平臺(tái):天池
總獎(jiǎng)金: 40,000 美元
報(bào)名時(shí)間:UTC 2020 年 3 月 30 日至 2020 年 4 月 27 日。UTC 2020 年 4 月 27 日晚上 11:59 將關(guān)閉報(bào)名入口,并禁止換隊(duì)。
任務(wù)及評(píng)審標(biāo)準(zhǔn):ML Track 1「現(xiàn)代電子商務(wù)平臺(tái)挑戰(zhàn)」賽項(xiàng),要求參賽者通過考慮不同類型的復(fù)雜信息和模式之間的緊密聯(lián)系,學(xué)習(xí)高質(zhì)量的跨模式表達(dá);然后,學(xué)習(xí)表示可用于計(jì)算表示之間的相似度得分,并選擇與文本相關(guān)的圖像/視頻;最后,每一次提交都將在測(cè)試數(shù)據(jù)集上進(jìn)行評(píng)估,該數(shù)據(jù)集評(píng)估檢索到的產(chǎn)品與事實(shí)之間的對(duì)應(yīng)關(guān)系。
此賽項(xiàng)有兩個(gè)分任務(wù),任務(wù) 1 主題為「召回多模式實(shí)體」。
參賽者需要設(shè)計(jì)一個(gè)模型框架,以促進(jìn)對(duì)圖像和視頻的有效語義理解、搜索和檢索,以便召回具有適當(dāng)多模態(tài)內(nèi)容的產(chǎn)品并對(duì)其進(jìn)行排名,從而幫助消費(fèi)者做出更好的決策。
召回多模式實(shí)體賽項(xiàng)詳情:
https://tianchi.aliyun.com/competition/entrance/231786/introduction?spm=5176.12281949.1003.4.2926539dVvsnc8
任務(wù) 2 主題為「消除偏見」。
由于指定目標(biāo)(例如 ctr,cvr 或 gmv)帶來的算法偏見,將導(dǎo)致機(jī)器學(xué)習(xí)推薦系統(tǒng)產(chǎn)生嚴(yán)重的馬太效應(yīng),用戶將搜到曝光率更高的商品,從而導(dǎo)致推薦的不公平。因此,了解系統(tǒng)是否公平是至關(guān)重要的,也即「消除偏見」。
消除偏見賽項(xiàng)詳情:
https://tianchi.aliyun.com/competition/entrance/231785/introduction?spm=5176.12281949.1003.5.2926539dVvsnc8
常規(guī)機(jī)器學(xué)習(xí)賽道(ML 賽道 2)
賽項(xiàng)關(guān)鍵詞:生成對(duì)抗網(wǎng)絡(luò)(GAN),圖結(jié)構(gòu)數(shù)據(jù),圖嵌入
總獎(jiǎng)金: 19,000 美元
平臺(tái): Biendata
任務(wù)及評(píng)審標(biāo)準(zhǔn):ML 賽道 2 「圖片對(duì)抗性攻防」賽項(xiàng)分為兩個(gè)階段。
在第一階段,將為所有團(tuán)隊(duì)提供一個(gè)圖形數(shù)據(jù)集,然后要求參賽者以作為一種攻擊形式,提交該數(shù)據(jù)集的修改版本,修改后的數(shù)據(jù)看起來應(yīng)與原始圖「相似」,但在競(jìng)賽系統(tǒng)后端準(zhǔn)備并保存的基準(zhǔn)模型下分類精度較低。
在第二階段中,所有團(tuán)隊(duì)都必須提交攻擊模型和防御模型,塞方將發(fā)布相似但不相同的圖形數(shù)據(jù)集。攻擊模型是一種算法,可以讀取圖形和防御模型,并根據(jù)這兩個(gè)輸入來修改圖形。防御模型是對(duì)圖進(jìn)行穩(wěn)健分類的模型。
評(píng)審標(biāo)準(zhǔn):然后賽方將匹配所有團(tuán)隊(duì)的所有進(jìn)攻模型和防守模型。在每次比賽中,攻擊模型將首先修改圖,而防御模型則將修改后的圖分類,比賽系統(tǒng)將記錄每次比賽的準(zhǔn)確性。最后,每支球隊(duì)都會(huì)獲得兩個(gè)模型的準(zhǔn)確性報(bào)告,然后以此作為排名依據(jù)。
ML 賽項(xiàng) 2 詳情地址:
https://biendata.com/competition/kddcup_2020/
自動(dòng)化機(jī)器學(xué)習(xí)賽道(AutoML 賽道)
賽項(xiàng)關(guān)鍵字:圖表示學(xué)習(xí),圖結(jié)構(gòu)化數(shù)據(jù),圖嵌入,AutoML
總獎(jiǎng)金: 33,500 美元
平臺(tái): CodaLab
任務(wù)及評(píng)審標(biāo)準(zhǔn):AutoML 軌道「用于圖表示學(xué)習(xí)的 AutoML」是有史以來第一個(gè)應(yīng)用于圖結(jié)構(gòu)數(shù)據(jù)的 AutoML 挑戰(zhàn)。
在這一挑戰(zhàn)中,參賽者被要求搭建用于圖表示學(xué)習(xí)的 AutoML 解決方案,以自主地繪制圖形表示學(xué)習(xí)問題(無需任何人工干預(yù)),其中節(jié)點(diǎn)選擇分類作為評(píng)估學(xué)習(xí)表示質(zhì)量的任務(wù)。
每個(gè)團(tuán)隊(duì)都有三個(gè)公共數(shù)據(jù)集來開發(fā) AutoML 解決方案,并提供六個(gè)反饋數(shù)據(jù)集,以使參與者能夠評(píng)估他們的解決方案。這些解決方案將在沒有人工干預(yù)的情況下使用六個(gè)看不見的數(shù)據(jù)集進(jìn)行評(píng)估,優(yōu)勝者將根據(jù)數(shù)據(jù)集的最終排名進(jìn)行選擇。
AutoML 賽項(xiàng)詳情地址:
https://www.automl.ai/competitions/3
強(qiáng)化學(xué)習(xí)比賽賽道(RL 賽道)
賽道關(guān)鍵字:強(qiáng)化學(xué)習(xí),按需機(jī)動(dòng)性,車輛重定位
總獎(jiǎng)金: 30,000 美元
平臺(tái): CodaLab
任務(wù)及評(píng)審標(biāo)準(zhǔn):RL 軌道「學(xué)習(xí)按需移動(dòng)平臺(tái)上的調(diào)度和重定位」賽項(xiàng)要求:參與者應(yīng)用機(jī)器學(xué)習(xí)工具來確定新穎的解決方案,重點(diǎn)考察點(diǎn)為如何應(yīng)用機(jī)器學(xué)習(xí)解決方案來提高 MoD 平臺(tái)的效率。
其中包含了 2 個(gè)任務(wù),即按需移動(dòng)(MoD)平臺(tái)上的訂單分派(訂單匹配)和車輛重定位(車隊(duì)管理)。
任務(wù) 1 訂單分派要求團(tuán)隊(duì)開發(fā)一種算法,實(shí)現(xiàn)在兩秒鐘的調(diào)度窗口內(nèi)確定訂單驅(qū)動(dòng)程序分配。其中,未完成的訂單(行程請(qǐng)求)和可用的驅(qū)動(dòng)程序需要在窗口中進(jìn)行批處理,它們的狀態(tài)信息將傳遞到訂單調(diào)度算法中。
在整個(gè)模擬中,將為每個(gè)調(diào)度窗口重復(fù)調(diào)用此模塊。評(píng)估模擬將運(yùn)行多天,從中計(jì)算出平均駕駛員總收入,以此作為算法的得分。
任務(wù) 2 車輛重新定位要求團(tuán)隊(duì)為預(yù)選的小型車輛開發(fā)一種重新定位算法。對(duì)于這些車輛中的任何一個(gè),如果連續(xù)怠速時(shí)間超過 L = 5 分鐘的閾值,則該車輛可以重新定位。
環(huán)境會(huì)定期將所選組中所有合格車輛的狀態(tài)信息發(fā)送到重新定位算法,該算法指示駕駛員駛向特定目的地。模擬期間,參賽算法的平均個(gè)人收入率,被計(jì)算為該算法的分?jǐn)?shù)。
這些算法將在團(tuán)隊(duì)無法訪問的模擬環(huán)境中進(jìn)行評(píng)估,除了環(huán)境所產(chǎn)生的分?jǐn)?shù)之外。參與團(tuán)隊(duì)可以選擇開發(fā)一種或兩種算法。
RL 賽道詳情地址:
https://outreach.didichuxing.com/competition/kddcup2020/
KDD Cup:數(shù)據(jù)挖掘的世界杯
KDD Cup 由美國(guó)計(jì)算機(jī)協(xié)會(huì)知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘?qū)N瘯?huì)(ACM SIGKDD)發(fā)起,被稱為數(shù)據(jù)挖掘的世界杯,是該領(lǐng)域水平最高、影響力最大的頂級(jí)賽事。該比賽同時(shí)面向企業(yè)界和學(xué)術(shù)界,從 1997 年開始,每年舉辦一次,吸引了世界數(shù)據(jù)挖掘界的頂尖專家、學(xué)者、工程師前來參賽。
此外,KDD Cup 可以說是華人的主場(chǎng)。
2005 年楊強(qiáng)(右二) KDD Cup 奪冠照片
最早,2004、2005年,香港科技大學(xué)教授、IEEE Fellow 楊強(qiáng)曾帶領(lǐng)其團(tuán)隊(duì)連續(xù)兩年拿下 KDD Cup 比賽冠軍。到了 2017 年,中國(guó)隊(duì)伍幾乎包攬了 KDD Cup 的所有獎(jiǎng)項(xiàng)。
KDD Cup 強(qiáng)調(diào)應(yīng)用,前期的承辦者多為高校,近十年則越來越多由企業(yè)贊助。與此同時(shí),中國(guó)企業(yè)的出鏡率也越來越高。KDD Cup 2017 便曾由阿里云承辦,百度、第四范式也贏得過 KDD Cup 2019 的主辦權(quán)。
2019 年,KDD Cup 有了獨(dú)立的議程,并首次設(shè)立 3 個(gè)賽道:Regular ML(常規(guī)機(jī)器學(xué)習(xí))、Auto-ML(自動(dòng)化機(jī)器學(xué)習(xí))、Humanity RL(強(qiáng)化學(xué)習(xí)),其中強(qiáng)化學(xué)習(xí)的賽道為首次設(shè)立。三個(gè)賽道的冠軍分別被螞蟻金服和日本的 NTT DOCOMO 公司、深蘭科技和北京大學(xué)團(tuán)隊(duì)、國(guó)立成功大學(xué)拿下。
雷鋒網(wǎng).雷鋒網(wǎng).雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章