丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給camel
發(fā)送

0

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

本文作者: camel 2019-11-08 12:17
導(dǎo)語:中美瓜分 70%接收論文~

雷鋒網(wǎng)AI科技評論按:數(shù)據(jù)挖掘領(lǐng)域的學(xué)者們在過去的9天里,紛紛相聚在北京國家會議中心。

從11月3日到7日,舉辦了CIKM 2019會議(相關(guān)報道參閱《CIKM投稿數(shù)量1700篇,圖神經(jīng)網(wǎng)絡(luò)成熱門方向,最佳論文紛紛進(jìn)行圖研究》),緊接著從11月8日到11日,在同一地點(diǎn)又繼續(xù)舉辦了數(shù)據(jù)挖掘頂會ICDM 2019 。兩個會議同為CCF列表 B類,其區(qū)別在于前者是ACM舉辦,而后者是IEEE舉辦;此外CIKM覆蓋范圍更廣,包括了數(shù)據(jù)庫、信息檢索和數(shù)據(jù)挖掘三個領(lǐng)域,而ICDM則更為專注數(shù)據(jù)挖掘。

IEEE ICDM 會議首次舉辦于2001年,至今已經(jīng)是第 19屆會議。而作為會議的發(fā)起人、數(shù)據(jù)挖掘領(lǐng)域領(lǐng)軍人物吳信東教授則從會議之初一路相隨,ICDM國際會議舉辦地輾轉(zhuǎn)十個國家之后終于來到中國,而吳信東也當(dāng)之無愧與Granada大學(xué)的Francisco Herrera共同擔(dān)任大會主席,大會的組織則由清華大學(xué)和吳信東擔(dān)任科學(xué)院院長的明略科技共同承辦。

本次會議共包含了 3 個主旨報告,3 個 tutorial, 6 個特邀工業(yè)報告,1 個關(guān)于“營銷智能”的 pannel 以及 34 個 session。

一、投稿分析

ICDM從誕生之日起便以錄取率低著稱,今年也不例外。ICDM 2019 共收到來自56個國家和地區(qū)的1046篇投稿,而僅有95篇(9.1%)被錄為regular papers,在此之外還錄用了99篇的short papers,才把總錄取率提升到18.5%。需要提及的是這1046篇投稿中有2/3的論文第一作者都是學(xué)生,且今年是ICDM接收論文數(shù)量首次突破一千(去年為948篇)。

注:short paper 指一些篇幅比較短(一般是4頁以下),內(nèi)容比較少但是具有一定的原創(chuàng)型和新穎性的文章。regular paper(長文章)是指內(nèi)容充實(shí),研究比較完整,分析比較充分的文章,文章的篇幅比較長,一般都在10頁左右,甚至更長。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

當(dāng)然組委會也以國籍對投稿論文做了分析,其中40.95%的來自中國,而有25.31%的來自美國,其次則是澳、日、德、印、加等國家。國內(nèi)投稿如此多的原因,一是中國各高校和研究單位在數(shù)據(jù)挖掘領(lǐng)域本身就比較強(qiáng);二是會議在國內(nèi)開,中國的師生投稿和參會的成本相對較低,而美國的學(xué)者則更愿意去投SIGKDD等會議。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

不過,從錄取率來看,來自中國的論文平均錄取率只有17.5%,相比美國的23.2%、澳大利亞的27.8%以及日本的29.03%則有不小的距離。這說明啥?離家近了,投稿的膽子也變大了。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

最終中國還是勝在了基數(shù)大。據(jù)吳信東教授介紹,在所有錄取的194篇文章中,其中有74篇來自中國,62篇來自美國;也即有70%的錄用文章是被中美兩國所瓜分。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

根據(jù)錄用時的平均最高分以及組織會的投票選擇,本次會議的最佳論文獎獲得者授予給了來自GeorgeMason大學(xué)的Xiaojie Guo,Liang Zhao等人,而最佳學(xué)生論文獎則由Michigan大學(xué)的Mark Heimann等人摘取。補(bǔ)充一點(diǎn),本次會議還授予了研究貢獻(xiàn)獎、10年最具影響力獎、李濤獎。研究貢獻(xiàn)獎的獲得者是來自斯坦福大學(xué)的JureLeskovec教授,他也是ICDM 2010最佳應(yīng)用論文獎的獲得者;而獲得10年最具影響力獎的論文是由 Steffen Rendle發(fā)表在2010年的論文(Factorization Machines ICDM’10, pp.995-1000);李濤獎是為了紀(jì)念數(shù)據(jù)挖掘領(lǐng)域著名學(xué)者李濤,該獎項(xiàng)于去年設(shè)立,今年的獲獎?wù)邽閁IUC的華人學(xué)者Hanghang Tong。

對于投稿分析還有一個比較重要的便是話題分析,組委會對不同的領(lǐng)域投稿做了排序。從下圖可以看出“在傳統(tǒng)領(lǐng)域?qū)π聰?shù)據(jù)進(jìn)行挖掘的算法”和“網(wǎng)絡(luò)環(huán)境的挖掘和關(guān)聯(lián)分析”兩年連續(xù)霸榜,其他則都稍有變動,這種分析在一定程度上也反映了數(shù)據(jù)挖掘領(lǐng)域的主流和新趨勢:主流的依舊是主流,新趨勢則在上升或下降。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

投稿中,尤為關(guān)鍵的一個角色便是審稿人,審稿人的喜好也決定了論文的錄取情況。組委會為了分析本年度審稿人的喜好,也嘗試了對標(biāo)題詞進(jìn)行分析,計算方式如下所示:

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

分析結(jié)果如下圖:

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

可以看出標(biāo)題中帶有 adversarial、dynamic、alignment、feature、generation等詞匯時論文更容易被錄取,而標(biāo)題中帶有 deep 、based、model、prediction、detection等詞匯的論文杯具的概率就比較大了,特別是帶有based的論文杯具率達(dá)90.79%。你能從這個標(biāo)題詞匯正、負(fù)率中推測出審稿人的喜好是什么嗎?

那么我們再來一張?jiān)~云吧:

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

真的是成也學(xué)習(xí),敗也學(xué)習(xí)!

二、主旨報告

本次大會邀請了數(shù)據(jù)挖掘的巨擘UIUC的韓家煒教授、IBM研究院的Ronald Fagin以及康奈爾大學(xué)的Joseph Halpern做大會主旨報告。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

韓家煒的報道主題是Embedding-Based Text Mining: AFrontier in Data Mining。雷鋒網(wǎng)對韓家煒以往的研究已經(jīng)做過詳細(xì)的報道;而Embedding則是韓家煒近來研究的一個重要方向,在CIKM和ICDM兩場會議中,韓教授都詳細(xì)介紹過他們實(shí)驗(yàn)室近來在Embedding方面所做的工作《Spherical Text Embedding》,且相應(yīng)的工作已經(jīng)發(fā)表在NeurIPS 2019。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

比較有意思的是,據(jù)他的學(xué)生透露,這篇文章是韓家煒教授本年度最喜歡的一篇工作,但很不幸在最初投稿時卻被拒了,因?yàn)闆]有和最近的顯學(xué)BERT進(jìn)行比較;隨后韓家煒等人做了比較,充分證明并分析了BERT在詞相似等任務(wù)中確實(shí)不如Embedding,如下圖所示:

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

讓筆者感到極為佩服的是,作為數(shù)據(jù)挖掘領(lǐng)域的泰斗,從3日的CIKM一直到11日的ICDM結(jié)束,韓家煒教授每天都會去會場參會,讓吾等去一天休三天的年輕人汗顏。

Ronald Fagin是IBMFellow(這個Fellow是IBM的最高榮譽(yù),現(xiàn)在全世界范圍內(nèi)也就100位,這可是從IBM 在全世界40萬雇員中選出的哦,而且整個歷史上總共也就大約250名)。 

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

Ronald老先生笑起來很魔性
 

他在ICDM上的演講主題為“Applyingtheory of data to practice”,具體來講就是講了兩個IBM的研究案例。第一個是Top k問題的算法研究,Ronald在報告中提供了一種最優(yōu)算法,只需要10行就可以解決這個問題;這個算法也獲得了2014年的哥德爾獎(理論計算機(jī)科學(xué)中的最高獎),這個問題是由實(shí)踐中逐漸提出的,最終卻獲得了理論界的最高獎項(xiàng)。第二個則是從理論層面提出的問題,即數(shù)據(jù)交換,本質(zhì)上來說就是將數(shù)據(jù)從一種格式轉(zhuǎn)換為另一種格式,但其中實(shí)踐上的復(fù)雜的問題卻讓數(shù)據(jù)交換成為一個新的子領(lǐng)域,甚至有專門的會議。Ronald在這里想要強(qiáng)調(diào)的就是:理論家一定要和實(shí)踐家共同起來工作,反之亦然,這樣兩種類型的學(xué)者共同受益??的螤柎髮W(xué)的Joseph Halpern演講的非常理論,主題為“Actual Causality”。事件C“實(shí)際引起”事件E是什么意思?這是Joseph提出的問題。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

一看Joseph就是個哲學(xué)家

在報告中,Joseph分析了自亞里士多德、休謨等哲學(xué)家對因果關(guān)系的分析,他認(rèn)為許多定義都是根據(jù)反事實(shí)提出的。(如果C沒有發(fā)生,那么C就是E的原因,那么E就不會發(fā)生。)2001年 Joseph等人提出了一種新的實(shí)際原因定義,使用結(jié)構(gòu)方程概念對事實(shí)進(jìn)行建模。由于內(nèi)容太過抽象,筆者在此就不再詳細(xì)介紹,對此感興趣的讀者可以在「AI科技評論」微信公眾號回復(fù)「Joseph」查看PPT照片。

值得一提的是,在本次會議中幾位贊助商也獲得了工業(yè)報告的機(jī)會。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

明略科技在吳信東的帶領(lǐng)下,目前對知識圖譜做的非常深入,徐凱波博士對明略科技的圖挖掘技術(shù)在公共安全中的應(yīng)用做了介紹。

葉杰平是滴滴人工智能實(shí)驗(yàn)室負(fù)責(zé)人,滴滴出行副總裁,他在報告中講述了滴滴出行在交通中如何應(yīng)用人工智能。

百度研究院資深研究員熊昊一博士講述了如何使用百度的AutoDL來實(shí)現(xiàn)AI的工業(yè)化。值得一提的最近百度剛剛發(fā)布了最新版的飛槳(PaddlePaddle)框架,而AutoDL正是飛槳里面重要的一個模塊。

南京財經(jīng)大學(xué)信息工程學(xué)院的曹杰教授講述了從線上、線下融合的實(shí)用數(shù)據(jù)管理和商業(yè)智能的解決方案研究。

來自LinkedIn 的李子博士,介紹了LinkedIn大規(guī)模適應(yīng)端到端的機(jī)器學(xué)習(xí)。他們在LinkedIn上啟動了一個名為“生產(chǎn)機(jī)器學(xué)習(xí)”(簡稱“ Pro-ML”)的程序。Pro-ML使機(jī)器學(xué)習(xí)工程師的效率提高一倍,同時向來自LinkedIn堆棧的工程師開放AI和建模工具。

同盾科技副總裁、人工智能研究院院長李曉林講述了他們的聯(lián)邦學(xué)習(xí)框架(iBond),以及如何用iBond來把數(shù)據(jù)孤島連接起來,同時能夠保護(hù)數(shù)據(jù)隱私。


三、最佳論文

本次會議的最佳論文獎獲得者授予給了來自George Mason大學(xué)的Xiaojie Guo,Liang Zhao等人,而最佳學(xué)生論文獎則由Michigan大學(xué)的Mark Heimann等人摘取。

1、最佳論文獎

標(biāo)題:Deep Multi-attributed Graph Translation with Node-Edge Co-evolution

論文鏈接:http://mason.gmu.edu/~lzhao9/materials/papers/ICDM_2019_NEC_DGT-final.pdf

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

摘要:圖翻譯是將圖像和語言翻譯結(jié)合起來的一項(xiàng)研究,其目的是通過限制源域中的輸入圖來在目標(biāo)域中生成圖。最近,這個話題引起了越來越多的關(guān)注。但現(xiàn)有的工作僅限于預(yù)測具有固定拓?fù)鋱D的節(jié)點(diǎn)屬性,或者僅在不考慮節(jié)點(diǎn)屬性的情況下僅預(yù)測圖拓?fù)洌捎诖嬖诰薮筇魬?zhàn),因此無法同時預(yù)測它們的兩者:1)難以描述交互式,迭代式,節(jié)點(diǎn)和邊緣的異步轉(zhuǎn)換過程;2)難以發(fā)現(xiàn)和保持預(yù)測圖中節(jié)點(diǎn)和邊緣之間的固有一致性。這些挑戰(zhàn)阻止了用于聯(lián)合節(jié)點(diǎn)和邊緣屬性預(yù)測的通用端到端框架,這是對現(xiàn)實(shí)世界應(yīng)用程序的需求,例如物聯(lián)網(wǎng)網(wǎng)絡(luò)中的惡意軟件限制以及結(jié)構(gòu)到功能的網(wǎng)絡(luò)轉(zhuǎn)換。這些實(shí)際應(yīng)用高度依賴于手工制作和臨時啟發(fā)式模型,但無法充分利用大量的歷史數(shù)據(jù)。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

在這篇論文中,作者將此通用問題稱為“多屬性圖轉(zhuǎn)換”,并開發(fā)了一種無縫集成節(jié)點(diǎn)和邊緣轉(zhuǎn)換的新穎框架。這里的邊緣轉(zhuǎn)換路徑是通用的,這被證明是對現(xiàn)有拓?fù)滢D(zhuǎn)換模型的概括。然后,提出了一種基于我們的非參數(shù)圖拉普拉斯算子的頻譜圖正則化方法,以學(xué)習(xí)和保持預(yù)測節(jié)點(diǎn)和邊緣的一致性。最后,作者對合成和實(shí)際應(yīng)用數(shù)據(jù)進(jìn)行的大量實(shí)驗(yàn)證明了該方法的有效性。

2、最佳學(xué)生論文獎

標(biāo)題:Distribution of Node Embeddings asMultiresolution Features for Graphs

論文鏈接:https://markheimann.github.io/papers/19ICDM_RGM.pdf

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

摘要:從生物信息學(xué)、神經(jīng)科學(xué)到計算機(jī)視覺和社交網(wǎng)絡(luò)分析,圖分類是許多領(lǐng)域的重要問題。也就是說,為了圖形分類的目的而比較圖形的任務(wù)面臨著幾個主要挑戰(zhàn)。特別是,有效的圖比較方法必須(1)在表達(dá)上和歸納上比較圖;(2)有效地比較大圖;(3)使用快速機(jī)器學(xué)習(xí)模型進(jìn)行圖分類。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

為了解決這些挑戰(zhàn),作者提出了隨機(jī)網(wǎng)格映射(RGM),這是一種快速計算的特征圖,通過其節(jié)點(diǎn)嵌入在特征空間中的分布來表示圖。作者通過與內(nèi)核方法的緊密聯(lián)系來證明RGM的合理性:RGM可證明地近似拉普拉斯內(nèi)核均值圖,并且具有金字塔匹配內(nèi)核的多分辨率特性。

作者還表明,可以使用Weisfeiler-Lehman框架將RGM擴(kuò)展為合并節(jié)點(diǎn)標(biāo)簽。大量實(shí)驗(yàn)表明,使用RGM特征圖進(jìn)行圖分類的準(zhǔn)確性優(yōu)于或優(yōu)于許多強(qiáng)大的圖核,無監(jiān)督圖特征圖和深度神經(jīng)網(wǎng)絡(luò)。此外,在保持高分類精度的同時,將基于其節(jié)點(diǎn)嵌入的圖與RGM進(jìn)行比較的速度比競爭基準(zhǔn)快一個數(shù)量級。

One more thing

明年ICDM的舉辦地:意大利的Sorrento——

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

雷鋒網(wǎng)報道。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

投稿一千,錄用「百」篇,數(shù)據(jù)挖掘頂會ICDM 2019頂會反映了哪些研究趨勢?

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說