KDD 2018 即將召開，先來一波 Keynote 預(yù)覽

本文作者：叢末

2018-08-20 14:07

專題：KDD 2018

導(dǎo)語：ACM SIGKDD 2018（知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議）將于 8 月 19 日至 23 日在英國倫敦正式召開。

一年一度的 ACM SIGKDD （知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議）今年將于 8 月 19 日至 23 日在英國倫敦召開，屆時，雷鋒網(wǎng) AI 科技評論也將緊密追蹤，并為大家?guī)硪痪€精彩報道。

作為這一會議的最重要的組成部分之一，KDD 今年的 Keynote 邀請了 4 位嘉賓，將分別對數(shù)據(jù)挖掘的應(yīng)用場景和方式、最新進展以及未來發(fā)展趨勢進行解讀。

雷鋒網(wǎng)對本屆 KDD Keynote 嘉賓介紹及演講主題整理如下：

David Hand：倫敦帝國理工大學(xué)數(shù)學(xué)系名譽教授、高級研究員

David Hand 教授是一位高級研究員，也是倫敦帝國理工大學(xué)數(shù)學(xué)系的名譽教授，曾任倫敦帝國理工大學(xué)統(tǒng)計學(xué)院院長。他是英國科學(xué)院院士、英國精算師協(xié)會的榮譽研究員，曾擔(dān)任過兩屆皇家統(tǒng)計學(xué)會主席。此外，他也是英國統(tǒng)計局的非執(zhí)行董事、歐洲統(tǒng)計咨詢委員會成員、加拿大統(tǒng)計科學(xué)研究所國際科學(xué)咨詢委員會成員、劍橋信息數(shù)學(xué)研究所顧問委員會成員。

David Hand 教授已經(jīng)發(fā)表了 300 篇論文、出版了 29 本圖書，涵蓋數(shù)據(jù)挖掘原理、信息生成、測量理論與實踐、不可能性原理以及國家福利等主題。在 2002 年，他被授予皇家統(tǒng)計學(xué)會的 Guy 獎?wù)隆?012 年，他和他的研究小組為信貸業(yè)的貢獻贏得了信用收藏和風(fēng)險獎。2013 年，他又因?qū)ρ芯颗c創(chuàng)新的服務(wù)獲得大英帝國官佐勛章。2016 年，他還被授予 George Box 獎?wù)隆?/p>

主題：數(shù)據(jù)科學(xué)在金融中的應(yīng)用

數(shù)據(jù)科學(xué)在金融中的應(yīng)用為主觀決策到數(shù)據(jù)和事實驅(qū)動決策的轉(zhuǎn)變所帶來的力量提供了一種完美的闡釋。在 50 多年的時間里，整個金融行業(yè)都歷經(jīng)了顛覆性的變革。數(shù)據(jù)科學(xué)的金融應(yīng)用主要集中于三個寬泛的領(lǐng)域：精算和保險、消費金融和金融投資。精算和保險是最早一批采用數(shù)據(jù)科學(xué)理念的工作，在這一概念出現(xiàn)之前，甚至在電腦被發(fā)明出來之前，數(shù)據(jù)就在這一領(lǐng)域得到應(yīng)用。然而現(xiàn)在，最先進的數(shù)據(jù)科學(xué)技術(shù)并沒有在這些領(lǐng)域中得到應(yīng)用，這也意味著現(xiàn)代數(shù)據(jù)分析理念在金融行業(yè)的應(yīng)用具備相當大的潛力。

消費金融被視為數(shù)據(jù)革命中最早也是最成功的案例之一。早在 20 世紀 60 年代第一張信用卡出現(xiàn)的時候，針對客戶在金融交易中產(chǎn)生的龐雜數(shù)據(jù)的分析技術(shù)就極大地推動了數(shù)據(jù)挖掘和數(shù)據(jù)科學(xué)概念的發(fā)展。但如今，新模型類型以及新數(shù)據(jù)來源，正為數(shù)據(jù)科學(xué)的重大發(fā)展帶來諸多機遇。

在金融投資中，經(jīng)典經(jīng)濟學(xué)中的「有效市場假說」認為金融市場具有不可預(yù)測性。這一說法雖然看起來很像真的，但本質(zhì)上還是錯誤的。這意味著使用先進的數(shù)據(jù)分析方法去發(fā)掘傳統(tǒng)理論與實際現(xiàn)狀間的細微差異成為可能。其他的數(shù)據(jù)科學(xué)問題，如數(shù)據(jù)質(zhì)量、道德與安全，以及對模型局限性的了解的需求，在金融應(yīng)用的情境中變得尤其突出。

Alvin E. Roth：諾貝爾經(jīng)濟學(xué)獎獲得者、斯坦福大學(xué)經(jīng)濟學(xué)教授

KDD 2018 即將召開，先來一波 Keynote 預(yù)覽

Alvin E. Roth 是斯坦福大學(xué)的 Craig & Susan McCaw 經(jīng)濟學(xué)教授、哈佛大學(xué)經(jīng)濟學(xué)和工商管理的 Gund 教授。他從事于博弈論、實驗經(jīng)濟學(xué)和市場設(shè)計等領(lǐng)域的研究，并曾與其他人共同獲得了 2012 年諾貝爾經(jīng)濟學(xué)獎。

主題：市場設(shè)計和計算機化市場

交易和集市是歷史悠久的人類活動產(chǎn)物，但近年來，它們變得越來越重要，部分原因為當今市場日益計算機化。而智能手機的出現(xiàn)，也使得它們無處不在。我們可以通過智能手機預(yù)訂前往機場的汽車、抵達倫敦的飛機以及到達后需要住宿的酒店房間。當我們這樣做時，我們留下了一條很容易與其他數(shù)據(jù)流結(jié)合的數(shù)據(jù)軌跡。這不僅改變了我們與市場的互動方式，也改變了我們看待和管理隱私的方式。我將討論計算機化市場的一些最新進展，并推測未來的一些發(fā)展趨勢。

鄭宇懷：牛津大學(xué)統(tǒng)計學(xué)系數(shù)據(jù)機器學(xué)習(xí)教授、DeepMind 研究科學(xué)家

KDD 2018 即將召開，先來一波 Keynote 預(yù)覽

鄭宇懷是牛津大學(xué)統(tǒng)計學(xué)系的統(tǒng)計機器學(xué)習(xí)教授，也是 DeepMind 的研究科學(xué)家。他在多倫多大學(xué)獲得博士學(xué)位（師從 Geoffrey Hinton），在加州大學(xué)伯克利分校（與 Michael Jordan 共事）和新加坡國立大學(xué)（獲得李光耀博士后獎學(xué)金）負責(zé)博士后工作。在來到牛津大學(xué)之前，他曾在加州大學(xué)洛杉磯分校蓋茨比計算神經(jīng)科學(xué)系任講師，也曾任牛津大學(xué)學(xué)院的輔導(dǎo)研究員。

他是 ICML（國際機器學(xué)習(xí)大會）2017 、AISATS(人工智能與統(tǒng)計國際會議) 2010 的 programme co-chair，也曾在 NIPS（神經(jīng)信息處理系統(tǒng)大會）2017 上進行了特邀大會演講。他的研究領(lǐng)域是數(shù)據(jù)和智能的計算基礎(chǔ)，也從事規(guī)?；臋C器學(xué)習(xí)、概率模型、無參數(shù)貝葉斯以及 DeepMind 的研究工作。

主題：面向一些小數(shù)據(jù)問題的大數(shù)據(jù)學(xué)習(xí)

機器學(xué)習(xí)的諸多新進展，都是由可用數(shù)據(jù)在數(shù)量和多樣性方面的爆發(fā)式增長和數(shù)據(jù)處理所使用的大幅增長的計算資源所推動。這就引出了一個問題，即機器學(xué)習(xí)系統(tǒng)是否一定需要大量的數(shù)據(jù)才能順利完成任務(wù)。在元學(xué)習(xí)、終身學(xué)習(xí)、學(xué)會學(xué)習(xí)、多任務(wù)學(xué)習(xí)等問題的研究中，一項重大的新進展便是發(fā)現(xiàn)身邊的數(shù)據(jù)集往往具有異構(gòu)性，并且事實上，一個大數(shù)據(jù)集比每一組都面向不同任務(wù)的很多更小的數(shù)據(jù)集，看上去更具生產(chǎn)力。例如，在推薦系統(tǒng)中，每個用戶都可被當做一組小的相關(guān)數(shù)據(jù)集對應(yīng)的不同任務(wù)，并且 AI 的一個圣杯就是如何開發(fā)從少量數(shù)據(jù)中就能夠快速學(xué)會完成新任務(wù)的系統(tǒng)。

這種情景下，問題就變成了如何利用任務(wù)之間的相似性來「學(xué)會快速學(xué)習(xí)」。實現(xiàn)這個目標的一個視角是，所有的任務(wù)都可以看作是從這個世界中取樣得到的，讓系統(tǒng)完成大量任務(wù)以使其學(xué)到豐富的關(guān)于這個世界的先驗知識，并借助豐富的知識來快速解決未來遇到的新任務(wù)。

這是一個非?；钴S、充滿生機和多樣性的研究領(lǐng)域，最近也有許多不同的研究方法被提出。在本次交流中，我將從概率和 DeepMind 的角度來表達我對這個問題的看法，并介紹我在最近參與的這個方向上的一些努力。

周以真：哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所所長

KDD 2018 即將召開，先來一波 Keynote 預(yù)覽

周以真教授是哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所所長和計算機科學(xué)教授。她是卡耐基梅隆大學(xué)的計算機科學(xué)顧問教授，自 1985 年起就在學(xué)校擔(dān)任教職，曾兩度擔(dān)任計算機科學(xué)系的負責(zé)人。2013-2017 年，她曾擔(dān)任微軟研究院的副總裁。2007-2010 年，她曾擔(dān)任國家科學(xué)基金會計算機與信息科學(xué)與工程理事會的副主任。她獲得了麻省理工學(xué)院的本科、碩士和博士學(xué)位。

她主要研究高可信計算、規(guī)范和驗證，并行和分布式系統(tǒng)，程序設(shè)計語言以及軟件工程等領(lǐng)域的課題。她目前的興趣點是安全和隱私的基礎(chǔ)，高可信人工智能則是她的另一個關(guān)注點。迄今為止，她共曾擔(dān)任 ACM 月刊與 ACM 通訊等 12 個期刊的編委。

她現(xiàn)在還是以下機構(gòu)的成員：醫(yī)學(xué)藍絲帶專家組國家圖書館、美國藝術(shù)與科學(xué)學(xué)院所屬的科學(xué)、工程和技術(shù)咨詢委員會、純粹與應(yīng)用數(shù)學(xué)研究所理事會、數(shù)學(xué)界女性協(xié)會指導(dǎo)委員會、阿里巴巴達摩院技術(shù)咨詢委員會。此外，她還是美國藝術(shù)與科學(xué)院、美國科學(xué)促進協(xié)會、國際計算機協(xié)會（ACM）以及電氣與電子工程師協(xié)會（IEEE）的 Fellow。她曾于 2011 年獲得 CRA 杰出服務(wù)獎，于 2014 年獲得 ACM 杰出服務(wù)獎。

主題：數(shù)據(jù)，為美好

我用「數(shù)據(jù)，為美好」這一口號來表達我們整個數(shù)據(jù)科學(xué)界該如何促進數(shù)據(jù)科學(xué)的發(fā)展，尤其是如何培養(yǎng)未來幾代的數(shù)據(jù)科學(xué)家。

首先，我們應(yīng)該使用數(shù)據(jù)科學(xué)來為人類和社會造福。數(shù)據(jù)科學(xué)應(yīng)該用以改善人們的生活，以及人、組織和機構(gòu)之間的關(guān)系。數(shù)據(jù)科學(xué)在與其他學(xué)科協(xié)作時，應(yīng)該用以幫助解決例如氣候變化、教育、能源、環(huán)境、醫(yī)療保健、不平等以及社會公正等社會層面的巨大挑戰(zhàn)。

其次，我們應(yīng)該以良好的方式使用數(shù)據(jù)。首字母縮寫詞 FATES 可以看做是「good」意義的詳細解釋。Fairness（公正）意味著我們建立的模型可用來做出無偏見的決策或預(yù)測。Accountability（責(zé)任）指的是為機器所做出的的決策，確定和匹配人或物的責(zé)任。Transparency（透明）指向最終用戶保持開放和透明，讓他們了解到例如分類、決策、預(yù)測等結(jié)果是如何得出的。Ethics（倫理）是說需要關(guān)注倫理和隱私保護相關(guān)數(shù)據(jù)的采集和使用，以及我們所建立的自動系統(tǒng)做出的的倫理決策。Safty（安全）和 Security（防護）則是指要確保我們所建立的系統(tǒng)是安全的（沒有任何危害）和防護性的（能抵御惡意行為）。

接下來就請大家關(guān)注雷鋒網(wǎng)對 KDD 的持續(xù)報道吧。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。