0
本文作者: 叢末 | 2018-08-20 14:07 | 專題:KDD 2018 |
一年一度的 ACM SIGKDD (知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議)今年將于 8 月 19 日至 23 日在英國倫敦召開,屆時,雷鋒網(wǎng) AI 科技評論也將緊密追蹤,并為大家?guī)硪痪€精彩報道。
作為這一會議的最重要的組成部分之一,KDD 今年的 Keynote 邀請了 4 位嘉賓,將分別對數(shù)據(jù)挖掘的應(yīng)用場景和方式、最新進(jìn)展以及未來發(fā)展趨勢進(jìn)行解讀。
雷鋒網(wǎng)對本屆 KDD Keynote 嘉賓介紹及演講主題整理如下:
David Hand:倫敦帝國理工大學(xué)數(shù)學(xué)系名譽(yù)教授、高級研究員
David Hand 教授是一位高級研究員,也是倫敦帝國理工大學(xué)數(shù)學(xué)系的名譽(yù)教授,曾任倫敦帝國理工大學(xué)統(tǒng)計學(xué)院院長。他是英國科學(xué)院院士、英國精算師協(xié)會的榮譽(yù)研究員,曾擔(dān)任過兩屆皇家統(tǒng)計學(xué)會主席。此外,他也是英國統(tǒng)計局的非執(zhí)行董事、歐洲統(tǒng)計咨詢委員會成員、加拿大統(tǒng)計科學(xué)研究所國際科學(xué)咨詢委員會成員、劍橋信息數(shù)學(xué)研究所顧問委員會成員。
David Hand 教授已經(jīng)發(fā)表了 300 篇論文、出版了 29 本圖書,涵蓋數(shù)據(jù)挖掘原理、信息生成、測量理論與實踐、不可能性原理以及國家福利等主題。在 2002 年,他被授予皇家統(tǒng)計學(xué)會的 Guy 獎?wù)隆?012 年,他和他的研究小組為信貸業(yè)的貢獻(xiàn)贏得了信用收藏和風(fēng)險獎。2013 年,他又因?qū)ρ芯颗c創(chuàng)新的服務(wù)獲得大英帝國官佐勛章。2016 年,他還被授予 George Box 獎?wù)隆?/p>
主題:數(shù)據(jù)科學(xué)在金融中的應(yīng)用
數(shù)據(jù)科學(xué)在金融中的應(yīng)用為主觀決策到數(shù)據(jù)和事實驅(qū)動決策的轉(zhuǎn)變所帶來的力量提供了一種完美的闡釋。在 50 多年的時間里,整個金融行業(yè)都?xì)v經(jīng)了顛覆性的變革。數(shù)據(jù)科學(xué)的金融應(yīng)用主要集中于三個寬泛的領(lǐng)域:精算和保險、消費(fèi)金融和金融投資。精算和保險是最早一批采用數(shù)據(jù)科學(xué)理念的工作,在這一概念出現(xiàn)之前,甚至在電腦被發(fā)明出來之前,數(shù)據(jù)就在這一領(lǐng)域得到應(yīng)用。然而現(xiàn)在,最先進(jìn)的數(shù)據(jù)科學(xué)技術(shù)并沒有在這些領(lǐng)域中得到應(yīng)用,這也意味著現(xiàn)代數(shù)據(jù)分析理念在金融行業(yè)的應(yīng)用具備相當(dāng)大的潛力。
消費(fèi)金融被視為數(shù)據(jù)革命中最早也是最成功的案例之一。早在 20 世紀(jì) 60 年代第一張信用卡出現(xiàn)的時候,針對客戶在金融交易中產(chǎn)生的龐雜數(shù)據(jù)的分析技術(shù)就極大地推動了數(shù)據(jù)挖掘和數(shù)據(jù)科學(xué)概念的發(fā)展。但如今,新模型類型以及新數(shù)據(jù)來源,正為數(shù)據(jù)科學(xué)的重大發(fā)展帶來諸多機(jī)遇。
在金融投資中,經(jīng)典經(jīng)濟(jì)學(xué)中的「有效市場假說」認(rèn)為金融市場具有不可預(yù)測性。這一說法雖然看起來很像真的,但本質(zhì)上還是錯誤的。這意味著使用先進(jìn)的數(shù)據(jù)分析方法去發(fā)掘傳統(tǒng)理論與實際現(xiàn)狀間的細(xì)微差異成為可能。其他的數(shù)據(jù)科學(xué)問題,如數(shù)據(jù)質(zhì)量、道德與安全,以及對模型局限性的了解的需求,在金融應(yīng)用的情境中變得尤其突出。
Alvin E. Roth:諾貝爾經(jīng)濟(jì)學(xué)獎獲得者、斯坦福大學(xué)經(jīng)濟(jì)學(xué)教授
Alvin E. Roth 是斯坦福大學(xué)的 Craig & Susan McCaw 經(jīng)濟(jì)學(xué)教授、哈佛大學(xué)經(jīng)濟(jì)學(xué)和工商管理的 Gund 教授。他從事于博弈論、實驗經(jīng)濟(jì)學(xué)和市場設(shè)計等領(lǐng)域的研究,并曾與其他人共同獲得了 2012 年諾貝爾經(jīng)濟(jì)學(xué)獎。
主題:市場設(shè)計和計算機(jī)化市場
交易和集市是歷史悠久的人類活動產(chǎn)物,但近年來,它們變得越來越重要,部分原因為當(dāng)今市場日益計算機(jī)化。而智能手機(jī)的出現(xiàn),也使得它們無處不在。我們可以通過智能手機(jī)預(yù)訂前往機(jī)場的汽車、抵達(dá)倫敦的飛機(jī)以及到達(dá)后需要住宿的酒店房間。當(dāng)我們這樣做時,我們留下了一條很容易與其他數(shù)據(jù)流結(jié)合的數(shù)據(jù)軌跡。這不僅改變了我們與市場的互動方式,也改變了我們看待和管理隱私的方式。我將討論計算機(jī)化市場的一些最新進(jìn)展,并推測未來的一些發(fā)展趨勢。
鄭宇懷:牛津大學(xué)統(tǒng)計學(xué)系數(shù)據(jù)機(jī)器學(xué)習(xí)教授、DeepMind 研究科學(xué)家
鄭宇懷是牛津大學(xué)統(tǒng)計學(xué)系的統(tǒng)計機(jī)器學(xué)習(xí)教授,也是 DeepMind 的研究科學(xué)家。他在多倫多大學(xué)獲得博士學(xué)位(師從 Geoffrey Hinton),在加州大學(xué)伯克利分校(與 Michael Jordan 共事)和新加坡國立大學(xué)(獲得李光耀博士后獎學(xué)金)負(fù)責(zé)博士后工作。在來到牛津大學(xué)之前,他曾在加州大學(xué)洛杉磯分校蓋茨比計算神經(jīng)科學(xué)系任講師,也曾任牛津大學(xué)學(xué)院的輔導(dǎo)研究員。
他是 ICML(國際機(jī)器學(xué)習(xí)大會)2017 、AISATS(人工智能與統(tǒng)計國際會議) 2010 的 programme co-chair,也曾在 NIPS(神經(jīng)信息處理系統(tǒng)大會)2017 上進(jìn)行了特邀大會演講。他的研究領(lǐng)域是數(shù)據(jù)和智能的計算基礎(chǔ),也從事規(guī)?;臋C(jī)器學(xué)習(xí)、概率模型、無參數(shù)貝葉斯以及 DeepMind 的研究工作。
主題:面向一些小數(shù)據(jù)問題的大數(shù)據(jù)學(xué)習(xí)
機(jī)器學(xué)習(xí)的諸多新進(jìn)展,都是由可用數(shù)據(jù)在數(shù)量和多樣性方面的爆發(fā)式增長和數(shù)據(jù)處理所使用的大幅增長的計算資源所推動。這就引出了一個問題,即機(jī)器學(xué)習(xí)系統(tǒng)是否一定需要大量的數(shù)據(jù)才能順利完成任務(wù)。在元學(xué)習(xí)、終身學(xué)習(xí)、學(xué)會學(xué)習(xí)、多任務(wù)學(xué)習(xí)等問題的研究中,一項重大的新進(jìn)展便是發(fā)現(xiàn)身邊的數(shù)據(jù)集往往具有異構(gòu)性,并且事實上,一個大數(shù)據(jù)集比每一組都面向不同任務(wù)的很多更小的數(shù)據(jù)集,看上去更具生產(chǎn)力。例如,在推薦系統(tǒng)中,每個用戶都可被當(dāng)做一組小的相關(guān)數(shù)據(jù)集對應(yīng)的不同任務(wù),并且 AI 的一個圣杯就是如何開發(fā)從少量數(shù)據(jù)中就能夠快速學(xué)會完成新任務(wù)的系統(tǒng)。
這種情景下,問題就變成了如何利用任務(wù)之間的相似性來「學(xué)會快速學(xué)習(xí)」。實現(xiàn)這個目標(biāo)的一個視角是,所有的任務(wù)都可以看作是從這個世界中取樣得到的,讓系統(tǒng)完成大量任務(wù)以使其學(xué)到豐富的關(guān)于這個世界的先驗知識,并借助豐富的知識來快速解決未來遇到的新任務(wù)。
這是一個非?;钴S、充滿生機(jī)和多樣性的研究領(lǐng)域,最近也有許多不同的研究方法被提出。在本次交流中,我將從概率和 DeepMind 的角度來表達(dá)我對這個問題的看法,并介紹我在最近參與的這個方向上的一些努力。
周以真:哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所所長
周以真教授是哥倫比亞大學(xué)數(shù)據(jù)科學(xué)研究所所長和計算機(jī)科學(xué)教授。她是卡耐基梅隆大學(xué)的計算機(jī)科學(xué)顧問教授,自 1985 年起就在學(xué)校擔(dān)任教職,曾兩度擔(dān)任計算機(jī)科學(xué)系的負(fù)責(zé)人。2013-2017 年,她曾擔(dān)任微軟研究院的副總裁。2007-2010 年,她曾擔(dān)任國家科學(xué)基金會計算機(jī)與信息科學(xué)與工程理事會的副主任。她獲得了麻省理工學(xué)院的本科、碩士和博士學(xué)位。
她主要研究高可信計算、規(guī)范和驗證,并行和分布式系統(tǒng),程序設(shè)計語言以及軟件工程等領(lǐng)域的課題。她目前的興趣點(diǎn)是安全和隱私的基礎(chǔ),高可信人工智能則是她的另一個關(guān)注點(diǎn)。迄今為止,她共曾擔(dān)任 ACM 月刊與 ACM 通訊等 12 個期刊的編委。
她現(xiàn)在還是以下機(jī)構(gòu)的成員:醫(yī)學(xué)藍(lán)絲帶專家組國家圖書館、美國藝術(shù)與科學(xué)學(xué)院所屬的科學(xué)、工程和技術(shù)咨詢委員會、純粹與應(yīng)用數(shù)學(xué)研究所理事會、數(shù)學(xué)界女性協(xié)會指導(dǎo)委員會、阿里巴巴達(dá)摩院技術(shù)咨詢委員會。此外,她還是美國藝術(shù)與科學(xué)院、美國科學(xué)促進(jìn)協(xié)會、國際計算機(jī)協(xié)會(ACM)以及電氣與電子工程師協(xié)會(IEEE)的 Fellow。她曾于 2011 年獲得 CRA 杰出服務(wù)獎,于 2014 年獲得 ACM 杰出服務(wù)獎。
主題:數(shù)據(jù),為美好
我用「數(shù)據(jù),為美好」這一口號來表達(dá)我們整個數(shù)據(jù)科學(xué)界該如何促進(jìn)數(shù)據(jù)科學(xué)的發(fā)展,尤其是如何培養(yǎng)未來幾代的數(shù)據(jù)科學(xué)家。
首先,我們應(yīng)該使用數(shù)據(jù)科學(xué)來為人類和社會造福。數(shù)據(jù)科學(xué)應(yīng)該用以改善人們的生活,以及人、組織和機(jī)構(gòu)之間的關(guān)系。數(shù)據(jù)科學(xué)在與其他學(xué)科協(xié)作時,應(yīng)該用以幫助解決例如氣候變化、教育、能源、環(huán)境、醫(yī)療保健、不平等以及社會公正等社會層面的巨大挑戰(zhàn)。
其次,我們應(yīng)該以良好的方式使用數(shù)據(jù)。首字母縮寫詞 FATES 可以看做是「good」意義的詳細(xì)解釋。Fairness(公正)意味著我們建立的模型可用來做出無偏見的決策或預(yù)測。Accountability(責(zé)任)指的是為機(jī)器所做出的的決策,確定和匹配人或物的責(zé)任。Transparency(透明)指向最終用戶保持開放和透明,讓他們了解到例如分類、決策、預(yù)測等結(jié)果是如何得出的。Ethics(倫理)是說需要關(guān)注倫理和隱私保護(hù)相關(guān)數(shù)據(jù)的采集和使用,以及我們所建立的自動系統(tǒng)做出的的倫理決策。Safty(安全)和 Security(防護(hù))則是指要確保我們所建立的系統(tǒng)是安全的(沒有任何危害)和防護(hù)性的(能抵御惡意行為)。
接下來就請大家關(guān)注雷鋒網(wǎng)對 KDD 的持續(xù)報道吧。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章