0
本文作者: 叢末 | 2019-07-20 10:21 |
雷鋒網(wǎng) AI 科技評論按:今年,IJCAI(國際人工智能聯(lián)合會議,International Joint Conferences on Artificial Intelligence)將于 8 月 10 日至 16 日在中國澳門隆重召開。隨著會議臨近,特邀報告(Invited Talks)、 教學(xué)講座(Tutorial)和主題研討會(Workshop)等重要議程也相繼出爐。
「聯(lián)邦學(xué)習(xí)」作為當(dāng)前人工智能領(lǐng)域一個有「異軍突起」之勢的研究方向,自今年剛提出這一概念時的「冷門」,到如今正式進(jìn)入國際標(biāo)準(zhǔn)流程,無論是學(xué)術(shù)界還是工業(yè)界,都對這一研究方向顯露出了較高的熱情。
雷鋒網(wǎng) AI 科技評論注意到,國內(nèi)「聯(lián)邦學(xué)習(xí)」研究先行者楊強教授將在今年 IJCAI 會議上主導(dǎo)舉辦以「聯(lián)邦學(xué)習(xí)」主題的 Workshop(Federated Machine Learning for User Privacy and Data Confidentiality),供在該課題上做出成果的學(xué)者們發(fā)表和介紹自己的論文,同時也為在場同一個研究方向的學(xué)者們提供一個交流的平臺。
雷鋒網(wǎng) AI 科技評論對該主題研討會的負(fù)責(zé)人微眾銀行人工智能部高級研究員劉洋進(jìn)行了專訪,聊了聊本次在 IJCAI 2019 上舉辦「聯(lián)邦學(xué)習(xí)」Workshop 的出發(fā)點和期待,也聊了聊聯(lián)邦學(xué)習(xí)目前的發(fā)展現(xiàn)狀。
AI 科技評論:這次在 IJCAI 上舉辦「聯(lián)邦學(xué)習(xí)」Workshop 的出發(fā)點時什么?
劉洋:我們這邊舉辦這個 Workshop 的出發(fā)點最主要還是期望能利用這個機會推動聯(lián)邦學(xué)習(xí)生態(tài)的建設(shè),希望學(xué)術(shù)界、企業(yè)界以及法律、監(jiān)管機構(gòu)都能夠?qū)β?lián)邦學(xué)習(xí)這項技術(shù)有更深入的了解,并希望更多的企業(yè)加入到這個生態(tài)中來。
同時,我們也希望能借此機會搭建一個平臺,讓有志于做聯(lián)邦學(xué)習(xí)方向的學(xué)生找到合適的研究團(tuán)隊。
AI 科技評論:本次 Workshop 擬定的規(guī)模大概多大?與其他主題的研討會相比,聯(lián)邦學(xué)習(xí)主題研討會對于參會者來說,會有哪些不一樣的吸引力?
劉洋:我們這次擬定的規(guī)模大概為 60 到 100 人。相比于其他主題的研討會,我認(rèn)為我們有以下幾個吸引點:
第一,我們邀請到了在聯(lián)邦學(xué)習(xí)領(lǐng)域有深入研究的國際領(lǐng)先的科學(xué)家們,包括 IBM 的 Shahrokh Daijavad、谷歌的 Jakub Kone?ny,他們會給現(xiàn)場的參會者做 Keynote 演講,分享聯(lián)邦學(xué)習(xí)國際最前沿和最先進(jìn)的一些成果。
第二,論壇的最后一個小時,楊強老師會主持一個 Panel,邀請參與論壇的比較知名的專家在現(xiàn)場與參會者進(jìn)行深度互動,一起探討聯(lián)邦學(xué)習(xí)未來的發(fā)展方向等等。
第三,這次在研討會上分享的論文,我們會請參會者一同評選出幾個獎項,其中就包括 Best Paper,用以激勵該領(lǐng)域的學(xué)生和研究者們。
第四,這個研討會給在學(xué)術(shù)界和工業(yè)界研究聯(lián)邦學(xué)習(xí)的研究者們提供了一個很好的交流機會,他們可以通過這個研討會更深入地了解對方都在做什么,彼此間也可以擦出更多思想的火花。
AI 科技評論:除了邀請了重量級的嘉賓來做 Keynote 演講,在議程的其他設(shè)置和主題還有哪些考量?
劉洋:在議程設(shè)置上,除了 Keynote 演講,我們還從本次研討會的 40 多篇投稿中選擇出了優(yōu)秀的論文,并讓論文作者來到現(xiàn)場做報道,我們分別組織了 4 場 Session(總共 12 篇研究價值比較高的論文作者會進(jìn)行 15 分鐘的論文介紹)和 1 場 Lightning Talk(總共 13 篇較優(yōu)秀的論文作者會進(jìn)行 5 分鐘的論文輕講解)。同時,這 13 篇將進(jìn)行 5 分鐘介紹的論文連同另外 6 篇優(yōu)秀論文會以海報的形式進(jìn)行展示。
同時,這 4 場 Session 設(shè)置的主題包括隱私、安全和系統(tǒng)的魯棒性;系統(tǒng)的效率、交互和基礎(chǔ)設(shè)施;聯(lián)邦學(xué)習(xí)的整個機制設(shè)計、政策和應(yīng)用,這都是我們認(rèn)為在聯(lián)邦學(xué)習(xí)領(lǐng)域中的非常重要的子領(lǐng)域,非常值得我們?nèi)ド钊胙芯亢吞接憽?/p>
比如說,聯(lián)邦學(xué)習(xí)實際上就是一個系統(tǒng),它本身的效率和優(yōu)化,還沒有得到廣泛研究,所以我們希望將這個方向作為研討會上集中探索的一個子領(lǐng)域;另外如何去引導(dǎo)政府制定與現(xiàn)在的法律法規(guī)相適應(yīng)的政策,也是我們希望探討的一個重要方向,因為它涉及的不光是學(xué)術(shù)研究,還地涉及到了非常多的法律法規(guī)和公平性等方面。
AI 科技評論:希望本次論壇達(dá)到怎樣的效果,對于參加本次論壇的參會者有哪些期望?
劉洋:
一方面,我們肯定希望所有參加「聯(lián)邦學(xué)習(xí)」研討會的參會者都能夠有很好的收獲,這才說明我們這次舉辦的研討會成功地給大家提供了一個交流的機會;
另一方面,我們也希望對于整個聯(lián)邦學(xué)習(xí)的學(xué)術(shù)研究起到一個整體的推動作用,期望以這個研討會為起點,將來無論是學(xué)術(shù)界還是工業(yè)界,都能夠?qū)β?lián)邦學(xué)習(xí)這一研究方向有更多探索和更多應(yīng)用。
AI 科技評論:楊強老師和您們基本是國內(nèi)最早一批研究聯(lián)邦學(xué)習(xí)的人,當(dāng)時是基于怎樣的契機、背景,選擇研究這一新的研究方向呢?
劉洋:首先,近兩年來,我們發(fā)現(xiàn) AI 和數(shù)據(jù)面臨著比較獨特的環(huán)境,在落地應(yīng)用上面臨很多難以克服的困境,并且主要是來自缺乏數(shù)據(jù)的困境,即數(shù)據(jù)孤島現(xiàn)象。雖然谷歌在 2016 年就提出了聯(lián)邦學(xué)習(xí),但是并沒有解決企業(yè)之間數(shù)據(jù)孤島問題。
尤其是當(dāng)我們來到企業(yè)以后,就強烈感受到,AI 如果想在工業(yè)界落地,是需要非常多的數(shù)據(jù)來支持的,然而大部分小企業(yè)基本上是無法應(yīng)對這一難題的,如何讓小企業(yè)也能享受到大企業(yè)的數(shù)據(jù)以及提升數(shù)據(jù)的價值,使我們希望解決的問題。
其次,隨著國內(nèi)、國際的數(shù)據(jù)監(jiān)管在不斷加強,比如說歐盟在 2018 年 5 月 25 日開始實施的《通用數(shù)據(jù)保護(hù)條例》(GDPR)以及國內(nèi)近兩年頒布的一連串更嚴(yán)格、涉及更廣泛領(lǐng)域的數(shù)據(jù)監(jiān)督法規(guī),使得企業(yè)之間實現(xiàn)數(shù)據(jù)共享更成為一個遙不可及的目標(biāo)。
這樣的背景下,我們認(rèn)為聯(lián)邦學(xué)習(xí)是解決這兩個核心問題的同一個解決思路,既能解決數(shù)據(jù)孤島的問題,又能解決數(shù)據(jù)隱私的問題。
同時再加上我們在聯(lián)邦學(xué)習(xí)上已經(jīng)有了比較深厚的技術(shù)積累,我們的研發(fā)、工程人員都是這個方向的背景出身,且有很多年的研發(fā)經(jīng)驗以及很強的落地經(jīng)驗。所以我們就開始對聯(lián)邦學(xué)習(xí)這個方向進(jìn)行更多的技術(shù)研究、落地和推廣。
AI 科技評論:實際上,最先提出聯(lián)邦學(xué)習(xí)這個概念的是谷歌,那微眾銀行這邊的聯(lián)邦學(xué)習(xí)對于谷歌的聯(lián)邦學(xué)習(xí)是否有繼承的方面(同)?又有哪些發(fā)展和變革(異)?
劉洋:繼承的方面就在于,我們和谷歌在聯(lián)邦學(xué)習(xí)的整體思路上是一脈相承的。
而最核心的不同之處在于,谷歌的聯(lián)邦學(xué)習(xí)方案是 To C 的(應(yīng)用在用戶的手機端),是同一家公司根據(jù)內(nèi)部對 To C 業(yè)務(wù)的需求所產(chǎn)生的一套用以解決數(shù)據(jù)隱私問題的方案;而我們的聯(lián)邦學(xué)習(xí)則是 To B 的,用以解決企業(yè)與企業(yè)之間的數(shù)據(jù)孤島難題,是一個更開放的類似企業(yè)聯(lián)盟的生態(tài)。
所以,根本上而言,谷歌的聯(lián)邦學(xué)習(xí)方案是橫向的,它使用的數(shù)據(jù)特征都是相同的,因而只需要建同一個模型;而我們的這種方案是縱向聯(lián)邦學(xué)習(xí),不同企業(yè)之間的數(shù)據(jù)特征往往都是不同的,所以即便面向的用戶是相同的場景,整個技術(shù)方案和實施框架也是不一樣的。
AI 科技評論:楊強老師之前也提到,一開始研究這個方向的時候并不被大家所看好,在推進(jìn)這一研究的過程中想必也遇到了不少阻力和困難,其中最大的是?
劉洋:因為我們的最終目標(biāo)是要建立一個讓企業(yè)之間能夠?qū)υ挼臋C制和生態(tài),所以我認(rèn)為最大的挑戰(zhàn)其實是我們如何讓企業(yè)來了解我們的技術(shù),并且愿意相信聯(lián)邦學(xué)習(xí)的技術(shù)是能夠解決數(shù)據(jù)隱私問題,同時能夠打破企業(yè)之間的數(shù)據(jù)孤島問題的。
在這個過程中,聯(lián)邦學(xué)習(xí)除了技術(shù)本身外,還需要整套框架的支持,例如安全性保護(hù)和激勵機制的設(shè)計和建設(shè)都是我們需要重點攻克的,所以建設(shè)這樣一個聯(lián)邦學(xué)習(xí)機制或者說生態(tài)要遠(yuǎn)比單純的技術(shù)性問題難得多。
AI 科技評論:另外,聯(lián)邦學(xué)習(xí)也涉及到很多算法(如分布式機器學(xué)習(xí))等技術(shù)層面的東西,現(xiàn)在是否面臨來自技術(shù)層面的挑戰(zhàn)或瓶頸呢?
劉洋:實際上在技術(shù)方面,聯(lián)邦學(xué)習(xí)已經(jīng)相對來說比較成熟。目前我們的聯(lián)邦學(xué)習(xí),已經(jīng)能夠?qū)崿F(xiàn)一些工業(yè)化的場景,做一些實際的工業(yè)落地。但是研究本身其實是一個非常漫長的過程,技術(shù)上也會存在很多可以優(yōu)化、改進(jìn)的地方。
AI 科技評論:目前,微眾銀行團(tuán)隊在聯(lián)邦學(xué)習(xí)方面發(fā)展到了哪一個階段?
劉洋:一項面向工業(yè)化的技術(shù)的發(fā)展過程一般是從開始的孵化到最終的大規(guī)模工業(yè)化量產(chǎn)。目前已經(jīng)有很多大數(shù)據(jù)場景引入了我們的聯(lián)邦學(xué)習(xí)方案,所以我們的聯(lián)邦學(xué)習(xí)目前所處的階段是非常接近大規(guī)模工業(yè)化量產(chǎn)的。
AI 科技評論:不久前聯(lián)邦學(xué)習(xí)正式進(jìn)入國際標(biāo)準(zhǔn)流程,這對于您們在聯(lián)邦學(xué)習(xí)的研究以及推廣方面,有哪些具體的促進(jìn)作用?
劉洋:聯(lián)邦學(xué)習(xí)正式進(jìn)入國際標(biāo)準(zhǔn)流程,可以說是給整個聯(lián)邦學(xué)習(xí)的生態(tài)建設(shè)打下了一個基石,意義巨大。
在聯(lián)邦學(xué)習(xí)的推廣過程中,我們越發(fā)地意識到,聯(lián)邦學(xué)習(xí)要想真正實現(xiàn)落地應(yīng)用,就必須建立一種企業(yè)之間的對話語言,并且一定要是得到國際法律法規(guī)體系支持的對話語言。所以聯(lián)邦學(xué)習(xí)進(jìn)入國際標(biāo)準(zhǔn)流程,可以讓加入聯(lián)邦學(xué)習(xí)聯(lián)盟的企業(yè)能夠在同一個框架上對話,同時,如果新的企業(yè)或機構(gòu)想要加入聯(lián)邦學(xué)習(xí),也必須按照這一標(biāo)準(zhǔn)的規(guī)定應(yīng)用同樣的框架,這樣又能夠反過來推動聯(lián)邦學(xué)習(xí)生態(tài)的擴(kuò)大。
AI 科技評論:隨著聯(lián)邦學(xué)習(xí)的影響力日漸提升,現(xiàn)在學(xué)術(shù)界和業(yè)界對于聯(lián)邦學(xué)習(xí)的研究熱情也在提高,目前還有哪些機構(gòu)在重點從事這個方向的研究工作?
劉洋:現(xiàn)在,業(yè)界有一大批企業(yè)在做聯(lián)邦學(xué)習(xí)這個方向的研究,其中包括:第四范式推出了數(shù)據(jù)隱私方案,并且已在金融和醫(yī)療場景中應(yīng)用該方案;創(chuàng)新工場在聯(lián)邦學(xué)習(xí)的安全性方面展開了深入研究;京東將聯(lián)邦學(xué)習(xí)應(yīng)用到了城市大腦上;另外還有平安集團(tuán)單獨成立了一個聯(lián)邦學(xué)習(xí)研發(fā)部門,等等。
而學(xué)術(shù)界,例如南洋理工大學(xué)、香港科技大學(xué)、北京航空航天大學(xué)以及清華大學(xué)等高校,都有很多老師和團(tuán)隊在進(jìn)行聯(lián)邦學(xué)習(xí)研究。
我們希望我們現(xiàn)在關(guān)于聯(lián)邦學(xué)習(xí)的工作能夠起到啟蒙性質(zhì)的作用,能夠其啟發(fā)更多的學(xué)生和研究人員來研究這個課題,希望明年能夠看到學(xué)術(shù)界和企業(yè)家的研究者們對聯(lián)邦學(xué)習(xí)展開更深入的研究。
AI 科技評論:聯(lián)邦學(xué)習(xí)的落地場景都有哪些?
劉洋:醫(yī)療、金融、保險等需要用到很多大數(shù)據(jù)的領(lǐng)域,都是聯(lián)邦學(xué)習(xí)的落地場景。
AI 科技評論:在讓聯(lián)邦學(xué)習(xí)具體落地到場景應(yīng)用過程中,遇到了哪些困難或挑戰(zhàn)?其中最大的挑戰(zhàn)是哪個?
劉洋:聯(lián)邦學(xué)習(xí)在不同的領(lǐng)域會遇到不同的挑戰(zhàn),比如說在金融領(lǐng)域,我們遇到的挑戰(zhàn)更多的來自于監(jiān)管機構(gòu),我們需要讓監(jiān)管機構(gòu)去理解和推廣聯(lián)邦學(xué)習(xí),從而成為銀行之間進(jìn)行對話的橋梁,所以我們也一直在跟深圳的監(jiān)管機構(gòu)進(jìn)行溝通。另外在邊緣計算領(lǐng)域,比如說 IoT,我們主要面臨的挑戰(zhàn)是邊緣計算不足的問題。
AI 科技評論:在尋找落地的合作伙伴時,會有哪些重點考量的地方(例如,是否要求合作方擁有足夠豐富的數(shù)據(jù)量)?
劉洋:我們目前還處在一個需要高速或加大力度拓展聯(lián)邦學(xué)習(xí)生態(tài)的階段,所以在合作伙伴的考量上面,我們其實并沒有要求對方一定要是大公司或者是有技術(shù)深度的 AI 公司。在我們的生態(tài)中,現(xiàn)在有很多長尾的終端公司,也有一些創(chuàng)業(yè)公司,同時也有騰訊、平安這樣的大企業(yè)。
合作伙伴的業(yè)務(wù)場景是否能夠體現(xiàn)聯(lián)邦學(xué)習(xí)的價值,這是我們一直以來的價值追求和衡量標(biāo)準(zhǔn)。
AI 科技評論:目前,聯(lián)邦學(xué)習(xí)在這些領(lǐng)域的大數(shù)據(jù)應(yīng)用中起到了哪些「看得見」的影響?期望它最終能為大數(shù)據(jù)的應(yīng)用發(fā)揮怎樣的作用?
劉洋:聯(lián)邦學(xué)習(xí)的作用就在于能夠?qū)⒑芏嘈?shù)據(jù)匯聚在一起變成大數(shù)據(jù),所以它的價值和影響主要是在隱私保護(hù)下匯聚和挖掘數(shù)據(jù)的價值。
比如在金融領(lǐng)域,聯(lián)邦學(xué)習(xí)能夠用以分析潛在的欺詐行為;在保險定價領(lǐng)域,能夠更多維度地去精準(zhǔn)分析用戶的屬性。則對于企業(yè)而言,應(yīng)用聯(lián)邦學(xué)習(xí)能夠更有效地節(jié)省成本,同時也能夠更精準(zhǔn)地去做用戶的目標(biāo)定位和分級。
另外對于一些數(shù)據(jù)非常敏感的場景,比如說醫(yī)療領(lǐng)域,不同醫(yī)院也能夠通過聯(lián)盟學(xué)習(xí)技術(shù)去共享敏感的醫(yī)療數(shù)據(jù)。
AI 科技評論:您認(rèn)為聯(lián)邦學(xué)習(xí)這一領(lǐng)域發(fā)展到理想的狀態(tài)還要多久時間?
劉洋:實際上,一個領(lǐng)域要想從零發(fā)展到一個比較熱門的狀態(tài),至少需要幾年的時間。就比如說谷歌在 2016 年提出聯(lián)邦學(xué)習(xí),當(dāng)時該領(lǐng)域僅有幾篇論文;而在過去的兩三年時間里,每年都有幾十甚至上百篇論文出來。現(xiàn)在,聯(lián)邦學(xué)習(xí)正處于一個快速發(fā)展的階段,隨著越來越多的人參與到這個研究領(lǐng)域,聯(lián)邦學(xué)習(xí)會離理想的狀態(tài)越來越近。
我認(rèn)為聯(lián)邦學(xué)習(xí)最理想的狀態(tài)應(yīng)該是能夠能夠解決大多數(shù)企業(yè)的痛點,并在落地應(yīng)用上實現(xiàn)大規(guī)模量產(chǎn)。正如我剛提到的,我們現(xiàn)在已經(jīng)在靠近這樣一個階段了,未來的一兩年時間是非常關(guān)鍵的。
AI 科技評論:之后,微眾銀行會考慮做 To C 端的聯(lián)邦學(xué)習(xí)嗎?
劉洋:這是一個很好的問題。我認(rèn)為我們目前還是會主要聚焦于 To B 的聯(lián)邦學(xué)習(xí),因為這是我們的優(yōu)勢所在。
未來我們可能也會涉及到 To C,但如果 To B 已形成幾十萬或幾百萬家的微、中小型企業(yè)的規(guī)模,我們能做的事情就已經(jīng)很多很多了。所以我們未必一定要做跟谷歌同樣的事情。
AI 科技評論:下一步,微眾銀行團(tuán)隊針對聯(lián)邦學(xué)習(xí)這個方向的研究有哪些規(guī)劃?
劉洋:在技術(shù)研發(fā)方面,我們下一步的規(guī)劃包括幾個方面,一是我們需要建立更好的攻防體系,讓聯(lián)邦學(xué)習(xí)變得更加安全,也更有效率;二是我們需要從技術(shù)層面加快建立激勵機制,讓更多企業(yè)加入到聯(lián)邦學(xué)習(xí)聯(lián)盟中來。
在生態(tài)推廣方面,我們會繼續(xù)完善整個聯(lián)邦學(xué)習(xí)生態(tài)體系的建設(shè)和維護(hù),建立企業(yè)之間能夠進(jìn)行對話的標(biāo)準(zhǔn),同時針對不同的業(yè)務(wù)場景和不同的領(lǐng)域提出更多的解決方案。
(完)
IJCAI 2019 召開之際,聯(lián)邦學(xué)習(xí) Workshop 也將于 8 月 12 日 如期舉行。更多信息請參考:http://fml2019.algorithmic-crowdsourcing.com/programme/?from=timeline
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。