0
本文作者: 蔣寶尚 | 2020-08-14 11:56 |
作者 | 蔣寶尚、周蕾
8月7日-8月9日,2020年全球人工智能和機(jī)器人峰會(huì)(簡(jiǎn)稱“CCF-GAIR 2020”)在深圳如期舉辦!CCF-GAIR由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,香港中文大學(xué)(深圳)、雷鋒網(wǎng)聯(lián)合承辦,鵬城實(shí)驗(yàn)室、深圳市人工智能與機(jī)器人研究院協(xié)辦,以“AI新基建 產(chǎn)業(yè)新機(jī)遇”為大會(huì)主題,致力打造國(guó)內(nèi)人工智能和機(jī)器人領(lǐng)域規(guī)模最大、規(guī)格最高、跨界最廣的學(xué)術(shù)、工業(yè)和投資領(lǐng)域盛會(huì)。
8月9日上午,在「聯(lián)邦學(xué)習(xí)與大數(shù)據(jù)隱私專場(chǎng)」上,同盾科技人工智能研究院首席專家李宏宇博士做了題為「同盾智邦-知識(shí)聯(lián)邦平臺(tái):打造數(shù)據(jù)安全的人工智能生態(tài)系統(tǒng)」的演講。
李宏宇:同盾科技人工智能研究院首席專家,師從國(guó)際模式識(shí)別學(xué)會(huì)會(huì)士、芬蘭模式識(shí)別協(xié)會(huì)主席Jussi Parkkinen教授,相繼獲得復(fù)旦大學(xué)以及東芬蘭大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位。曾任同濟(jì)大學(xué)軟件學(xué)院副教授、博導(dǎo)。李宏宇博士在圖像處理和分類、生物特征識(shí)別、OCR、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等人工智能的多個(gè)領(lǐng)域有著深厚造詣和應(yīng)用成果,在國(guó)際權(quán)威學(xué)術(shù)期刊和一流的國(guó)際會(huì)議上發(fā)表了近80篇學(xué)術(shù)論文,發(fā)明專利20余項(xiàng),出版專著1部。
以下是李宏宇在大會(huì)的演講實(shí)錄,AI科技評(píng)論作了不修改原意的整理和編輯:
今天演講主題是《同盾智邦-知識(shí)聯(lián)邦平臺(tái):打造數(shù)據(jù)安全的人工智能生態(tài)系統(tǒng)》。那么什么是知識(shí)聯(lián)邦?作為一個(gè)新的概念,它背后代表著知識(shí)共創(chuàng)可共享。具體而言,通過(guò)知識(shí)的共創(chuàng)和共享,從而實(shí)現(xiàn)數(shù)據(jù)的可用不可見。
從知識(shí)的形成的過(guò)程來(lái)看:從數(shù)據(jù)到信息,再到知識(shí),最后到利用知識(shí)形成決策,知識(shí)聯(lián)邦的目的是希望能夠利用各種知識(shí),包括訓(xùn)練出來(lái)的模型知識(shí)以及邏輯規(guī)則等已有的先驗(yàn)知識(shí)。
我下面將從背景、相關(guān)概念和應(yīng)用的場(chǎng)景分別探討知識(shí)聯(lián)邦。
人工智能的發(fā)展離不開數(shù)據(jù)的支撐,但是現(xiàn)在數(shù)據(jù)孤島是普遍存在的現(xiàn)象。例如,機(jī)構(gòu)間存在數(shù)據(jù)孤島,企業(yè)內(nèi)部也存在數(shù)據(jù)孤島。更有研究表明,現(xiàn)在有92%的企業(yè)內(nèi)部存在非常嚴(yán)重的數(shù)據(jù)孤島的現(xiàn)象。
其實(shí),解決數(shù)據(jù)孤島不僅是簡(jiǎn)單地把數(shù)據(jù)匯集起來(lái),還需要考慮數(shù)據(jù)安全問(wèn)題。從最近兩年的數(shù)據(jù)泄露事件就能看出問(wèn)題的嚴(yán)重性。所以,每一次產(chǎn)生重大社會(huì)影響的數(shù)據(jù)泄露事件都意味著數(shù)據(jù)安全和隱私保護(hù)的確是需要更嚴(yán)格的監(jiān)管。
在此大背景下,我們也看到在國(guó)內(nèi)一系列法規(guī)的進(jìn)展,例如在今年3月份,最新版本的《個(gè)人信息安全規(guī)范》,以及央行的個(gè)人金融信息的保護(hù)技術(shù)規(guī)范,都能看出數(shù)據(jù)安全法規(guī)的進(jìn)化明顯。
尤其是7月初的時(shí)候,《數(shù)據(jù)安全法》草案已經(jīng)開始在征求意見,標(biāo)志著一系列宏觀的政策在不斷地演變,國(guó)內(nèi)對(duì)于數(shù)據(jù)的管控將會(huì)更加嚴(yán)格、更加全面。
“數(shù)據(jù)安全”的大環(huán)境下,數(shù)據(jù)隱私的各種問(wèn)題催生了聯(lián)邦學(xué)習(xí),其實(shí),在過(guò)去的這些年來(lái),無(wú)論是大數(shù)據(jù)還是人工智能,每個(gè)領(lǐng)域都有一些關(guān)于隱私計(jì)算的研究,這些研究雖然路線不同、技術(shù)方法不同,但是已經(jīng)逐漸呈現(xiàn)融合統(tǒng)一的趨勢(shì),也就是打造數(shù)據(jù)安全的人工智能。在這里我們叫它知識(shí)聯(lián)邦。
如上圖所示,知識(shí)聯(lián)邦包含了兩層意思,一層是知識(shí),一層是聯(lián)邦。其中,知識(shí)不僅包括模型、也包括邏輯規(guī)則或者模式。同時(shí),知識(shí)也不是單純通過(guò)訓(xùn)練學(xué)習(xí)出來(lái)的,它還包括經(jīng)驗(yàn)知識(shí)、先驗(yàn)知識(shí),這些可能是常識(shí)和行業(yè)領(lǐng)域知識(shí),不需要再訓(xùn)練學(xué)習(xí)。
如何把分散在不同的行業(yè)或領(lǐng)域里的知識(shí),充分地利用起來(lái)?這就是知識(shí)聯(lián)邦所要做的事情,簡(jiǎn)單而言是通過(guò)數(shù)據(jù)安全交換協(xié)議,利用多個(gè)參與方的數(shù)據(jù),進(jìn)行知識(shí)的共創(chuàng)、共享和推理。最終的目標(biāo)是要實(shí)現(xiàn)數(shù)據(jù)可用不可見。
注:不同于密碼協(xié)議,數(shù)據(jù)安全交換協(xié)議定義了如何在多個(gè)參與方之間進(jìn)行數(shù)據(jù)交換的過(guò)程。
知識(shí)聯(lián)邦不是一個(gè)單純的技術(shù)方法,它是一套框架體系。這個(gè)框架體系可以根據(jù)聯(lián)邦發(fā)生的階段,劃分為四個(gè)層次。第一是信息層的聯(lián)邦,在數(shù)據(jù)轉(zhuǎn)換為信息的時(shí)候,把這些信息進(jìn)行計(jì)算或者處理,涉及的技術(shù)是安全多方計(jì)算。然后通過(guò)某些先驗(yàn)的知識(shí),通過(guò)某些規(guī)則直接提取出有價(jià)值的信息,最后形成聯(lián)邦。
第二個(gè)是模型層的聯(lián)邦。也就是通常提到的聯(lián)邦學(xué)習(xí),涉及到模型參數(shù)的更新。
第三個(gè)是認(rèn)知層上的聯(lián)邦。對(duì)已有的模型訓(xùn)練、學(xué)習(xí),形成了一些淺層的知識(shí),我們?cè)賹⑦@些淺層知識(shí)聯(lián)合在一起,進(jìn)行集成學(xué)習(xí),從而得到更優(yōu)、更好、符合特定應(yīng)用場(chǎng)景的知識(shí)。
第四個(gè)是知識(shí)層上的聯(lián)邦。在不同的行業(yè)、不同的領(lǐng)域之間有很多知識(shí)庫(kù),在不同領(lǐng)域、行業(yè)的知識(shí)庫(kù)上進(jìn)行知識(shí)推理,就是知識(shí)層聯(lián)邦。所以知識(shí)聯(lián)邦不是單純的某一種應(yīng)用方法,它統(tǒng)一支持了所有的安全多方應(yīng)用,包括安全多方計(jì)算,安全多方學(xué)習(xí),安全多方數(shù)據(jù)共享,以及聯(lián)邦推理、聯(lián)邦預(yù)測(cè)等一系列的綜合體。
知識(shí)聯(lián)邦在很多行業(yè)里有廣泛應(yīng)用的價(jià)值。例如金融領(lǐng)域,做為一個(gè)數(shù)據(jù)監(jiān)管非常強(qiáng)的行業(yè),知識(shí)聯(lián)邦在此領(lǐng)域的應(yīng)用更為全面。知識(shí)聯(lián)邦的信息層可以用來(lái)解決多頭共債的問(wèn)題,在模型層解決智能風(fēng)控的問(wèn)題,反欺詐和企業(yè)征信可以分別在認(rèn)知層和知識(shí)層解決。
先看多頭共債的問(wèn)題。通常一個(gè)用戶可能會(huì)與多個(gè)平臺(tái)發(fā)生一些借貸關(guān)系,這時(shí)候就陷入了共債。一旦這個(gè)用戶發(fā)生資金的問(wèn)題,就有可能導(dǎo)致系統(tǒng)性的風(fēng)險(xiǎn),甚至導(dǎo)致金融行業(yè)的大波動(dòng)。解決多頭問(wèn)題,通常的方式是能夠多頭評(píng)估個(gè)人真實(shí)的收入。換句話說(shuō),就是得到此人的累計(jì)的授信和實(shí)際已經(jīng)發(fā)生的借貸。但是這樣有可能會(huì)泄露很多查詢隱私。
利用知識(shí)聯(lián)邦的查詢方式是:提出需求之后第三方向各方查詢,查詢的時(shí)候每家參與機(jī)構(gòu)分別計(jì)算他已經(jīng)得到的授信或風(fēng)險(xiǎn),把風(fēng)險(xiǎn)通過(guò)密文的方式傳送給第三方,第三方再把所有的密文結(jié)構(gòu)匯總,匯總之后返還給主動(dòng)查詢方,如此便能保證數(shù)據(jù)隱私的安全。當(dāng)然,在這個(gè)過(guò)程中需要進(jìn)行一些加密或者同態(tài)加密的算法,但是現(xiàn)有很多同態(tài)加密的算法耗時(shí)非常大,如果能融合知識(shí)聯(lián),就能夠使它的效能大大提高。
再看智能風(fēng)控的問(wèn)題。在解決這個(gè)問(wèn)題的時(shí)候,知識(shí)聯(lián)邦方案中采用的是一種不經(jīng)意傳輸?shù)姆桨福寷](méi)有標(biāo)簽一方的數(shù)據(jù)通過(guò)多種標(biāo)簽組合的方式,然后形成多種結(jié)果,再把中間結(jié)果返還給有標(biāo)簽的一方,讓它進(jìn)行篩選,從而挑選有用的信息使用。
如上圖真實(shí)場(chǎng)景當(dāng)中的數(shù)據(jù)示例。假定在數(shù)據(jù)對(duì)齊之后有20萬(wàn)條70維的特征和標(biāo)簽,以及180維的B方的數(shù)據(jù),這時(shí)如果只使用單方的數(shù)據(jù),其KS值相對(duì)比較低,如果使用聯(lián)邦學(xué)習(xí),哪怕是性能一般的方法,也會(huì)有明顯提升的。
下面介紹一個(gè)工業(yè)級(jí)的應(yīng)用產(chǎn)品:智邦平臺(tái)。隨著人工智能的演進(jìn),在過(guò)去每隔30年,人工智能都有一個(gè)非常大的變化,我們是處于AI2.0的時(shí)代,如果說(shuō)這時(shí)的AI已經(jīng)“稍微”有點(diǎn)感知,那么未來(lái)知識(shí)聯(lián)邦會(huì)是AI3.0的必由之路,幫助AI獲得、使用更多的知識(shí)。
為了迎合未來(lái)的“趨勢(shì)”,我們打造出了智邦平臺(tái),做為知識(shí)聯(lián)邦的參考實(shí)現(xiàn),目的是解決真實(shí)應(yīng)用當(dāng)中遇到的幾個(gè)問(wèn)題:
首先是提供數(shù)據(jù)安全交換的協(xié)議,這是非常重要的一環(huán),因?yàn)橄胫缆?lián)邦到底安不安全,一種驗(yàn)證方式是開源,另外一種方式就是需要非常清楚數(shù)據(jù)交換過(guò)程中發(fā)生了什么事情。
第二個(gè)是解決了多方參與的數(shù)據(jù)問(wèn)題,因?yàn)槊考覚C(jī)構(gòu)的數(shù)據(jù)都是有異構(gòu)存在的,多元異構(gòu)的問(wèn)題是打通所有參與方,形成數(shù)據(jù)聯(lián)盟的痛點(diǎn)。
第三個(gè)是一站式產(chǎn)品閉環(huán)的問(wèn)題。從特征選擇、特征預(yù)處理、數(shù)據(jù)預(yù)處理,到算法管理、安全保護(hù),以及最后的模型發(fā)布,這一系列產(chǎn)品流程的閉環(huán)。
總體上來(lái)講,智邦除了通用的功能和場(chǎng)景化的應(yīng)用算法之外,底層包含了FLEX協(xié)議和數(shù)據(jù)沙箱,做為支撐平臺(tái)的兩條腿,非常重要。
簡(jiǎn)單看一下FLEX協(xié)議。第一個(gè)內(nèi)容是特征選擇,在特征選擇的過(guò)程當(dāng)中,都希望不要進(jìn)行單方的特征選擇,否則對(duì)方的特征無(wú)法發(fā)揮它的價(jià)值。平臺(tái)提供了兩種特征選擇的方式,性能明顯是要比只使用單方的數(shù)據(jù)進(jìn)行特征選擇的效果好很多。
另一個(gè)內(nèi)容是樣本的安全對(duì)齊。樣本對(duì)齊要求保護(hù)交集外的數(shù)據(jù),平臺(tái)提供的方式能夠做到這一點(diǎn)。而在真正的應(yīng)用當(dāng)中,還有更嚴(yán)格的要求:參與方都希望保護(hù)交集內(nèi)的數(shù)據(jù),所以平臺(tái)提出一種方案叫做雙盲對(duì)齊。
除了FLEX協(xié)議,平臺(tái)的另外一條“腿”是數(shù)據(jù)沙箱。它解決的問(wèn)題是如何把多元異構(gòu)的數(shù)據(jù)標(biāo)準(zhǔn)化,然后將統(tǒng)一的數(shù)據(jù)進(jìn)行接入。面對(duì)“不同的參與方有不同的結(jié)構(gòu)數(shù)據(jù),甚至字段定義、命名規(guī)則”的問(wèn)題,可以通過(guò)沙箱可以快速實(shí)現(xiàn)標(biāo)準(zhǔn)化的處理。另外,沙箱里面也實(shí)現(xiàn)了數(shù)據(jù)分類分集,即根據(jù)不同的類型、不同的應(yīng)用場(chǎng)景的數(shù)據(jù),賦予其不同的脫敏加密方式,然后統(tǒng)一加密脫敏的方式,最后保證輸出的所有參與方數(shù)據(jù)都保持一致。
同時(shí),沙箱是一個(gè)獨(dú)立的組件,它能夠?qū)Χ鄠€(gè)參與方之間的數(shù)據(jù)進(jìn)行虛擬的融合,從而實(shí)現(xiàn)安全的多方數(shù)據(jù)共享。
回過(guò)頭來(lái)看聯(lián)邦生態(tài)中涉及到的角色,有兩大類。首先是數(shù)據(jù)提供者,其次是數(shù)據(jù)的使用者,包括模型的設(shè)計(jì)者和模型的使用者。一個(gè)真正的聯(lián)邦生態(tài)會(huì)兼顧數(shù)據(jù)的提供者和數(shù)據(jù)的使用者兩方,即不會(huì)讓數(shù)據(jù)的提供者擔(dān)心數(shù)據(jù)的真正使用方是誰(shuí),模型的設(shè)計(jì)者是誰(shuí)。
聯(lián)邦如何激勵(lì)參與方加入生態(tài)呢?其實(shí)所有不同的參與方都有自己的需求,例如數(shù)據(jù)提供者的原始動(dòng)力是通過(guò)數(shù)據(jù)進(jìn)行價(jià)值變現(xiàn)、價(jià)值最大化。模型的使用者的原動(dòng)力來(lái)自于提升核心競(jìng)爭(zhēng)力的渴望,同時(shí)希望擴(kuò)大行業(yè)影響力。
同盾科技成立于2013年,總部位于杭州。是一家專注于做智能分析與決策的公司,目前已經(jīng)為金融、保險(xiǎn)、互聯(lián)網(wǎng)、政務(wù)等行業(yè)服務(wù)了上萬(wàn)家企業(yè)客戶。
同盾科技一直作為獨(dú)立第三方的角色,持續(xù)在人工智能、云計(jì)算、大數(shù)據(jù)分析等方面做了很多的創(chuàng)新。
在歷年的發(fā)展過(guò)程當(dāng)中,同盾科技也持續(xù)得到了政府、市場(chǎng)以及投資機(jī)構(gòu)的認(rèn)可,在今年的時(shí)候,成功入選了國(guó)家科技創(chuàng)新2030“新一代人工智能重大項(xiàng)目”。
同盾一直以來(lái)把人工智能技術(shù)的創(chuàng)新與應(yīng)用作為戰(zhàn)略重點(diǎn),我們?cè)?018年專門成立了AI實(shí)驗(yàn)室,在2019年進(jìn)一步升格成為人工智能研究院,以人工智能研究院為核心載體,穩(wěn)步推動(dòng)人工智能戰(zhàn)略的布局和實(shí)施。在今年初又在美國(guó)硅谷成立了美國(guó)的AI實(shí)驗(yàn)室。
團(tuán)隊(duì)的成員非常專注于人工智能底層技術(shù)的研究和應(yīng)用的探索,有著非常豐富的工作經(jīng)驗(yàn)。例如,團(tuán)隊(duì)的領(lǐng)軍人物李曉林教授是美國(guó)公立常春藤名校佛羅里達(dá)大學(xué)的終身教授,創(chuàng)立了美國(guó)首個(gè)國(guó)家級(jí)深度學(xué)習(xí)中心,現(xiàn)在專職在同盾工作。
此外,同盾科技背后還有一個(gè)非常強(qiáng)大的專家顧問(wèn)團(tuán)隊(duì),有浙大的潘云鶴院士,還有復(fù)旦的楊珉教授,他是國(guó)家973首席科學(xué)家,也是同盾移動(dòng)安全領(lǐng)域的首席科學(xué)家。
同盾科技在產(chǎn)學(xué)研合作方面已經(jīng)做了非常廣的部署,已經(jīng)跟浙江大學(xué)、復(fù)旦大學(xué)、西北工業(yè)大學(xué)建立了長(zhǎng)期的合作,也跟很多大學(xué)的金融機(jī)構(gòu),例如招聯(lián)、建行,成立了聯(lián)合的實(shí)驗(yàn)室,主要聚焦在一些創(chuàng)新性的研究和聯(lián)邦學(xué)習(xí)的落地應(yīng)用。
演講結(jié)束后,李宏宇也接受了雷鋒網(wǎng)的采訪,以下為雷鋒網(wǎng)與李宏宇的對(duì)話實(shí)錄。
問(wèn):目前學(xué)術(shù)界會(huì)有哪些標(biāo)準(zhǔn)去衡量聯(lián)邦學(xué)習(xí)的效果?
李宏宇:聯(lián)邦學(xué)習(xí)衡量好壞,其實(shí)要分兩個(gè)方面。
一方面是說(shuō),它的性能在聯(lián)邦之后和之前相比,是否有本質(zhì)上的大幅提升?就像我們?cè)谘葜v中提到的,如果單純用一家參與方的自有數(shù)據(jù)去訓(xùn)練學(xué)習(xí),可能它只能達(dá)到ks值0.35;但借用了其他參與方的一些數(shù)據(jù)優(yōu)勢(shì)之后,可能會(huì)達(dá)到0.37甚至更高。
此時(shí)從指標(biāo)上來(lái)講是沒(méi)有變化,但從性能對(duì)比上來(lái)講,它一定會(huì)是遠(yuǎn)遠(yuǎn)大于那種使用單方數(shù)據(jù)的情況。當(dāng)然這里面取決于其他參與方的數(shù)據(jù)質(zhì)量如何,就是所謂的數(shù)據(jù)貢獻(xiàn),它能達(dá)到什么級(jí)別。同時(shí),它一定不會(huì)超過(guò)雙方數(shù)據(jù)合在一起后達(dá)到的性能效果。
另一方面是安全問(wèn)題,這時(shí)候需要對(duì)數(shù)據(jù)流通過(guò)程審計(jì):到底流通了什么數(shù)據(jù)?在整個(gè)數(shù)據(jù)流通過(guò)程當(dāng)中是否安全合規(guī)?是否符合個(gè)人信息保護(hù)規(guī)范和數(shù)據(jù)安全法的要求?
具體來(lái)講,不同機(jī)構(gòu)可能各自在數(shù)據(jù)流通過(guò)程中采用了不同的加密安全策略,所以沒(méi)有一個(gè)固定的標(biāo)準(zhǔn)。這也是未來(lái)兩年我們急需完成的事情,推動(dòng)行業(yè)標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn),確定聯(lián)邦過(guò)程、安全認(rèn)證等級(jí)等。
問(wèn):有研究指出,聯(lián)邦學(xué)習(xí)方法中梯度信息的泄露可以反推出部分?jǐn)?shù)據(jù),請(qǐng)問(wèn)是有這樣的情況存在嗎?有沒(méi)有相應(yīng)的對(duì)策?
李宏宇:如果是純粹的聯(lián)邦過(guò)程,利用梯度之間的迭代,那是容易被攻擊泄露一些隱私信息,這是可以反推的——但真正的應(yīng)用當(dāng)中不會(huì)這么簡(jiǎn)單,除非對(duì)方是一個(gè)非常好的黑客,同時(shí)懂得網(wǎng)絡(luò)安全和底層模型加密所有安全策略,否則很難做到。
在數(shù)據(jù)流通全過(guò)程中,有做了幾段數(shù)據(jù)加密過(guò)程,在數(shù)據(jù)預(yù)處理時(shí)就已加密脫敏。訓(xùn)練過(guò)程中又對(duì)模型的梯度參數(shù)進(jìn)一步同態(tài)加密。之后傳給聯(lián)邦域,又要做非對(duì)稱加密的網(wǎng)絡(luò)通道傳輸——這是一層套一層的保護(hù)殼,到最后才保證真正的產(chǎn)品應(yīng)用。
如果拋開這些東西,只是在理想的實(shí)驗(yàn)環(huán)境下,比如拿一張圖片做所謂的聯(lián)邦訓(xùn)練,這過(guò)程中會(huì)有梯度產(chǎn)生的隱私泄露,等于是明文數(shù)據(jù)直接用。但在真實(shí)的場(chǎng)景當(dāng)中,尤其是在金融行業(yè)里面,是不可能直接拿著這些明文數(shù)據(jù)直接用。也就是說(shuō)理論層面上會(huì)有這個(gè)情況,但實(shí)際應(yīng)用的層面上不會(huì)這樣簡(jiǎn)單直接被攻破。
問(wèn):現(xiàn)在聯(lián)邦學(xué)習(xí)發(fā)展很快,可以說(shuō)它是個(gè)成熟的技術(shù)了嗎?
李宏宇:聯(lián)邦學(xué)習(xí)不僅僅是說(shuō)聯(lián)合建模這一件事情,其實(shí)早期已經(jīng)有聯(lián)合建模的方式了,現(xiàn)在聯(lián)邦學(xué)習(xí)是用一種更安全的方式、走線上平臺(tái)來(lái)實(shí)施聯(lián)合建模。
技術(shù)是否成熟到可以應(yīng)用的級(jí)別?我們同盾的智邦平臺(tái)就是非常成熟的工業(yè)級(jí)應(yīng)用產(chǎn)品,得到了合作伙伴們,尤其是大型金融機(jī)構(gòu)的一致認(rèn)可,產(chǎn)品不需要他們?cè)僮鋈魏味胃脑臁?/p>
問(wèn):智邦平臺(tái)推出以來(lái),合作對(duì)象主要是哪一些類型的公司?或者側(cè)重哪些業(yè)務(wù)的應(yīng)用?
李宏宇:金融里最多的一種是消金、小額貸這種公司做風(fēng)控,客戶群體特征非常鮮明,他們只有少量的自有數(shù)據(jù),維度特征有偏差,屬性維度也不可能很多種,更需要借助第三方的數(shù)據(jù)提供方補(bǔ)充,提升模型整體效果。尤其是在同盾的業(yè)務(wù)體系當(dāng)中,原來(lái)很多客戶都是通過(guò)聯(lián)合建模的形式來(lái)對(duì)外提供服務(wù),現(xiàn)在他們都已經(jīng)轉(zhuǎn)向了智邦平臺(tái)。
第二種更多的是銀行這種大型金融機(jī)構(gòu),他們要么不參與,要么就搭建自己的平臺(tái),完成整個(gè)生態(tài)的搭建。
現(xiàn)在很多大型銀行,內(nèi)部數(shù)據(jù)孤島問(wèn)題很嚴(yán)重,子公司之間往往都因?yàn)閿?shù)據(jù)安全而無(wú)法充分集成和共享數(shù)據(jù)。這個(gè)時(shí)候他們更想要采購(gòu)一個(gè)大的平臺(tái),完成自有生態(tài)里的補(bǔ)充,打通所有數(shù)據(jù)孤島,解決數(shù)據(jù)安全問(wèn)題。
問(wèn):聯(lián)邦學(xué)習(xí)在同盾科技的戰(zhàn)略布局中是怎樣的地位?
李宏宇:聯(lián)邦學(xué)習(xí)的確是同盾的生態(tài)體系中一個(gè)戰(zhàn)略重點(diǎn)項(xiàng)目,也是我們未來(lái)提供智能決策和分析服務(wù)的基礎(chǔ)設(shè)施,我們也會(huì)逐步把原有生態(tài)里相關(guān)業(yè)務(wù)通過(guò)智邦平臺(tái)對(duì)外提供數(shù)據(jù)安全的智能服務(wù)。
我們的目標(biāo)是打通所有的生態(tài)體系,在數(shù)據(jù)提供者和數(shù)據(jù)模型使用者之間的建立隔離屏障,讓數(shù)據(jù)提供者不需要關(guān)心誰(shuí)來(lái)使用,數(shù)據(jù)模型使用者不用關(guān)心數(shù)據(jù)到底分布在哪里。
問(wèn):今年開始,金融科技開啟新十年,您預(yù)測(cè)接下來(lái)這幾年會(huì)有什么新趨勢(shì)?或者您會(huì)用哪些關(guān)鍵詞來(lái)描述?
李宏宇:近年來(lái),我國(guó)的金融科技發(fā)展在國(guó)際上算是領(lǐng)先,但也面臨著“野蠻生長(zhǎng)”的問(wèn)題,現(xiàn)在已經(jīng)到了要收緊、趨嚴(yán)監(jiān)管的狀態(tài)了。這個(gè)狀態(tài)下,一些金融公司的自有數(shù)據(jù)明顯不能夠支撐智能化升級(jí),它們就面臨著生存的壓力。
比如貸前審核,如果風(fēng)控模型做得不夠好,就會(huì)產(chǎn)生一系列隱患,它們一定希望開放,但同時(shí)安全隱患要消除。最后結(jié)果一定是通過(guò)技術(shù)來(lái)實(shí)現(xiàn)安全和開放的融合。
在研究層面上,模型算法可能并不是最關(guān)鍵的,應(yīng)用落地、解決問(wèn)題才是。人工智能也好,創(chuàng)新性的安全算法研究也好,其實(shí)都會(huì)不斷更新,但我認(rèn)為這都不會(huì)是行業(yè)里的主題,主題應(yīng)該還是安全、開放和融合。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。