0
本文作者: 李雨晨 | 2021-07-31 12:15 |
滴滴在美“低調(diào)”上市之后,國家網(wǎng)信辦的安全審查接踵而至,數(shù)據(jù)主權(quán)和安全的決心不言而喻。長(zhǎng)久以來,互聯(lián)網(wǎng)平臺(tái)和用戶之間似乎達(dá)成某種共識(shí):享受免費(fèi)服務(wù),就應(yīng)該提供數(shù)據(jù)。而這種共識(shí),也帶來信息泄露的風(fēng)險(xiǎn)。
去年,關(guān)于數(shù)據(jù)隱私保護(hù)的監(jiān)管進(jìn)程像被按下了快進(jìn)鍵。多項(xiàng)法案陸續(xù)出臺(tái),要求企業(yè)在數(shù)據(jù)應(yīng)用過程中使用脫敏、加密等技術(shù)提高安全級(jí)。
然而,有人擔(dān)心“嚴(yán)令”會(huì)對(duì)企業(yè)經(jīng)營產(chǎn)生不可逆的影響。工信部電子五所高級(jí)工程師、區(qū)塊鏈創(chuàng)新團(tuán)隊(duì)負(fù)責(zé)人相里朋表示,“數(shù)據(jù)的核心價(jià)值是流通,只有在流通的情況下,數(shù)據(jù)價(jià)值才會(huì)被放大?!?/p>
這種情況下,如何實(shí)現(xiàn)只輸出數(shù)據(jù)結(jié)果而不輸出數(shù)據(jù)本身?拋開企業(yè)的“自我道德約束”,隱私計(jì)算成為一個(gè)技術(shù)“更優(yōu)解”,相關(guān)概念的產(chǎn)品呈現(xiàn)爆發(fā)式的增長(zhǎng)態(tài)勢(shì)。
與此同時(shí),7月13日,Gartner發(fā)布了隱私計(jì)算的技術(shù)成熟度曲線-2021版本, 而今年加入"技術(shù)成熟度曲線"的是聯(lián)邦學(xué)習(xí)和主權(quán)云。
Gartner指出,到2024年,隱私驅(qū)動(dòng)的數(shù)據(jù)保護(hù)和合規(guī)技術(shù)支出將在全球突破150億美元以上。本文將會(huì)圍繞隱私計(jì)算江湖的演變,探討人工智能時(shí)代下的數(shù)據(jù)之道。
去年,Gartner發(fā)布2021年需要深挖的9項(xiàng)重要戰(zhàn)略科技趨勢(shì),其中隱私增強(qiáng)計(jì)算成為企業(yè)機(jī)構(gòu)需要深挖的9項(xiàng)重要戰(zhàn)略科技趨勢(shì)之一。
但是,隱私計(jì)算并不是一個(gè)“新鮮事物”,其歷史最早可以追溯到1979年的秘密分享,當(dāng)時(shí)由Shamir和Blakley提出。1982年和1986年,國內(nèi)姚期智院士提出了安全多方計(jì)算和混淆電路。
進(jìn)入21世紀(jì),圍繞隱私計(jì)算的理論幾乎是以每三年為一個(gè)周期進(jìn)行更新。
因此,隱私計(jì)算其實(shí)是一堆“數(shù)據(jù)可用不可見”的技術(shù)集合。 在騰訊發(fā)表的《隱私計(jì)算白皮書2021》中,給隱私計(jì)算下了一個(gè)定義:
隱私計(jì)算(Privacy Computing)是一種由兩個(gè)或多個(gè)參與方聯(lián)合計(jì)算的技術(shù)和系統(tǒng),參與方在不泄露各自數(shù)據(jù)的前提下通過協(xié)作對(duì)他們的數(shù)據(jù)進(jìn)行聯(lián)合機(jī)器學(xué)習(xí)和聯(lián)合分析。
從技術(shù)機(jī)制來看,隱私計(jì)算主要分為三大技術(shù)路線,即安全多方計(jì)算(密碼學(xué))、聯(lián)邦學(xué)習(xí)及可信計(jì)算環(huán)境。
行業(yè)里,有人喜歡將隱私計(jì)算以“江湖門派”的形式進(jìn)行分類,便于理解:
安全多方計(jì)算(MPC)是少林派,歷史悠久,功力深厚,最早可以追溯到上世紀(jì)80年代,有秘密共享、傳輸混淆電路等一些非常強(qiáng)大的獨(dú)門武器。
華山派,可信計(jì)算環(huán)境(TEE)。通過硬件技術(shù)來對(duì)數(shù)據(jù)進(jìn)行隔離保護(hù),以Intel等廠商為代表,國內(nèi)包括螞蟻金服、翼方健數(shù)等公司將之集成到自己的隱私計(jì)算平臺(tái)。
聯(lián)邦學(xué)習(xí)是隱私計(jì)算的后起之秀,就像武當(dāng)派張三豐師出少林一樣,聯(lián)邦學(xué)習(xí)結(jié)合密碼學(xué)和分布式計(jì)算,實(shí)現(xiàn)了多方協(xié)作的機(jī)器學(xué)習(xí),在人工智能領(lǐng)域開辟了新天地。
除此之外,還有像盲簽名、隱私信息檢索、零知識(shí)證明等這些相對(duì)更小的密碼學(xué)協(xié)議分支,同樣非常有用,好比泰山派、峨眉派,它們共同組成了豐富多彩的隱私計(jì)算江湖。
盡管流派眾多,但是隱私計(jì)算真正成為“現(xiàn)象級(jí)”話題,還是在近幾年。
隱私計(jì)算的發(fā)展驅(qū)動(dòng)力,很大一部分來自外部的監(jiān)管環(huán)境(因?yàn)?018年3月的數(shù)據(jù)濫用丑聞,F(xiàn)acebook 被罰了50億美元)。各國政府越發(fā)趨嚴(yán)的監(jiān)管力度,從某種程度推動(dòng)了隱私計(jì)算的市場(chǎng)擴(kuò)張。
而在大數(shù)據(jù)、人工智能越發(fā)深入行業(yè)的時(shí)代大背景下,如何在滿足數(shù)據(jù)隱私、安全和監(jiān)管的前提下,設(shè)計(jì)一個(gè)機(jī)器學(xué)習(xí)框架,讓人工智能更高效、更準(zhǔn)確的共同使用各方數(shù)據(jù)成為了研究的核心,聯(lián)邦學(xué)習(xí)應(yīng)運(yùn)而生。
同盾科技人工智能研究院院長(zhǎng)李曉林教授就坦言,“TEE和MPC天然地、不是特別適合目前AI的場(chǎng)景需求。而聯(lián)邦學(xué)習(xí)天然適合分布式學(xué)習(xí),因此優(yōu)勢(shì)比較大?!?/p>
(推薦閱讀:《同盾AI研究院深度學(xué)習(xí)首席專家李宏宇:解構(gòu)知識(shí)聯(lián)邦,開創(chuàng)數(shù)據(jù)“可用不可見”新局面》)
微眾銀行首席AI官楊強(qiáng)教授舉例說到,MPC一直保留在學(xué)術(shù)界,它的理論很美,設(shè)想確實(shí)是從根本解決問題,但是它能解決的是比較底層的精確計(jì)算和數(shù)據(jù)庫查詢。一旦涉及到模型層面,使用MPC的速度相比不用最少要慢上一萬倍。
這是因?yàn)椋琓EE和MPC都是面向通用計(jì)算模式,但聯(lián)邦學(xué)習(xí)是專門針對(duì)機(jī)器學(xué)習(xí)模型訓(xùn)練這個(gè)場(chǎng)景設(shè)計(jì)優(yōu)化。機(jī)器學(xué)習(xí)訓(xùn)練分布式化后天然具備隱私保護(hù)的特點(diǎn),可以比較容易地做到“原始數(shù)據(jù)不動(dòng),模型動(dòng)”。
但是,楊強(qiáng)教授也補(bǔ)充道,機(jī)器學(xué)習(xí)本身是復(fù)雜模型的近似計(jì)算,雖然聯(lián)邦學(xué)習(xí)已經(jīng)進(jìn)入非常實(shí)用的階段。但是,也要明確和其他方法的區(qū)別——它是用來做近似計(jì)算。
“對(duì)于隱私計(jì)算行業(yè),我們期待有一個(gè)囊括全盤的載體,可以理解為App Store,大家可以根據(jù)不同的需求去選擇用TEE/MPC/聯(lián)邦學(xué)習(xí),或者是三種方法的混合?!?/p>
2018年,在楊強(qiáng)教授擔(dān)任首席AI官的情況下,微眾銀行正式開展了聯(lián)邦學(xué)習(xí)研究,內(nèi)部投入百余人。到了2020年,微眾AI團(tuán)隊(duì)透露已申請(qǐng)100+項(xiàng)相關(guān)專利,牽頭推進(jìn)IEEE聯(lián)邦學(xué)習(xí)國際標(biāo)準(zhǔn)與聯(lián)邦學(xué)習(xí)國家標(biāo)準(zhǔn)制定。
(推薦閱讀:《微眾銀行首席AI官楊強(qiáng):萬字圖文詳談聯(lián)邦學(xué)習(xí)最前沿》)
此后,各大廠商也積極布局聯(lián)邦學(xué)習(xí),如平安的聯(lián)邦智能、螞蟻金服的共享智能、同盾科技與知識(shí)聯(lián)邦、京東數(shù)科與異步聯(lián)邦學(xué)習(xí)、百度與聯(lián)邦深度學(xué)習(xí)PaddleFL。
此外,面向金融行業(yè)的富數(shù)科技、星云Clustar,面向醫(yī)療行業(yè)的醫(yī)渡云、翼方健數(shù)等廠商的進(jìn)入,讓聯(lián)邦學(xué)習(xí)成為當(dāng)下隱私計(jì)算最重要的分支。
從去年以來,隱私計(jì)算的勢(shì)頭大火。
星云Clustar副總裁許振主管星云隱私計(jì)算技術(shù)的場(chǎng)景落地。他向雷鋒網(wǎng)表示,今年以來,一些銀行隱私計(jì)算技術(shù)底座的一期項(xiàng)目投入多則可以達(dá)到數(shù)百萬。
與之對(duì)應(yīng)的,2019年到2020年初時(shí),隱私計(jì)算賽道只有幾家競(jìng)爭(zhēng)者?!斑@本來是很小眾的市場(chǎng),但今年入局的廠商已飆升到上百家。”
當(dāng)下來看,隱私計(jì)算的發(fā)展已漸入佳境,但是,一個(gè)行業(yè)的“拓荒時(shí)代”勢(shì)必會(huì)帶來一些新的命題。對(duì)于隱私計(jì)算而言,缺乏統(tǒng)一的標(biāo)準(zhǔn),各平臺(tái)的技術(shù)實(shí)現(xiàn)也不相同,不同技術(shù)平臺(tái)所托管的數(shù)據(jù)在實(shí)際應(yīng)用中無法跨平臺(tái)交互,“數(shù)據(jù)孤島”問題逐漸演化成了“平臺(tái)孤島”。
面對(duì)這個(gè)頗有些“難解”的問題,平安蜂巢平臺(tái)負(fù)責(zé)人王健宗博士認(rèn)為,當(dāng)前亟需制定聯(lián)邦學(xué)習(xí)平臺(tái)相關(guān)標(biāo)準(zhǔn),建立隱私計(jì)算的框架規(guī)范,對(duì)聯(lián)邦學(xué)習(xí)平臺(tái)的參與角色、網(wǎng)絡(luò)模型、認(rèn)證要求、管控要求、計(jì)算要求等進(jìn)行約定。
“我們?cè)敢饴?lián)合其他平臺(tái)與技術(shù)方共同定義行業(yè)的標(biāo)準(zhǔn)化接口,推出隱私計(jì)算的計(jì)算協(xié)議、建模協(xié)議、傳輸協(xié)議,促進(jìn)各個(gè)隱私計(jì)算平臺(tái)間真正互聯(lián)互通?!?/p>
與此同時(shí),希望更多研究機(jī)構(gòu)與企業(yè)加入隱私計(jì)算前沿技術(shù)的研發(fā)中心,例如,如何利用同態(tài)加密進(jìn)行比較計(jì)算,以及如何兼容其它加密算法等實(shí)際問題。
(推薦閱讀:《平安科技副總工程師王健宗:聯(lián)邦智能的突圍與應(yīng)用之道》)
富數(shù)科技合伙人、解決方案總監(jiān)黃奉孝也表示,互聯(lián)互通是國內(nèi)隱私計(jì)算發(fā)展必然會(huì)面對(duì)的挑戰(zhàn),異構(gòu)平臺(tái)在技術(shù)互通協(xié)議棧的統(tǒng)一是能不能互通的關(guān)鍵。但是,廠商各自的商業(yè)考量也許是阻礙異構(gòu)平臺(tái)之間互聯(lián)互通的根結(jié)。
“我很喜歡舉在線會(huì)議軟件的例子,會(huì)出現(xiàn)只安裝騰訊會(huì)議就可以和釘釘、zoom同臺(tái)聊天的那一天嗎?我不知道。”
事實(shí)上,為了更好地制定和驗(yàn)證聯(lián)邦學(xué)習(xí)行業(yè)標(biāo)準(zhǔn),富數(shù)科技已經(jīng)和微眾銀行等機(jī)構(gòu)在北京金融科技產(chǎn)業(yè)聯(lián)盟的指導(dǎo)下進(jìn)行分階段的實(shí)踐。
黃奉孝認(rèn)為,異構(gòu)平臺(tái)的統(tǒng)一互聯(lián)互通協(xié)議需要更多的廠商來參與,特別是對(duì)軟件內(nèi)核具有自主可控能力的廠商。另外,作為標(biāo)準(zhǔn)制定單位需要加快推進(jìn)落實(shí),具體的協(xié)議可以考慮從數(shù)據(jù)資源、從算法協(xié)議等等維度,循序漸進(jìn)。
(推薦閱讀:《富數(shù)科技安全計(jì)算首席專家卞陽:隱私計(jì)算江湖與聯(lián)邦學(xué)習(xí)的「上帝視角」》)
醫(yī)渡云的首席架構(gòu)師蔣錦鵬也表示,解決平臺(tái)孤島的問題,首先技術(shù)標(biāo)準(zhǔn)要先行。從2018年開始,國家大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(huì)TC-601在牽頭相關(guān)單位共同編寫隱私計(jì)算互聯(lián)互通標(biāo)準(zhǔn),醫(yī)渡云也參與其中。
今年3月,北京市政府主導(dǎo)成立了北京國際大數(shù)據(jù)交易所,將采用隱私計(jì)算、區(qū)塊鏈等技術(shù)作為數(shù)據(jù)流通的底層技術(shù)保障。
此外,人民銀行主導(dǎo)了《聯(lián)邦學(xué)習(xí)技術(shù)金融應(yīng)用規(guī)范-技術(shù)要求》、《聯(lián)邦學(xué)習(xí)技術(shù)金融應(yīng)用規(guī)范-互聯(lián)互通》、《聯(lián)邦學(xué)習(xí)技術(shù)白皮書》、《多方安全計(jì)算金融應(yīng)用現(xiàn)狀及實(shí)施指引》、《金融行業(yè)隱私計(jì)算技術(shù)與應(yīng)用研究》等行業(yè)標(biāo)準(zhǔn)的起草和編寫。
這些對(duì)于隱私計(jì)算和聯(lián)邦學(xué)習(xí)來說,至關(guān)重要。
除了國家政策的頂層設(shè)計(jì)之外,行業(yè)的生態(tài)仍然需要各家廠商積極搭建。
下游業(yè)主,也就是數(shù)據(jù)使用方使用聯(lián)邦學(xué)習(xí)的唯一目的就是進(jìn)行數(shù)據(jù)融合、數(shù)據(jù)合規(guī)。技術(shù)平臺(tái)隱私化后,上游數(shù)據(jù)進(jìn)來后涉及到一個(gè)對(duì)接的問題。因此,在星云Clustar副總裁許振看來,這個(gè)過程是一個(gè)“市場(chǎng)占有率”說話的問題,誰的技術(shù)占有率更高、互聯(lián)互通能力更高,誰將擁有更多的話語權(quán)。
“我們可以看到,F(xiàn)ATE的占有率比較高,閉源軟件的占有率較低,推進(jìn)起來也比較麻煩。而且,從甲方的反饋來看,對(duì)FATE的認(rèn)可也是相當(dāng)高的?!?/p>
許振所說的FATE是指微眾銀行在2019年推出的工業(yè)級(jí)開源框架。
FATE整體架構(gòu)
楊強(qiáng)教授曾表示,“聯(lián)邦學(xué)習(xí)像一個(gè)操作系統(tǒng),你自己玩是不行的,它的特點(diǎn)是多方合作,只有多方都認(rèn)可,才有機(jī)會(huì)做起來?!?/p>
并且,楊強(qiáng)教授也表明了微眾聯(lián)邦學(xué)習(xí)開源的邏輯:既然是多方協(xié)作的框架,那么就必須說明它的安全性與保密性,并且各方都能快速對(duì)其進(jìn)行驗(yàn)證,這是閉源軟件辦不到的。
為了連接不同組織機(jī)構(gòu)間的數(shù)據(jù),使數(shù)據(jù)得到更大的應(yīng)用價(jià)值,2019年2月,微眾銀行AI部門開源了聯(lián)邦學(xué)習(xí)框架FATE,這是首個(gè)開源的聯(lián)邦學(xué)習(xí)工業(yè)級(jí)框架,并于2019年6月捐獻(xiàn)給Linux基金會(huì),同時(shí)成立FATE TSC對(duì)FATE社區(qū)進(jìn)行開源治理。
目前,F(xiàn)ATE開源社區(qū)已匯聚了800多家企業(yè)、300多所高校等科研機(jī)構(gòu)的開發(fā)者,是國內(nèi)最大的聯(lián)邦學(xué)習(xí)開源社區(qū)。
當(dāng)然,除了FATE以外,目前還有谷歌開源的TensorFlow Federated,和百度開源的PaddleFL。
(推薦閱讀:《百度「聯(lián)邦學(xué)習(xí)」戰(zhàn)略全布局丨萬字長(zhǎng)文》)
在雷鋒網(wǎng)與一些開發(fā)者的調(diào)研中,能夠明顯感受到FATE目前的領(lǐng)先身位。
融數(shù)聯(lián)智的開源架構(gòu)總監(jiān)花京華表示,目前用FATE較多,算法組件在功能層面覆蓋大部分場(chǎng)景,擴(kuò)展性也很好,業(yè)界認(rèn)可度高,不過在性能上和資源占用上還可以進(jìn)行更多優(yōu)化。相比之下,PaddleFL框架比較重,要跑起來更困難。
花京華的開源架構(gòu)團(tuán)隊(duì)主要是縱向聯(lián)邦學(xué)習(xí)場(chǎng)景,Tensorflow Federated用的不多,更多是參考和學(xué)習(xí)。他表示,目前也在準(zhǔn)備用Rosetta來實(shí)現(xiàn)MPC方案的聯(lián)邦學(xué)習(xí),這個(gè)框架非常輕量,易用性高。
在花京華看來,自己對(duì)聯(lián)邦學(xué)習(xí)框架最核心的訴求有三點(diǎn):一、穩(wěn)定(框架設(shè)計(jì)穩(wěn)定、算法性能和工程性能穩(wěn)定);二、靈活易用,能在較少配置情況下很快在本機(jī)將demo跑起來,另外可以較好的擴(kuò)展并與其他框架兼容;三,算法豐富度。
上海電信理想的李學(xué)軍沒有使用過谷歌開源的TensorFlow Federated,和百度開源的PaddleFL,他對(duì)FATE框架的最大訴求就是進(jìn)一步提升性能。
此外,有一些較為常見的測(cè)試FATE有相關(guān)的整理文檔,但使用者對(duì)此了解較少。這也是未來FATE需要進(jìn)一步提升的點(diǎn)。
當(dāng)然,開源的聯(lián)邦學(xué)習(xí)不會(huì)“一勞永逸”。
首先,創(chuàng)新工場(chǎng)南京人工智能研究院執(zhí)行院長(zhǎng)馮霽曾向雷鋒網(wǎng)表示,在聯(lián)邦學(xué)習(xí)的分布式場(chǎng)景下,安全的問題更加需要研究,因?yàn)楣粽吖舻目赡芨唷?/strong>
“比如攻擊者所了解的先驗(yàn)知識(shí)會(huì)更多,要么是知道某一方的數(shù)據(jù),要么知道某一方的模型。不需要知道所有方的數(shù)據(jù)和模型,攻擊者就能做出攻擊。
他補(bǔ)充到,“安全防御,是一件非常困難的事情。做一個(gè)壞人很容易,做好人卻很難?!?/p>
(推薦閱讀:《創(chuàng)新工場(chǎng)南京人工智能研究院執(zhí)行院長(zhǎng)馮霽:聯(lián)邦學(xué)習(xí)中的安全問題》)
其次,由于分布式參與節(jié)點(diǎn)計(jì)算能力不一致、網(wǎng)絡(luò)連接狀態(tài)不穩(wěn)定、數(shù)據(jù)通信非獨(dú)立分布等因素,通信效率將成為聯(lián)邦學(xué)習(xí)應(yīng)用的瓶頸之一。
這些是聯(lián)邦學(xué)習(xí)這個(gè)生態(tài)里面,每一個(gè)建設(shè)者都難以回避的問題。
不過,亞當(dāng)·斯密曾經(jīng)在《國富論》的開頭強(qiáng)調(diào)過,分工是促進(jìn)勞動(dòng)生產(chǎn)率提高的最重要?jiǎng)恿?。作為一種協(xié)作形式,“開源”顯然為斯密的這一論斷提供了最好的證據(jù),也是生態(tài)構(gòu)建的一條必經(jīng)之路。
一個(gè)客觀事實(shí)是,以聯(lián)邦學(xué)習(xí)為代表的隱私計(jì)算在金融領(lǐng)域的應(yīng)用更為迅速。
原因在于,金融行業(yè)是數(shù)據(jù)密集型行業(yè),但同時(shí),金融行業(yè)數(shù)據(jù)也需要其他行業(yè)數(shù)據(jù),例如互聯(lián)網(wǎng)行業(yè)數(shù)據(jù),來補(bǔ)充完善自身的客戶數(shù)據(jù)畫像。
其次,金融行業(yè)的數(shù)字化程度較高,硬件基礎(chǔ)設(shè)施能力強(qiáng)??梢酝ㄟ^利用GPU等計(jì)算芯片提高算力,同時(shí)結(jié)合5G技術(shù)、邊緣計(jì)算來加速各節(jié)點(diǎn)的通信效率。
通過結(jié)合金融行業(yè)的硬件資源優(yōu)勢(shì)與算子層的優(yōu)化,由平安集團(tuán)聯(lián)營公司金融壹賬通與旗下平安科技聯(lián)合研發(fā)的蜂巢平臺(tái)達(dá)到了提速50%的效果,同時(shí)在反洗錢等場(chǎng)景,平安的蜂巢平臺(tái)落地了自研的聯(lián)邦圖算法。“相對(duì)于其他仍依賴于傳統(tǒng)數(shù)據(jù)存儲(chǔ)的行業(yè),在金融行業(yè)首先應(yīng)用聯(lián)邦學(xué)習(xí)是較好的選擇?!?/p>
目前,金融壹賬通實(shí)現(xiàn)了聯(lián)邦學(xué)習(xí)在一些場(chǎng)景的落地使用,包括構(gòu)建金融行業(yè)聯(lián)邦圖,應(yīng)用于多方聯(lián)合反洗錢與融資擔(dān)保關(guān)系鏈查詢等場(chǎng)景。金融壹賬通還將聯(lián)邦學(xué)習(xí)應(yīng)用于監(jiān)管科技領(lǐng)域,解決了分業(yè)監(jiān)管模式下金融數(shù)據(jù)的隱私性和孤立性問題,充分激活數(shù)據(jù)價(jià)值。
聯(lián)邦圖在金融場(chǎng)景的應(yīng)用,來源:金融壹賬通
星云Clustar副總裁許振也認(rèn)為,“銀行是一個(gè)非常大的存量市場(chǎng),這個(gè)存量市場(chǎng)要維系下去,聯(lián)邦學(xué)習(xí)是它唯一的方案。”
(推薦閱讀:《星云Clustar首席科學(xué)家胡水海:GPU在聯(lián)邦機(jī)器學(xué)習(xí)中的探索》)
而在場(chǎng)景應(yīng)用實(shí)踐上,聯(lián)邦學(xué)習(xí)在金融范疇的運(yùn)營會(huì)更加廣泛,比如聯(lián)合精準(zhǔn)營銷、信貸聯(lián)合風(fēng)控、貸后資金監(jiān)控、聯(lián)合反欺詐、聯(lián)合反電信詐騙、聯(lián)合反洗錢、供應(yīng)鏈金融等等,似乎聯(lián)邦學(xué)習(xí)可以解決大部分涉及到跨機(jī)構(gòu)數(shù)據(jù)協(xié)作的金融業(yè)務(wù)。
從微眾銀行的進(jìn)度來看,目前聯(lián)邦學(xué)習(xí)主要應(yīng)用在風(fēng)控和營銷兩大場(chǎng)景。微眾銀行表示,風(fēng)控場(chǎng)景的落地(包括反欺詐)會(huì)更多,超過80%。
除此之外,楊強(qiáng)教授透露,微眾銀行可以幫客戶用聯(lián)邦學(xué)習(xí)降低貸款業(yè)務(wù)的壞賬率。 此外,在交叉營銷(Cross Sale)、挖掘已有客戶的新的購買力、以人臉識(shí)別為特征的智慧城市建設(shè)、無人車的場(chǎng)景模擬等方面都有不錯(cuò)的成果。
金融行業(yè)沒有太多的外部用戶特征,而另一個(gè)“以數(shù)據(jù)為生命”的行業(yè)則與之相反。每一家醫(yī)院都有針對(duì)一個(gè)用戶較為全面的數(shù)據(jù), 但是每一家醫(yī)院的人群、??撇灰粯?。因此,醫(yī)院之間的數(shù)據(jù)流通更像是一種橫向聯(lián)邦。
楊強(qiáng)教授表示,“市面上已經(jīng)有一些大數(shù)據(jù)廠商開始利用聯(lián)邦學(xué)習(xí)進(jìn)行醫(yī)療多中心的聯(lián)合建模,這是非常好的趨勢(shì)。”
醫(yī)渡云首席架構(gòu)師蔣錦鵬就表示,現(xiàn)在醫(yī)渡云推出了基于安全計(jì)算的多中心科研平臺(tái)產(chǎn)品。在產(chǎn)品部署實(shí)施方面比較容易,不需要客戶做大量配合工作。
主要的前期準(zhǔn)備工作在于,需要和客戶一起明確用聯(lián)邦學(xué)習(xí)做什么,建一個(gè)什么疾病領(lǐng)域的平臺(tái),邀請(qǐng)哪些醫(yī)院共同參與,未來跑哪些業(yè)務(wù)。另一個(gè)主要前期工作是數(shù)據(jù)治理。
“我們知道機(jī)器學(xué)習(xí)建模需要高質(zhì)量、標(biāo)準(zhǔn)化的數(shù)據(jù),而醫(yī)院原始數(shù)據(jù)往往非常分散、非結(jié)構(gòu)化、非標(biāo)準(zhǔn)化,需要經(jīng)過專業(yè)地加工處理后才有可能產(chǎn)出有意義高價(jià)值的成果,否則只能garbage-in garbage-out (垃圾進(jìn),垃圾出)?!?/p>
當(dāng)然,在實(shí)踐中,這些廠商的一線工作者們也發(fā)現(xiàn)了“理想”與“現(xiàn)實(shí)”之間的界限。
比如,醫(yī)院之間的互聯(lián)網(wǎng)絡(luò)條件一般較差,影響了多方安全計(jì)算的性能,如何對(duì)通信和性能進(jìn)行優(yōu)化。另外,醫(yī)院之間對(duì)研究的貢獻(xiàn)如何客觀度量。這些方面,醫(yī)渡云正在和清華大學(xué)等高校開展合作研究?jī)?yōu)化。
平安蜂巢平臺(tái)在落地聯(lián)邦學(xué)習(xí)的過程中發(fā)現(xiàn)了兩個(gè)問題:第一個(gè)是“數(shù)據(jù)確權(quán)”與數(shù)據(jù)價(jià)值評(píng)估的問題。具體來說,就是如何在數(shù)據(jù)不可見的情況下,進(jìn)行數(shù)據(jù)價(jià)值判斷與商業(yè)定價(jià)。
同時(shí),隱私計(jì)算的數(shù)據(jù)定價(jià)也要與根據(jù)查詢數(shù)據(jù)條數(shù)計(jì)費(fèi)的傳統(tǒng)模式有所區(qū)分。作為數(shù)據(jù)需求方的業(yè)務(wù)客戶,更加希望可以通過隱私計(jì)算技術(shù)應(yīng)用降低數(shù)據(jù)購買成本,從而為業(yè)務(wù)帶來新的亮點(diǎn)與價(jià)值。
因此,隱私計(jì)算需要對(duì)傳統(tǒng)的數(shù)據(jù)購買進(jìn)行商業(yè)邏輯變革,從根本上優(yōu)化數(shù)據(jù)合作的商業(yè)定價(jià),激活金融數(shù)據(jù)的潛在價(jià)值。
蜂巢平臺(tái)負(fù)責(zé)人認(rèn)為,“維持與傳統(tǒng)形式相同的數(shù)據(jù)定價(jià)模式,將不利于隱私計(jì)算的行業(yè)技術(shù)發(fā)展。”
另一個(gè)挑戰(zhàn)是密碼學(xué)在隱私計(jì)算實(shí)踐中的應(yīng)用,在實(shí)際應(yīng)用中會(huì)有很大性能挑戰(zhàn)。因此,需要更多的高校和研究機(jī)構(gòu)投入密碼學(xué)的研發(fā)當(dāng)中,共同推進(jìn)隱私計(jì)算行業(yè)的技術(shù)應(yīng)用與落地。
與傳統(tǒng)的土地、勞動(dòng)、技術(shù)等一樣,數(shù)據(jù)已是生產(chǎn)要素之一,成為一種新型社會(huì)生產(chǎn)力,越來越多的業(yè)務(wù)場(chǎng)景需要多方數(shù)據(jù)的流通和共享。在《國家數(shù)據(jù)安全法》頒布后,聯(lián)邦學(xué)習(xí)、隱私計(jì)算更加凸顯價(jià)值。
今年,針對(duì)隱私計(jì)算的招標(biāo)采購已經(jīng)普遍開始,隱私計(jì)算已經(jīng)到了開始真正嘗試規(guī)?;瘧?yīng)用的階段。對(duì)于有一定技術(shù)產(chǎn)品實(shí)力的企業(yè)來說,技術(shù)的競(jìng)爭(zhēng)天花板只會(huì)越來越小,行業(yè)的垂直細(xì)分應(yīng)用會(huì)越來越大。
數(shù)據(jù)中心與數(shù)據(jù)中心的聯(lián)邦學(xué)習(xí)會(huì)成為數(shù)據(jù)開放流通的主流模式,設(shè)備之間的橫向聯(lián)邦學(xué)習(xí),會(huì)隨著手機(jī)智能設(shè)備、無人駕駛、工業(yè)設(shè)備等場(chǎng)景開始遍地開花。
在楊強(qiáng)教授看來,聯(lián)邦學(xué)習(xí)不是一套簡(jiǎn)單的算法,而是一個(gè)大數(shù)據(jù)生態(tài)的操作系統(tǒng)。從操作系統(tǒng)的角度來看,首先要安全,其次是效率,第三是參與者生態(tài)。這些都還沒有建立起來,所以行業(yè)遠(yuǎn)沒到成熟的地步。
“聯(lián)邦學(xué)習(xí)、隱私計(jì)算沒有過熱,這里面可能會(huì)出現(xiàn)下一個(gè)Windows。未來,我也期待有更多的廠商使用隱私計(jì)算,甚至像每臺(tái)電腦上的‘Intel Inside’一樣,在自己的產(chǎn)品上打上‘隱私計(jì)算 Inside’,隱私計(jì)算將成為一種商業(yè)轉(zhuǎn)化的核心競(jìng)爭(zhēng)力。我期待,這將會(huì)是一個(gè)范式(paradigm)的改變?!?/p>
黃奉孝的一句話,讓人印象深刻:等隱私計(jì)算技術(shù)發(fā)展到向今天的hadoop技術(shù)生態(tài)的成熟度后,我猜測(cè)“安全即業(yè)務(wù)”會(huì)到來。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。