0
本文作者: 李揚(yáng)霞 | 2021-12-20 11:21 | 專題:GAIR 2021 |
【雷峰網(wǎng)】2021年12月9日-2021年12月11日,2021第六屆全球人工智能大會(huì)(GAIR 2021)于深圳開幕。本屆大會(huì)由粵港澳大灣區(qū)人工智能與機(jī)器人聯(lián)合會(huì)、雷峰網(wǎng)聯(lián)合主辦,深圳市人工智能與機(jī)器人研究院、深圳市機(jī)器人協(xié)會(huì)、深圳市人工智能學(xué)會(huì)支持。
作為中國最具影響力和前瞻性的前沿科技活動(dòng)之一, GAIR 大會(huì)已經(jīng)度過了五次精彩而又輝煌的歷程。
大會(huì)第二天,以《直面數(shù)據(jù)安全風(fēng)險(xiǎn)和挑戰(zhàn);挖掘隱私計(jì)算的100%可為》為主題的“數(shù)據(jù)安全與隱私計(jì)算”分論壇吸引了來自全國各地的專家、學(xué)者、企業(yè)家、投資人等,大家齊聚一堂共話新時(shí)代下“數(shù)據(jù)安全與隱私計(jì)算”的當(dāng)下與未來。
其中同盾科技合伙人兼人工智能研究院院長(zhǎng)、中科院醫(yī)學(xué)所首席教授李曉林帶來了題為「知識(shí)聯(lián)邦——打造基于隱私計(jì)算的共享智能平臺(tái)」的精彩演講。演講要點(diǎn)可概括為以下幾個(gè)方面:
政策法規(guī)對(duì)于數(shù)據(jù)安全和隱私保護(hù)的合規(guī)性要求進(jìn)一步加劇了數(shù)據(jù)孤島效應(yīng),成為數(shù)據(jù)共享瓶頸。數(shù)據(jù)的價(jià)值沒有充分發(fā)揮。數(shù)據(jù)也同樣有時(shí)間價(jià)值,要實(shí)現(xiàn)價(jià)值就必須通過時(shí)間和空間上安全合規(guī)的流通。
實(shí)現(xiàn)知識(shí)的共享互通機(jī)制來充分發(fā)揮數(shù)據(jù)的價(jià)值,首要問題是保障一致性。包括數(shù)據(jù)、內(nèi)容一致性和連接上的一致性。
為了真正實(shí)現(xiàn)打破數(shù)據(jù)孤島,同盾科技打造了基于隱私計(jì)算的開放共享平臺(tái)。核心是智邦平臺(tái)iBond,下層是智邦的內(nèi)核iCore。
知識(shí)聯(lián)邦是一個(gè)統(tǒng)一的多層次框架,從信息層、模型層、認(rèn)知層到認(rèn)知層,融合了多種安全多方功能,比如基于數(shù)據(jù)安全交換協(xié)議FLEX等等,有效利用多個(gè)參與方的協(xié)議標(biāo)準(zhǔn),真正實(shí)現(xiàn)數(shù)據(jù)可用不可見,知識(shí)共創(chuàng)和共享。
打造全面互聯(lián)互通參考模型FIRM模型。這是一個(gè)多層次的互聯(lián)互通參考模型,把互聯(lián)互通分為五個(gè)層次,包括平臺(tái)層、通信層、數(shù)據(jù)交換層、算法層、應(yīng)用層。
基于知識(shí)聯(lián)邦的理論框架、互聯(lián)互通的FIRM模型、智邦平臺(tái)iBond的支撐,近一步打通數(shù)據(jù)流通,那么無論是數(shù)據(jù)的提供方、使用方還是應(yīng)用開發(fā)者、提供方或使用方,都可以在上面發(fā)布數(shù)據(jù)、應(yīng)用模型。使用者可以按使用付費(fèi),實(shí)現(xiàn)價(jià)值變現(xiàn)。
同盾科技的目標(biāo)是想為中國在下一代可信AI引領(lǐng)全球的道路上作出貢獻(xiàn)。
同盾科技合伙人兼人工智能研究院院長(zhǎng)、中科院醫(yī)學(xué)所首席教授李曉林
以下是李曉林演講全文,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))做了不改變?cè)獾恼砼c編輯:
大家好,我是李曉林,來自同盾科技,今天我分享的主題是“知識(shí)聯(lián)邦——打造基于隱私計(jì)算的共享智能平臺(tái)”。我將從建設(shè)這個(gè)平臺(tái)的行業(yè)背景、平臺(tái)的架構(gòu)、平臺(tái)的理論框架和平臺(tái)的應(yīng)用幾個(gè)層面逐一展開解釋。
數(shù)據(jù)隱私保護(hù)已成為各界的關(guān)注重點(diǎn),尤其從最近推出的一系列的法律法規(guī),比如《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》等中可以體現(xiàn)。對(duì)于數(shù)據(jù)安全和隱私保護(hù)的合規(guī)性要求進(jìn)一步加劇了數(shù)據(jù)孤島效應(yīng),成為數(shù)據(jù)共享瓶頸。同時(shí),國家也把數(shù)據(jù)作為一個(gè)重要的新型生產(chǎn)要素,提升到了國家戰(zhàn)略級(jí)別。保護(hù)數(shù)據(jù)和數(shù)據(jù)共享有一定的沖突。數(shù)據(jù)作為一種生產(chǎn)要素和其他生產(chǎn)要素有很大區(qū)別,比如容易失控,保護(hù)更難,而且數(shù)據(jù)的復(fù)制幾乎是零成本。目前數(shù)據(jù)共享的程度比較低,數(shù)據(jù)生命力在各個(gè)孤島上面,價(jià)值沒有充分發(fā)揮。
我們說數(shù)據(jù)是新型“石油”或者新型“貨品”,金融的價(jià)值是空間和時(shí)間上的流通,從銀行貸款是把錢從銀行轉(zhuǎn)到你的口袋里,你用貸款來的錢做一些事情,未來再返還回去,是要付出代價(jià)的,今年的價(jià)值和未來一年后的價(jià)值是有時(shí)間差別的。數(shù)據(jù)也同樣有時(shí)間價(jià)值,要實(shí)現(xiàn)價(jià)值就必須通過時(shí)間和空間上的安全合規(guī)的流通。比如說電力系統(tǒng)有很多用電的數(shù)據(jù),這些數(shù)據(jù)是用來收費(fèi)的,數(shù)據(jù)價(jià)值有用但比較有限。如果我們把它的數(shù)據(jù)價(jià)值充分發(fā)揮出來,用來做企業(yè)信用分析,比如對(duì)企業(yè)經(jīng)營狀況的判斷和參考,價(jià)值就非常大了,而且數(shù)據(jù)價(jià)值是有時(shí)間差別的,去年的企業(yè)用電量和今年的企業(yè)用電量這一數(shù)據(jù)價(jià)值是不一樣的。
為了保護(hù)數(shù)據(jù)隱私,還要發(fā)揮數(shù)據(jù)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)的安全合規(guī)流通。我們已經(jīng)知道業(yè)界推出了一系列的隱私計(jì)算技術(shù)手段,例如多方安全計(jì)算(MPC)、聯(lián)邦學(xué)習(xí)(FL)、可信執(zhí)行環(huán)境(TEE)等等,通過打破數(shù)據(jù)孤島來增強(qiáng)數(shù)據(jù)的流通價(jià)值。而與此同時(shí),隨著各家隱私計(jì)算平臺(tái)的推出,每個(gè)平臺(tái)也是孤立的,又形成了新的數(shù)據(jù)群島。此時(shí)就迫切需要打破平臺(tái)之間群島的壁壘。
要真正實(shí)現(xiàn)知識(shí)的共享互通機(jī)制,從而來充分發(fā)揮數(shù)據(jù)的價(jià)值,首要問題是保障一致性。一致性包括兩個(gè)方面,一個(gè)方面是連接上的一致性,另一方面是數(shù)據(jù)、內(nèi)容的一致性。連接上的一致性包括任務(wù)一致和同時(shí)啟動(dòng),同時(shí)做同一個(gè)任務(wù),計(jì)算節(jié)點(diǎn)一致、狀態(tài)一致。流通內(nèi)容包括參數(shù)、算法、模型,加密的流程、手段、順序等都要一致,以及日志一致,以方便監(jiān)管。
為了真正實(shí)現(xiàn)打破數(shù)據(jù)孤島、數(shù)據(jù)群島,我們打造了基于隱私計(jì)算的開放共享平臺(tái)。核心是智邦平臺(tái)iBond,下層是智邦的內(nèi)核iCore。這一整套系統(tǒng)是基于云原生的平臺(tái),目前有一系列的組件,包括管理數(shù)據(jù)市場(chǎng)i-data、管理應(yīng)用市場(chǎng)SAFE和數(shù)據(jù)沙箱FORT,管理算法市場(chǎng)Caffeine、數(shù)據(jù)安全流通機(jī)制FLEX協(xié)議,以及聯(lián)邦通信框架—離子鍵 Ionic Bond。我們可以看到,FLEX提供了數(shù)據(jù)安全流通的一系列協(xié)議,Caffeine提供了算法算子的算法庫,SAFE提供了API和開發(fā)的SDK。上面是知識(shí)聯(lián)邦的理論框架,從信息層、模型層、認(rèn)知層到認(rèn)知層,全方位的來融合知識(shí)。
知識(shí)聯(lián)邦是一個(gè)統(tǒng)一的多層次框架,融合了多種安全多方功能,比如基于數(shù)據(jù)安全交換協(xié)議等等,有效利用多個(gè)參與方的協(xié)議,真正實(shí)現(xiàn)數(shù)據(jù)可用不可見,知識(shí)共創(chuàng)和共享。
知識(shí)聯(lián)邦的信息層有兩項(xiàng)MPC,做一些安全計(jì)算查詢、密文上的訓(xùn)練。模型層有點(diǎn)像聯(lián)邦學(xué)習(xí),這兩個(gè)和既有的技術(shù)有一些重合,但是從認(rèn)知層和知識(shí)層看,有我們的獨(dú)創(chuàng)性。知識(shí)聯(lián)邦超越了國外的初級(jí)聯(lián)邦學(xué)習(xí),是國產(chǎn)原創(chuàng)引領(lǐng)的一個(gè)可信AI原框架。認(rèn)知層能夠分流知識(shí),這個(gè)知識(shí)本身不會(huì)因?yàn)橐淮涡允褂脕G失,而是能夠傳遞下去,能夠進(jìn)一步進(jìn)行知識(shí)推理、知識(shí)融合、知識(shí)表達(dá)。
我們?yōu)榱酥С指鞣矫娴牧魍ǎ蛲ü铝⒌臄?shù)據(jù)頻道,打通平臺(tái)間的壁壘。去年我們提出了FLEX協(xié)議,這是一整套的開源標(biāo)準(zhǔn)化的聯(lián)邦協(xié)議,是可信AI的HTTPS。HTTP是是因特網(wǎng)上應(yīng)用最為廣泛的一種網(wǎng)絡(luò)傳輸協(xié)議,所有的 WWW 文件都必須遵守這個(gè)標(biāo)準(zhǔn)。我們提出FLEX協(xié)議,也是希望能夠在一個(gè)互聯(lián)互通的標(biāo)準(zhǔn)下去使用數(shù)據(jù),這也是業(yè)內(nèi)首個(gè)聯(lián)邦平臺(tái)的互聯(lián)互通協(xié)議,已經(jīng)開源了,PPT右下角是我們的開源鏈接,我們也發(fā)布了FLEX白皮書。FLEX本身包括一個(gè)應(yīng)用協(xié)議和公共組件,以及各種密碼安全協(xié)議等等。
在此基礎(chǔ)上,我們進(jìn)一步提出全面互聯(lián)互通參考模型FIRM模型。這是一個(gè)多層次的互聯(lián)互通參考模型,把互聯(lián)互通分為五個(gè)層次,包括平臺(tái)層、通信層、數(shù)據(jù)交換層、算法層、應(yīng)用層。比如說平臺(tái)層,我們是智邦iCore內(nèi)核,通信層是智邦Caffeine組件,在通信層數(shù)據(jù)流通的速度是開源的6倍左右。平臺(tái)層是做一些用戶的同步,啟動(dòng)任務(wù)、停止任務(wù)等等。通信層是信息傳輸,是數(shù)據(jù)安全交換,前面已經(jīng)提到了。算法層可以做一些算法的存儲(chǔ)類型及算法延伸。SAFE是場(chǎng)景的產(chǎn)生背景,場(chǎng)景的APE、SDK。
有了互聯(lián)互通,有了iBond,有了智邦平臺(tái)的支撐,有了知識(shí)聯(lián)邦的理論框架,我們就可以進(jìn)一步打通數(shù)據(jù)流通。基于合規(guī)的互聯(lián)互通,我們進(jìn)一步打造出數(shù)據(jù)的要素市場(chǎng),即智邦iData。通過iData可以安全合規(guī)地使用多種多樣的數(shù)據(jù),提升各種模型算法的精度,有一系列可以自主編程、自主建模的輔助工具。下面是iCore,它能夠?qū)崿F(xiàn)公有云、私有云、混合云,支持億級(jí)別乃至十億級(jí)別的數(shù)據(jù),是一站式數(shù)據(jù)安全合規(guī)的市場(chǎng)。
無論是數(shù)據(jù)的提供方、使用方還是應(yīng)用開發(fā)者、提供方或使用方,都可以在上面發(fā)布數(shù)據(jù)、應(yīng)用模型。使用者可以按使用付費(fèi),實(shí)現(xiàn)價(jià)值變現(xiàn)。我們也有一系列按照市場(chǎng)機(jī)制的數(shù)據(jù)定價(jià),或者根據(jù)數(shù)據(jù)貢獻(xiàn)度的判斷來給出合理的價(jià)格。
有了這些平臺(tái)和數(shù)據(jù),我們就可以支持很多應(yīng)用。剛才所說的知識(shí)聯(lián)邦的四個(gè)層次都有豐富的應(yīng)用,例如信息層,我們可以做一些安全合規(guī)的保護(hù)條件的查詢,比如說SQL很簡(jiǎn)單的select,從A和B的數(shù)據(jù),或者兩個(gè)表去合join。對(duì)查詢方也做一些安全措施,例如密語分享、同態(tài)加密等。
上面是模型層,我們可以打通數(shù)據(jù)源和金融機(jī)構(gòu)的數(shù)據(jù),做跨樣本或跨特質(zhì)的聯(lián)邦學(xué)習(xí)。通過運(yùn)營商或電網(wǎng)的數(shù)據(jù)能夠?qū)ζ髽I(yè)征信進(jìn)行豐富描述,更準(zhǔn)確地判斷企業(yè)的運(yùn)營情況,作出合適的風(fēng)控建模和風(fēng)險(xiǎn)評(píng)估。
在認(rèn)知層,可以通過多方預(yù)測(cè)來判斷。例如做反欺詐,有了信息層的多方數(shù)據(jù)融合和計(jì)算,模型層有一些模型的判斷,這時(shí)候從認(rèn)知層的知識(shí)分流提出了分流嵌套特征,作為支撐來更進(jìn)一步提升反欺詐評(píng)分卡,結(jié)合其他征信機(jī)構(gòu)的數(shù)據(jù),一起來做行業(yè)內(nèi)部和行內(nèi)的聯(lián)邦信用風(fēng)險(xiǎn)的模塊,作出最后的判斷。
在知識(shí)層,我們可以通過聯(lián)邦社交推薦來做精準(zhǔn)營銷。例如電商公司A和游戲公司B,或者通過不同的企業(yè)業(yè)主、企業(yè)社交網(wǎng)絡(luò)、企業(yè)高管的社交網(wǎng)絡(luò)來判斷企業(yè)本身的經(jīng)營狀況以及是否存在欺詐團(tuán)伙。
剛才說的知識(shí)聯(lián)邦模型、互聯(lián)互通協(xié)議以及我們的智邦產(chǎn)品和iData要素市場(chǎng),都能夠在私有云、公有云和混合云上做隱私計(jì)算和模型學(xué)習(xí),提高交換的安全性。前面云原生的服務(wù),我們同盾也有豐富的經(jīng)驗(yàn),例如我們的平均響應(yīng)達(dá)到了200毫秒級(jí)別的,已經(jīng)打造了T4級(jí)別的毫秒級(jí)的機(jī)房,可以做到杭州和上海一體雙戶,并注冊(cè)了上萬臺(tái)的虛擬機(jī),日流量超過一億。所以我們有充分的技術(shù)積累和經(jīng)驗(yàn)來支撐復(fù)雜的隱私計(jì)算共享智能平臺(tái)。
同盾科技是智能分析決策的布道者、國產(chǎn)化的開拓者,已經(jīng)服務(wù)了一萬多家企業(yè)客戶,覆蓋了非常多的行業(yè),包括政務(wù)、互聯(lián)網(wǎng)、銀行、保險(xiǎn)等等,積累了豐富的客戶經(jīng)驗(yàn)。我們的目標(biāo)還是比較遠(yuǎn)大的,希望為中國在下一代可信AI方面引領(lǐng)全球作出貢獻(xiàn)。要達(dá)到這個(gè)目標(biāo)需要群策群力,需要社區(qū)一起努力。
所以我們?cè)谌ツ甑娜蛉斯ぶ悄芗夹g(shù)大會(huì)上創(chuàng)立了“知識(shí)聯(lián)邦產(chǎn)學(xué)研聯(lián)盟AKF”,通過企業(yè)、產(chǎn)業(yè)和研究院所、大學(xué),形成知識(shí)聯(lián)盟,企業(yè)的應(yīng)用場(chǎng)景給研究院所,還能夠向?qū)W生和教授團(tuán)隊(duì)提供前沿的技術(shù)方案和智能算法。同時(shí)一些前沿的研究也能夠給企業(yè)帶來新的方向,指引戰(zhàn)略方向、輸出人才。通過AKF和知識(shí)聯(lián)邦,我們希望可以共同打造中國特有的下一代可信AI。目前已經(jīng)有知名的高校和企業(yè)加入我們,我們也歡迎在座各位企業(yè)或者大學(xué)、世界頂尖的研究院所加入我們,共同打造下一代可信AI,為中國下一代可信AI作出貢獻(xiàn)。
下面我來做一個(gè)總結(jié)。同盾的目標(biāo)是做一個(gè)連接器,通過聯(lián)防聯(lián)控的獨(dú)立第三方角色,聯(lián)邦安全交換和充分互聯(lián)互通,來幫助各個(gè)行業(yè)充分發(fā)揮數(shù)據(jù)的價(jià)值,通過人工智能持續(xù)強(qiáng)化學(xué)習(xí),通過前沿算法來支撐智能,同時(shí)開源、開放聯(lián)盟,合作共贏。
謝謝大家!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章