0
本文作者: 李揚(yáng)霞 | 2021-12-23 10:48 | 專(zhuān)題:GAIR 2021 |
【雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))】2021年12月9日-2021年12月11日,2021第六屆全球人工智能大會(huì)(GAIR 2021)于深圳開(kāi)幕。本屆大會(huì)由粵港澳大灣區(qū)人工智能與機(jī)器人聯(lián)合會(huì)、雷峰網(wǎng)聯(lián)合主辦,深圳市人工智能與機(jī)器人研究院、深圳市機(jī)器人協(xié)會(huì)、深圳市人工智能學(xué)會(huì)支持。
作為中國(guó)最具影響力和前瞻性的前沿科技活動(dòng)之一, GAIR 大會(huì)已經(jīng)度過(guò)了五次精彩而又輝煌的歷程,見(jiàn)證數(shù)次潮水的轉(zhuǎn)向,成為目前為止粵港澳大灣區(qū)人工智能領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、工業(yè)和投資領(lǐng)域跨界盛會(huì)。
大會(huì)第二天,以《直面數(shù)據(jù)安全風(fēng)險(xiǎn)和挑戰(zhàn);挖掘隱私計(jì)算的100%可為》為主題的“數(shù)據(jù)安全與隱私計(jì)算”分論壇吸引了來(lái)自全國(guó)各地的專(zhuān)家、學(xué)者、企業(yè)家、投資人等,大家齊聚一堂共話(huà)新時(shí)代下“數(shù)據(jù)安全與隱私計(jì)算”的當(dāng)下與未來(lái)。
其中瑞萊智慧RealAI首席架構(gòu)師徐世真帶來(lái)了題為「隱私計(jì)算助力構(gòu)建AI新基建」的精彩演講。演講要點(diǎn)可概括為以下幾個(gè)方面:
AI和隱私計(jì)算息息相關(guān),隱私計(jì)算是AI能力的重要補(bǔ)充,AI是隱私計(jì)算的核心需求。從場(chǎng)景角度來(lái)看,隱私計(jì)算通常和AI緊密相關(guān),AI可以看成隱私計(jì)算的上層應(yīng)用與核心技術(shù)。
隱私計(jì)算面臨的困境主要有生態(tài)壁壘、安全性、可用性、計(jì)算性能。
借鑒AI發(fā)展模式,隱私計(jì)算的技術(shù)路徑可走底層編譯路線(xiàn)實(shí)現(xiàn)兼容互通,通過(guò)優(yōu)化底層密碼庫(kù)優(yōu)化性能;產(chǎn)業(yè)路徑需要逐場(chǎng)景落地,并根據(jù)不同的場(chǎng)景選擇不同的技術(shù)路線(xiàn)。
徐世真認(rèn)為只有深度結(jié)合AI,使業(yè)務(wù)方從隱私計(jì)算中獲益,才能把隱私計(jì)算從成本項(xiàng)變成營(yíng)收項(xiàng),保證企業(yè)有可持續(xù)的意愿度,保證數(shù)據(jù)價(jià)值閉環(huán)操作。
隱私計(jì)算僅僅是企業(yè)合規(guī)建設(shè)的一環(huán),需要在法律法規(guī)的框架下進(jìn)行。
瑞萊智慧RealAI首席架構(gòu)師徐世真
以下是徐世真演講全文,雷峰網(wǎng)做了不改變?cè)獾恼砼c編輯:
我是來(lái)自瑞萊智慧的徐世真,今天我的演講主題是《隱私計(jì)算助力構(gòu)建AI新基建》。
瑞萊智慧是孵化自清華大學(xué)人工智能研究院的AI 企業(yè),專(zhuān)注于人工智能領(lǐng)域的安全問(wèn)題。隨著人工智能被納入新基建的范疇,安全可控成為一項(xiàng)核心的基礎(chǔ)能力,其中包括數(shù)據(jù)安全、算法可靠、應(yīng)用可控。今天我主要分享一下公司在數(shù)據(jù)安全、隱私計(jì)算方面的研究。
一、隱私計(jì)算與AI能力互為補(bǔ)充
我們認(rèn)為,AI和隱私計(jì)算是息息相關(guān)的。
首先,隱私計(jì)算是AI能力的重要補(bǔ)充。從技術(shù)角度看,足夠規(guī)模且多樣化的數(shù)據(jù),才能訓(xùn)練出比較好的模型,隱私計(jì)算能夠解決數(shù)據(jù)的“鏈接”問(wèn)題,為算法的持續(xù)進(jìn)化提供數(shù)據(jù)補(bǔ)充;
第二,AI是隱私計(jì)算的核心需求。從場(chǎng)景角度來(lái)看,隱私計(jì)算通常和AI緊密相關(guān),AI可以看成隱私計(jì)算的上層應(yīng)用與核心技術(shù)?;诿艽a學(xué)原理的MPC/聯(lián)邦學(xué)習(xí),需要針對(duì)特定應(yīng)用進(jìn)行程序改寫(xiě),而且多數(shù)是屬于A(yíng)I應(yīng)用,比如DNN、邏輯回歸或樹(shù)模型。從這一點(diǎn)來(lái)看,AI和隱私計(jì)算有一定的相通之處,他們都沒(méi)有一個(gè)通用技術(shù)方案解決所有問(wèn)題。
第三,隱私計(jì)算是AI平臺(tái)的2.0版本。從產(chǎn)品角度來(lái)看,用戶(hù)需要的是帶有隱私計(jì)算功能的機(jī)器學(xué)習(xí)平臺(tái)。市場(chǎng)上主流的隱私計(jì)算平臺(tái),其實(shí)提供的大多是AI建模能力,不過(guò)底層通過(guò)密碼學(xué)、MPC技術(shù)進(jìn)行了隱私保護(hù)的功能。
總體來(lái)看,我們認(rèn)為人工智能和隱私計(jì)算互為補(bǔ)充,且互為核心需求。
二、隱私計(jì)算的困境在哪里?
但目前我們也了解到,隱私計(jì)算面臨很多問(wèn)題。
第一,生態(tài)壁壘。隱私計(jì)算解決數(shù)據(jù)孤島的問(wèn)題,但解決了之后,反而會(huì)誕生技術(shù)孤島的問(wèn)題,各家隱私計(jì)算的技術(shù)互不相通,也無(wú)法互相連接,基本意味著上層的代碼需要重構(gòu)。
第二,計(jì)算性能。速度慢,因?yàn)橐肓撕芏嗝艽a學(xué)操作,要么是MPC帶來(lái)的通信問(wèn)題,要么是同態(tài)加密帶來(lái)的計(jì)算性能問(wèn)題,很難支撐大規(guī)模數(shù)據(jù)訓(xùn)練,如果是億級(jí)或十億級(jí)的訓(xùn)練,單純用聯(lián)邦學(xué)習(xí)或者M(jìn)PC很難實(shí)現(xiàn)。
第三,安全性。各家從知識(shí)產(chǎn)權(quán)的角度不太會(huì)公開(kāi)自己的底層協(xié)議(除了一些開(kāi)源項(xiàng)目),這就帶來(lái)協(xié)議不透明的問(wèn)題,難以審計(jì)。安全性如果沒(méi)辦法審計(jì),將會(huì)蘊(yùn)含巨大漏洞。
第四,可用性。我們?yōu)榱俗鰯?shù)據(jù)生態(tài)、解決方案生態(tài),不可能要求客戶(hù)自己連接數(shù)據(jù),所以作為一家隱私計(jì)算技術(shù)的服務(wù)商,我們需要提供開(kāi)箱即用的數(shù)據(jù),甚至需要提供開(kāi)箱即用的解決方案,讓用戶(hù)能夠在不改變?cè)瓉?lái)中心化非隱私計(jì)算操作體驗(yàn)的情況下來(lái)使用隱私計(jì)算平臺(tái)。
三、AI發(fā)展趨勢(shì)為隱私計(jì)算的未來(lái)發(fā)展提供借鑒
剛剛聊到AI和隱私計(jì)算之間的關(guān)系,其實(shí)我們可以用AI的發(fā)展趨勢(shì)預(yù)測(cè)隱私計(jì)算將來(lái)的發(fā)展趨勢(shì)。
第一,AI為隱私計(jì)算解決兼容互通問(wèn)題提供了借鑒。AI也有很多框架,比如Tensorflow、PyTorch,各個(gè)框架之間也很難互通,但后來(lái)出現(xiàn)了ONNX,在數(shù)據(jù)流圖層把各家的協(xié)議集中匯聚起來(lái),再轉(zhuǎn)移成另一個(gè)框架可以執(zhí)行的東西。數(shù)據(jù)流圖層面的兼容,是AI發(fā)展為解決框架之間互聯(lián)互通問(wèn)題提出的方案,對(duì)隱私計(jì)算的互聯(lián)互通具有借鑒意義。
第二,AI為隱私計(jì)算性能優(yōu)化提供了方向。我們知道AI也是吃算力的,AI的性能優(yōu)化基本沿著兩條路線(xiàn),一是硬件升級(jí),最早是CPU,后來(lái)又有GPU,再到現(xiàn)在專(zhuān)用的AI芯片;二是算法升級(jí),包括模型的壓縮、蒸餾、剪枝,把大模型變成小模型,這些對(duì)于隱私計(jì)算的發(fā)展也是適用的。
第三,AI為隱私計(jì)算解決安全性問(wèn)題提供了路徑。我們做了一個(gè)技術(shù)實(shí)驗(yàn),一張雪山的圖片,經(jīng)過(guò)添加對(duì)抗噪聲,可以讓AI識(shí)別錯(cuò)誤,讓其識(shí)別成一張狗的圖片,這是AI的安全性問(wèn)題。隱私計(jì)算也面臨類(lèi)似的問(wèn)題,比如通過(guò)橫向聯(lián)邦中的數(shù)據(jù)投毒、模型污染化,所以AI和隱私計(jì)算在安全性提升方面面臨的問(wèn)題也是相通的。
第四,AI為隱私計(jì)算場(chǎng)景落地問(wèn)題提供了借鑒。前幾年一直說(shuō)AI賦能萬(wàn)物,AI賦能所有產(chǎn)業(yè),現(xiàn)在大家發(fā)現(xiàn)是產(chǎn)業(yè)結(jié)合AI、場(chǎng)景結(jié)合AI。隱私計(jì)算目前也處在這兩種思想的匯聚期,到底是隱私計(jì)算作為底座賦能所有產(chǎn)業(yè),還是結(jié)合具體場(chǎng)景來(lái)選擇相應(yīng)的隱私計(jì)算技術(shù)?這是兩種路線(xiàn)之爭(zhēng)。當(dāng)然,我們相信結(jié)合場(chǎng)景的AI更有價(jià)值,結(jié)合場(chǎng)景的隱私計(jì)算也更實(shí)際、更可落地、更有價(jià)值。
從AI的發(fā)展經(jīng)驗(yàn)來(lái)推演隱私計(jì)算的發(fā)展,在技術(shù)路徑方面,概括來(lái)說(shuō)有以下幾個(gè)思路:
第一,編譯器路線(xiàn)。兼容互通應(yīng)該在底層算子層完成,不應(yīng)該只停留在軟件層或集成層,底層數(shù)據(jù)流圖也是安全、可追溯、可驗(yàn)證的工具,可表達(dá)計(jì)算邏輯。第二,性能優(yōu)化。短期可以通過(guò)優(yōu)化底層的密碼庫(kù)來(lái)實(shí)現(xiàn),未來(lái)還需要新硬件的介入,更好地提升速度。第三,隱私計(jì)算的安全性,包含抵御密碼協(xié)議層和應(yīng)用層的惡意攻擊,隨著AI的發(fā)展,一些對(duì)抗樣本攻擊的問(wèn)題開(kāi)始出現(xiàn),隱私計(jì)算的發(fā)展將來(lái)也將面臨一些新安全問(wèn)題,我們應(yīng)該在當(dāng)前發(fā)展的時(shí)候就考慮到,而不是先發(fā)展后治理。
四、隱私計(jì)算的產(chǎn)業(yè)路徑需要逐場(chǎng)景落地
同樣參考AI發(fā)展模式,我們認(rèn)為隱私計(jì)算的產(chǎn)業(yè)路徑需要逐場(chǎng)景落地,并根據(jù)不同的場(chǎng)景選擇不同的技術(shù)路線(xiàn)。借用信通院講的三大技術(shù)路線(xiàn)來(lái)闡述多方安全計(jì)算、聯(lián)邦學(xué)習(xí)和可信執(zhí)行環(huán)境各個(gè)路線(xiàn)之間的優(yōu)劣勢(shì)。
(1)從應(yīng)用場(chǎng)景來(lái)說(shuō),MPC更適合數(shù)值類(lèi)簡(jiǎn)單計(jì)算和查詢(xún)求交類(lèi)特定計(jì)算;聯(lián)邦學(xué)習(xí)主要是針對(duì)機(jī)器學(xué)習(xí)的場(chǎng)景,計(jì)算邏輯比較復(fù)雜,不是簡(jiǎn)單計(jì)算;TEE更適合通用計(jì)算場(chǎng)景,比如有時(shí)候想跑一個(gè)完整的Tensorflow或數(shù)據(jù)庫(kù)應(yīng)用,用前兩個(gè)比較難,用這個(gè)比較合適。
(2)從技術(shù)優(yōu)勢(shì)的角度來(lái)說(shuō),簡(jiǎn)單的分布式統(tǒng)計(jì)/查詢(xún)求交場(chǎng)景下,MPC比較成熟,但復(fù)雜計(jì)算情況下受限于通信情況,還是不太成熟;聯(lián)邦學(xué)習(xí),保證數(shù)據(jù)不出庫(kù)的情況下進(jìn)行復(fù)雜的機(jī)器學(xué)習(xí)、建模,大部分情況下的計(jì)算性能還是尚可的,但是在一些特別大量的數(shù)據(jù)下,密碼學(xué)計(jì)算還是主要的限制;TEE是集中式的數(shù)據(jù)處理,易開(kāi)發(fā),它的算法/框架生態(tài)是最好的。
(3)從技術(shù)劣勢(shì)的角度來(lái)說(shuō),MPC的通信量大,支持簡(jiǎn)單的計(jì)算邏輯可行,但計(jì)算邏輯一旦復(fù)雜,就耗費(fèi)一定時(shí)間,比如一個(gè)Resnet,2-party,一張圖片的inference可能需要10分鐘以上,在實(shí)際落地中是完全不可接受的;聯(lián)邦學(xué)習(xí)主要是面向AI建模場(chǎng)景,但有的場(chǎng)景就是想簡(jiǎn)單的求和、求最大值,這時(shí)候聯(lián)邦學(xué)習(xí)就不是理想方案;TEE主要劣勢(shì)是依賴(lài)于硬件廠(chǎng)商的硬件可信性,和用戶(hù)是否接受數(shù)據(jù)集中式處理。
目前隱私計(jì)算這一賽道比較火熱,但是還有很多問(wèn)題沒(méi)有解決。比如隱私計(jì)算解決的是數(shù)據(jù)流通安全性的問(wèn)題,分離了數(shù)據(jù)所有權(quán)和使用權(quán),避免流通過(guò)程中的資產(chǎn)損失,但它沒(méi)辦法解決端到端的安全問(wèn)題。很多企業(yè)更希望獲得的是端到端安全保障,比如數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)采集怎么做,以及數(shù)據(jù)流通前后的權(quán)屬該怎么定,隱私計(jì)算在解決這樣的全鏈路安全問(wèn)題上,還面臨著一系列挑戰(zhàn)。所以,隱私計(jì)算僅僅是企業(yè)合規(guī)建設(shè)中的一個(gè)技術(shù)環(huán)節(jié),整體上還是需要在法律法規(guī)的指導(dǎo)下進(jìn)行。
還有數(shù)據(jù)流通的意愿問(wèn)題,如果企業(yè)只是把隱私計(jì)算當(dāng)成企業(yè)合規(guī)建設(shè)的成本項(xiàng),那數(shù)據(jù)交易也很難推行下去。徐世真認(rèn)為,只有深度結(jié)合AI,使業(yè)務(wù)方從隱私計(jì)算中獲益,才能把隱私計(jì)算從成本項(xiàng)變成營(yíng)收項(xiàng),保證企業(yè)有可持續(xù)的意愿度,保證數(shù)據(jù)價(jià)值閉環(huán)操作。
五、編譯級(jí)隱私計(jì)算平臺(tái)RealSecure,打通落地“最短鏈路”
據(jù)了解,瑞萊智慧推出的隱私計(jì)算平臺(tái)RealSecure是業(yè)內(nèi)首個(gè)編譯級(jí)隱私計(jì)算平臺(tái),自主研發(fā)聯(lián)邦A(yù)I編譯器,實(shí)現(xiàn)以數(shù)據(jù)流圖變換的形式實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法到聯(lián)邦機(jī)器學(xué)習(xí)算法的自動(dòng)轉(zhuǎn)換,無(wú)需針對(duì)每個(gè)參與方編寫(xiě)特定的計(jì)算邏輯,適配多種機(jī)器學(xué)習(xí)算法。數(shù)據(jù)流圖的形式可直觀(guān)展示加密過(guò)程,底層執(zhí)行的計(jì)算公開(kāi)可審計(jì),深度結(jié)合密碼學(xué)證明,支持完整證明聯(lián)邦算法協(xié)議的安全性。
同時(shí),該平臺(tái)創(chuàng)新性的引入了全同態(tài)加密技術(shù),將密碼設(shè)計(jì)中的批次處理和機(jī)器學(xué)習(xí)中以Tensor為最小數(shù)據(jù)單元的場(chǎng)景相結(jié)合,在部分機(jī)器學(xué)習(xí)算法中,該平臺(tái)相對(duì)于主流開(kāi)源框架有40倍以上端到端的速度提升。
基于RealSecure平臺(tái),瑞萊智慧推出了“平臺(tái)+數(shù)據(jù)+服務(wù)+場(chǎng)景”的一體化解決方案,基于這套方案實(shí)現(xiàn)多個(gè)場(chǎng)景案例。
比如某家頭部銀行的資產(chǎn)躍遷分析案例。該銀行希望統(tǒng)計(jì)集團(tuán)子公司中交集客戶(hù)總資產(chǎn),定位發(fā)生資產(chǎn)躍遷客戶(hù),獲取高凈值客戶(hù)名單,并分析資產(chǎn)躍遷潛在原因及差異化潛在高凈值客戶(hù)的營(yíng)銷(xiāo)策略。但是各個(gè)子公司不愿意透漏各自的數(shù)據(jù)詳情、全過(guò)程各個(gè)參與方不能獲取或者泄露各自數(shù)據(jù)詳情。通過(guò)與瑞萊智慧合作,銀行、保險(xiǎn)子公司、證券子公司分別部署隱私保護(hù)計(jì)算平臺(tái)(RealSecure)節(jié)點(diǎn),基于RSC的PSI(隱私求交)及MPC(多方安全計(jì)算加法)技術(shù),在保護(hù)各方數(shù)據(jù)隱私的前提下,統(tǒng)計(jì)集團(tuán)子公司的交集客戶(hù)總資產(chǎn),并定位交集客戶(hù)中的資產(chǎn)躍遷,獲取高凈值客戶(hù)名單,根據(jù)統(tǒng)計(jì)結(jié)果制定差異化高凈值客戶(hù)營(yíng)銷(xiāo)策略。
最后,瑞萊智慧也與中倫律師事務(wù)所合作開(kāi)展企業(yè)合規(guī)體系建設(shè)。雙方基于優(yōu)勢(shì)互補(bǔ),充分發(fā)揮資源優(yōu)勢(shì),在數(shù)字經(jīng)濟(jì)時(shí)代針對(duì)人工智能、數(shù)據(jù)交換等新場(chǎng)景下監(jiān)管機(jī)構(gòu)的合規(guī)要求,對(duì)內(nèi)健全技術(shù)合規(guī)體系建設(shè),對(duì)外面向企業(yè)輸出應(yīng)用合規(guī)咨詢(xún)服務(wù)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章