瑞萊智慧徐世真：隱私計(jì)算商業(yè)化落地面臨四大挑戰(zhàn)，AI模式提供兩大路徑參考| GAIR 2021

本文作者：李揚(yáng)霞

2021-12-23 10:48

專(zhuān)題：GAIR 2021

導(dǎo)語(yǔ)：瑞萊智慧徐世真在GAIR 2021分論壇演講精編

【雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))】2021年12月9日-2021年12月11日，2021第六屆全球人工智能大會(huì)（GAIR 2021）于深圳開(kāi)幕。本屆大會(huì)由粵港澳大灣區(qū)人工智能與機(jī)器人聯(lián)合會(huì)、雷峰網(wǎng)聯(lián)合主辦，深圳市人工智能與機(jī)器人研究院、深圳市機(jī)器人協(xié)會(huì)、深圳市人工智能學(xué)會(huì)支持。

作為中國(guó)最具影響力和前瞻性的前沿科技活動(dòng)之一， GAIR 大會(huì)已經(jīng)度過(guò)了五次精彩而又輝煌的歷程，見(jiàn)證數(shù)次潮水的轉(zhuǎn)向，成為目前為止粵港澳大灣區(qū)人工智能領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、工業(yè)和投資領(lǐng)域跨界盛會(huì)。

大會(huì)第二天，以《直面數(shù)據(jù)安全風(fēng)險(xiǎn)和挑戰(zhàn)；挖掘隱私計(jì)算的100%可為》為主題的“數(shù)據(jù)安全與隱私計(jì)算”分論壇吸引了來(lái)自全國(guó)各地的專(zhuān)家、學(xué)者、企業(yè)家、投資人等，大家齊聚一堂共話(huà)新時(shí)代下“數(shù)據(jù)安全與隱私計(jì)算”的當(dāng)下與未來(lái)。

其中瑞萊智慧RealAI首席架構(gòu)師徐世真帶來(lái)了題為「隱私計(jì)算助力構(gòu)建AI新基建」的精彩演講。演講要點(diǎn)可概括為以下幾個(gè)方面：

AI和隱私計(jì)算息息相關(guān)，隱私計(jì)算是AI能力的重要補(bǔ)充，AI是隱私計(jì)算的核心需求。從場(chǎng)景角度來(lái)看，隱私計(jì)算通常和AI緊密相關(guān)，AI可以看成隱私計(jì)算的上層應(yīng)用與核心技術(shù)。
隱私計(jì)算面臨的困境主要有生態(tài)壁壘、安全性、可用性、計(jì)算性能。
借鑒AI發(fā)展模式，隱私計(jì)算的技術(shù)路徑可走底層編譯路線(xiàn)實(shí)現(xiàn)兼容互通，通過(guò)優(yōu)化底層密碼庫(kù)優(yōu)化性能；產(chǎn)業(yè)路徑需要逐場(chǎng)景落地，并根據(jù)不同的場(chǎng)景選擇不同的技術(shù)路線(xiàn)。
徐世真認(rèn)為只有深度結(jié)合AI，使業(yè)務(wù)方從隱私計(jì)算中獲益，才能把隱私計(jì)算從成本項(xiàng)變成營(yíng)收項(xiàng)，保證企業(yè)有可持續(xù)的意愿度，保證數(shù)據(jù)價(jià)值閉環(huán)操作。
隱私計(jì)算僅僅是企業(yè)合規(guī)建設(shè)的一環(huán)，需要在法律法規(guī)的框架下進(jìn)行。

瑞萊智慧徐世真：隱私計(jì)算商業(yè)化落地面臨四大挑戰(zhàn)，AI模式提供兩大路徑參考| GAIR 2021

瑞萊智慧RealAI首席架構(gòu)師徐世真

以下是徐世真演講全文，雷峰網(wǎng)做了不改變?cè)獾恼砼c編輯：

我是來(lái)自瑞萊智慧的徐世真，今天我的演講主題是《隱私計(jì)算助力構(gòu)建AI新基建》。

瑞萊智慧是孵化自清華大學(xué)人工智能研究院的AI 企業(yè)，專(zhuān)注于人工智能領(lǐng)域的安全問(wèn)題。隨著人工智能被納入新基建的范疇，安全可控成為一項(xiàng)核心的基礎(chǔ)能力，其中包括數(shù)據(jù)安全、算法可靠、應(yīng)用可控。今天我主要分享一下公司在數(shù)據(jù)安全、隱私計(jì)算方面的研究。

一、隱私計(jì)算與AI能力互為補(bǔ)充

我們認(rèn)為，AI和隱私計(jì)算是息息相關(guān)的。

首先，隱私計(jì)算是AI能力的重要補(bǔ)充。從技術(shù)角度看，足夠規(guī)模且多樣化的數(shù)據(jù)，才能訓(xùn)練出比較好的模型，隱私計(jì)算能夠解決數(shù)據(jù)的“鏈接”問(wèn)題，為算法的持續(xù)進(jìn)化提供數(shù)據(jù)補(bǔ)充；

第二，AI是隱私計(jì)算的核心需求。從場(chǎng)景角度來(lái)看，隱私計(jì)算通常和AI緊密相關(guān)，AI可以看成隱私計(jì)算的上層應(yīng)用與核心技術(shù)?；诿艽a學(xué)原理的MPC/聯(lián)邦學(xué)習(xí)，需要針對(duì)特定應(yīng)用進(jìn)行程序改寫(xiě)，而且多數(shù)是屬于A(yíng)I應(yīng)用，比如DNN、邏輯回歸或樹(shù)模型。從這一點(diǎn)來(lái)看，AI和隱私計(jì)算有一定的相通之處，他們都沒(méi)有一個(gè)通用技術(shù)方案解決所有問(wèn)題。

第三，隱私計(jì)算是AI平臺(tái)的2.0版本。從產(chǎn)品角度來(lái)看，用戶(hù)需要的是帶有隱私計(jì)算功能的機(jī)器學(xué)習(xí)平臺(tái)。市場(chǎng)上主流的隱私計(jì)算平臺(tái)，其實(shí)提供的大多是AI建模能力，不過(guò)底層通過(guò)密碼學(xué)、MPC技術(shù)進(jìn)行了隱私保護(hù)的功能。

總體來(lái)看，我們認(rèn)為人工智能和隱私計(jì)算互為補(bǔ)充，且互為核心需求。

二、隱私計(jì)算的困境在哪里？

但目前我們也了解到，隱私計(jì)算面臨很多問(wèn)題。

第一，生態(tài)壁壘。隱私計(jì)算解決數(shù)據(jù)孤島的問(wèn)題，但解決了之后，反而會(huì)誕生技術(shù)孤島的問(wèn)題，各家隱私計(jì)算的技術(shù)互不相通，也無(wú)法互相連接，基本意味著上層的代碼需要重構(gòu)。

第二，計(jì)算性能。速度慢，因?yàn)橐肓撕芏嗝艽a學(xué)操作，要么是MPC帶來(lái)的通信問(wèn)題，要么是同態(tài)加密帶來(lái)的計(jì)算性能問(wèn)題，很難支撐大規(guī)模數(shù)據(jù)訓(xùn)練，如果是億級(jí)或十億級(jí)的訓(xùn)練，單純用聯(lián)邦學(xué)習(xí)或者M(jìn)PC很難實(shí)現(xiàn)。

第三，安全性。各家從知識(shí)產(chǎn)權(quán)的角度不太會(huì)公開(kāi)自己的底層協(xié)議（除了一些開(kāi)源項(xiàng)目），這就帶來(lái)協(xié)議不透明的問(wèn)題，難以審計(jì)。安全性如果沒(méi)辦法審計(jì)，將會(huì)蘊(yùn)含巨大漏洞。

第四，可用性。我們?yōu)榱俗鰯?shù)據(jù)生態(tài)、解決方案生態(tài)，不可能要求客戶(hù)自己連接數(shù)據(jù)，所以作為一家隱私計(jì)算技術(shù)的服務(wù)商，我們需要提供開(kāi)箱即用的數(shù)據(jù)，甚至需要提供開(kāi)箱即用的解決方案，讓用戶(hù)能夠在不改變?cè)瓉?lái)中心化非隱私計(jì)算操作體驗(yàn)的情況下來(lái)使用隱私計(jì)算平臺(tái)。

三、AI發(fā)展趨勢(shì)為隱私計(jì)算的未來(lái)發(fā)展提供借鑒

剛剛聊到AI和隱私計(jì)算之間的關(guān)系，其實(shí)我們可以用AI的發(fā)展趨勢(shì)預(yù)測(cè)隱私計(jì)算將來(lái)的發(fā)展趨勢(shì)。

第一，AI為隱私計(jì)算解決兼容互通問(wèn)題提供了借鑒。AI也有很多框架，比如Tensorflow、PyTorch，各個(gè)框架之間也很難互通，但后來(lái)出現(xiàn)了ONNX，在數(shù)據(jù)流圖層把各家的協(xié)議集中匯聚起來(lái)，再轉(zhuǎn)移成另一個(gè)框架可以執(zhí)行的東西。數(shù)據(jù)流圖層面的兼容，是AI發(fā)展為解決框架之間互聯(lián)互通問(wèn)題提出的方案，對(duì)隱私計(jì)算的互聯(lián)互通具有借鑒意義。

第二，AI為隱私計(jì)算性能優(yōu)化提供了方向。我們知道AI也是吃算力的，AI的性能優(yōu)化基本沿著兩條路線(xiàn)，一是硬件升級(jí)，最早是CPU，后來(lái)又有GPU，再到現(xiàn)在專(zhuān)用的AI芯片；二是算法升級(jí)，包括模型的壓縮、蒸餾、剪枝，把大模型變成小模型，這些對(duì)于隱私計(jì)算的發(fā)展也是適用的。

第三，AI為隱私計(jì)算解決安全性問(wèn)題提供了路徑。我們做了一個(gè)技術(shù)實(shí)驗(yàn)，一張雪山的圖片，經(jīng)過(guò)添加對(duì)抗噪聲，可以讓AI識(shí)別錯(cuò)誤，讓其識(shí)別成一張狗的圖片，這是AI的安全性問(wèn)題。隱私計(jì)算也面臨類(lèi)似的問(wèn)題，比如通過(guò)橫向聯(lián)邦中的數(shù)據(jù)投毒、模型污染化，所以AI和隱私計(jì)算在安全性提升方面面臨的問(wèn)題也是相通的。

第四，AI為隱私計(jì)算場(chǎng)景落地問(wèn)題提供了借鑒。前幾年一直說(shuō)AI賦能萬(wàn)物，AI賦能所有產(chǎn)業(yè)，現(xiàn)在大家發(fā)現(xiàn)是產(chǎn)業(yè)結(jié)合AI、場(chǎng)景結(jié)合AI。隱私計(jì)算目前也處在這兩種思想的匯聚期，到底是隱私計(jì)算作為底座賦能所有產(chǎn)業(yè)，還是結(jié)合具體場(chǎng)景來(lái)選擇相應(yīng)的隱私計(jì)算技術(shù)？這是兩種路線(xiàn)之爭(zhēng)。當(dāng)然，我們相信結(jié)合場(chǎng)景的AI更有價(jià)值，結(jié)合場(chǎng)景的隱私計(jì)算也更實(shí)際、更可落地、更有價(jià)值。

從AI的發(fā)展經(jīng)驗(yàn)來(lái)推演隱私計(jì)算的發(fā)展，在技術(shù)路徑方面，概括來(lái)說(shuō)有以下幾個(gè)思路：

第一，編譯器路線(xiàn)。兼容互通應(yīng)該在底層算子層完成，不應(yīng)該只停留在軟件層或集成層，底層數(shù)據(jù)流圖也是安全、可追溯、可驗(yàn)證的工具，可表達(dá)計(jì)算邏輯。第二，性能優(yōu)化。短期可以通過(guò)優(yōu)化底層的密碼庫(kù)來(lái)實(shí)現(xiàn)，未來(lái)還需要新硬件的介入，更好地提升速度。第三，隱私計(jì)算的安全性，包含抵御密碼協(xié)議層和應(yīng)用層的惡意攻擊，隨著AI的發(fā)展，一些對(duì)抗樣本攻擊的問(wèn)題開(kāi)始出現(xiàn)，隱私計(jì)算的發(fā)展將來(lái)也將面臨一些新安全問(wèn)題，我們應(yīng)該在當(dāng)前發(fā)展的時(shí)候就考慮到，而不是先發(fā)展后治理。

四、隱私計(jì)算的產(chǎn)業(yè)路徑需要逐場(chǎng)景落地

同樣參考AI發(fā)展模式，我們認(rèn)為隱私計(jì)算的產(chǎn)業(yè)路徑需要逐場(chǎng)景落地，并根據(jù)不同的場(chǎng)景選擇不同的技術(shù)路線(xiàn)。借用信通院講的三大技術(shù)路線(xiàn)來(lái)闡述多方安全計(jì)算、聯(lián)邦學(xué)習(xí)和可信執(zhí)行環(huán)境各個(gè)路線(xiàn)之間的優(yōu)劣勢(shì)。

（1）從應(yīng)用場(chǎng)景來(lái)說(shuō)，MPC更適合數(shù)值類(lèi)簡(jiǎn)單計(jì)算和查詢(xún)求交類(lèi)特定計(jì)算；聯(lián)邦學(xué)習(xí)主要是針對(duì)機(jī)器學(xué)習(xí)的場(chǎng)景，計(jì)算邏輯比較復(fù)雜，不是簡(jiǎn)單計(jì)算；TEE更適合通用計(jì)算場(chǎng)景，比如有時(shí)候想跑一個(gè)完整的Tensorflow或數(shù)據(jù)庫(kù)應(yīng)用，用前兩個(gè)比較難，用這個(gè)比較合適。

（2）從技術(shù)優(yōu)勢(shì)的角度來(lái)說(shuō)，簡(jiǎn)單的分布式統(tǒng)計(jì)/查詢(xún)求交場(chǎng)景下，MPC比較成熟，但復(fù)雜計(jì)算情況下受限于通信情況，還是不太成熟；聯(lián)邦學(xué)習(xí)，保證數(shù)據(jù)不出庫(kù)的情況下進(jìn)行復(fù)雜的機(jī)器學(xué)習(xí)、建模，大部分情況下的計(jì)算性能還是尚可的，但是在一些特別大量的數(shù)據(jù)下，密碼學(xué)計(jì)算還是主要的限制；TEE是集中式的數(shù)據(jù)處理，易開(kāi)發(fā)，它的算法/框架生態(tài)是最好的。

（3）從技術(shù)劣勢(shì)的角度來(lái)說(shuō)，MPC的通信量大，支持簡(jiǎn)單的計(jì)算邏輯可行，但計(jì)算邏輯一旦復(fù)雜，就耗費(fèi)一定時(shí)間，比如一個(gè)Resnet，2-party，一張圖片的inference可能需要10分鐘以上，在實(shí)際落地中是完全不可接受的；聯(lián)邦學(xué)習(xí)主要是面向AI建模場(chǎng)景，但有的場(chǎng)景就是想簡(jiǎn)單的求和、求最大值，這時(shí)候聯(lián)邦學(xué)習(xí)就不是理想方案；TEE主要劣勢(shì)是依賴(lài)于硬件廠(chǎng)商的硬件可信性，和用戶(hù)是否接受數(shù)據(jù)集中式處理。

目前隱私計(jì)算這一賽道比較火熱，但是還有很多問(wèn)題沒(méi)有解決。比如隱私計(jì)算解決的是數(shù)據(jù)流通安全性的問(wèn)題，分離了數(shù)據(jù)所有權(quán)和使用權(quán)，避免流通過(guò)程中的資產(chǎn)損失，但它沒(méi)辦法解決端到端的安全問(wèn)題。很多企業(yè)更希望獲得的是端到端安全保障，比如數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)采集怎么做，以及數(shù)據(jù)流通前后的權(quán)屬該怎么定，隱私計(jì)算在解決這樣的全鏈路安全問(wèn)題上，還面臨著一系列挑戰(zhàn)。所以，隱私計(jì)算僅僅是企業(yè)合規(guī)建設(shè)中的一個(gè)技術(shù)環(huán)節(jié)，整體上還是需要在法律法規(guī)的指導(dǎo)下進(jìn)行。

還有數(shù)據(jù)流通的意愿問(wèn)題，如果企業(yè)只是把隱私計(jì)算當(dāng)成企業(yè)合規(guī)建設(shè)的成本項(xiàng)，那數(shù)據(jù)交易也很難推行下去。徐世真認(rèn)為，只有深度結(jié)合AI，使業(yè)務(wù)方從隱私計(jì)算中獲益，才能把隱私計(jì)算從成本項(xiàng)變成營(yíng)收項(xiàng)，保證企業(yè)有可持續(xù)的意愿度，保證數(shù)據(jù)價(jià)值閉環(huán)操作。

五、編譯級(jí)隱私計(jì)算平臺(tái)RealSecure，打通落地“最短鏈路”

據(jù)了解，瑞萊智慧推出的隱私計(jì)算平臺(tái)RealSecure是業(yè)內(nèi)首個(gè)編譯級(jí)隱私計(jì)算平臺(tái)，自主研發(fā)聯(lián)邦A(yù)I編譯器，實(shí)現(xiàn)以數(shù)據(jù)流圖變換的形式實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法到聯(lián)邦機(jī)器學(xué)習(xí)算法的自動(dòng)轉(zhuǎn)換，無(wú)需針對(duì)每個(gè)參與方編寫(xiě)特定的計(jì)算邏輯，適配多種機(jī)器學(xué)習(xí)算法。數(shù)據(jù)流圖的形式可直觀(guān)展示加密過(guò)程，底層執(zhí)行的計(jì)算公開(kāi)可審計(jì)，深度結(jié)合密碼學(xué)證明，支持完整證明聯(lián)邦算法協(xié)議的安全性。

同時(shí)，該平臺(tái)創(chuàng)新性的引入了全同態(tài)加密技術(shù)，將密碼設(shè)計(jì)中的批次處理和機(jī)器學(xué)習(xí)中以Tensor為最小數(shù)據(jù)單元的場(chǎng)景相結(jié)合，在部分機(jī)器學(xué)習(xí)算法中，該平臺(tái)相對(duì)于主流開(kāi)源框架有40倍以上端到端的速度提升。

基于RealSecure平臺(tái)，瑞萊智慧推出了“平臺(tái)+數(shù)據(jù)+服務(wù)+場(chǎng)景”的一體化解決方案，基于這套方案實(shí)現(xiàn)多個(gè)場(chǎng)景案例。

比如某家頭部銀行的資產(chǎn)躍遷分析案例。該銀行希望統(tǒng)計(jì)集團(tuán)子公司中交集客戶(hù)總資產(chǎn)，定位發(fā)生資產(chǎn)躍遷客戶(hù)，獲取高凈值客戶(hù)名單，并分析資產(chǎn)躍遷潛在原因及差異化潛在高凈值客戶(hù)的營(yíng)銷(xiāo)策略。但是各個(gè)子公司不愿意透漏各自的數(shù)據(jù)詳情、全過(guò)程各個(gè)參與方不能獲取或者泄露各自數(shù)據(jù)詳情。通過(guò)與瑞萊智慧合作，銀行、保險(xiǎn)子公司、證券子公司分別部署隱私保護(hù)計(jì)算平臺(tái)(RealSecure)節(jié)點(diǎn)，基于RSC的PSI（隱私求交）及MPC（多方安全計(jì)算加法）技術(shù)，在保護(hù)各方數(shù)據(jù)隱私的前提下，統(tǒng)計(jì)集團(tuán)子公司的交集客戶(hù)總資產(chǎn)，并定位交集客戶(hù)中的資產(chǎn)躍遷，獲取高凈值客戶(hù)名單，根據(jù)統(tǒng)計(jì)結(jié)果制定差異化高凈值客戶(hù)營(yíng)銷(xiāo)策略。

最后，瑞萊智慧也與中倫律師事務(wù)所合作開(kāi)展企業(yè)合規(guī)體系建設(shè)。雙方基于優(yōu)勢(shì)互補(bǔ)，充分發(fā)揮資源優(yōu)勢(shì)，在數(shù)字經(jīng)濟(jì)時(shí)代針對(duì)人工智能、數(shù)據(jù)交換等新場(chǎng)景下監(jiān)管機(jī)構(gòu)的合規(guī)要求，對(duì)內(nèi)健全技術(shù)合規(guī)體系建設(shè)，對(duì)外面向企業(yè)輸出應(yīng)用合規(guī)咨詢(xún)服務(wù)。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章