丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
政企安全 正文
發(fā)私信給李揚霞
發(fā)送

0

螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」

本文作者: 李揚霞 2022-07-06 18:56
導(dǎo)語:只有開源的隱私計算,才足夠被信任。

螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」

摘要:只有開源的隱私計算,才足夠被信任。

作者:李揚霞

編輯:林覺民

這是螞蟻在隱私計算領(lǐng)域邁出的嶄新一步。7月4日下午,螞蟻集團宣布面向全球開發(fā)者正式開源可信隱私計算框架“隱語”。自2016年起,螞蟻就開始推進隱私計算技術(shù)及其規(guī)?;瘧?yīng)用,而“隱語”幾乎涵蓋了當(dāng)前所有主流隱私計算路線,可滿足各場景不同需求。

過去兩年,國內(nèi)大批隱私計算廠家涌入隱私計算領(lǐng)域,而以螞蟻集團等為代表的“大廠”科技公司因為較早入局,逐漸成為隱私計算市場的主力。此前曾有機構(gòu)預(yù)測,隱私計算是一個百億級的市場,但根據(jù)最新IDC調(diào)研發(fā)現(xiàn),從收入形態(tài)而言,市場收入主要來源于產(chǎn)品售賣或平臺建設(shè)方面,大量技術(shù)服務(wù)商的營收規(guī)模仍然處于億級以下水平。

原本百億市場規(guī)模的隱私計算市場,為何營收過億的服務(wù)商寥寥無幾,即便是較早入局的隱私計算廠家也沒能取得優(yōu)勢。隱私計算雖然能在不知“富翁”財產(chǎn)的情況下計算出誰更有錢,但應(yīng)用場景落地難的問題,也成為該領(lǐng)域進一步發(fā)展的“界河鴻溝”。

究竟是技術(shù)開發(fā)使用門檻高、抑或是數(shù)據(jù)要素行業(yè)原本就存在互信難、確權(quán)難、監(jiān)管難、定價難等問題,我們無從辯駁。但有一點可以明確,該技術(shù)如果只掌握在少數(shù)寡頭手里,我們還是實現(xiàn)不了真正的數(shù)據(jù)流通,而唯有“開源”是降低門檻的一個有效手段。

“隱語”框架負責(zé)人、螞蟻集團隱私智能計算部總經(jīng)理王磊也告訴雷峰網(wǎng):“不開源的框架是得不到用戶信任的,這也是隱語開源的原因之一?!?/p>

1.隱語開源“恰逢其時”

數(shù)字經(jīng)濟時代,數(shù)據(jù)成為新的生產(chǎn)要素,數(shù)據(jù)只有流通和共享才能發(fā)揮更大的價值,那么如何讓數(shù)據(jù)發(fā)揮價值的同時又能保護數(shù)據(jù)的安全和隱私?隱私計算技術(shù)(又稱:隱私保護計算)就像一個“引彈”,讓整個業(yè)界開始沸騰。

準確來說,隱私計算不是一種技術(shù),而是多種技術(shù)融合的統(tǒng)稱,包括TEE(可信執(zhí)行環(huán)境)、MPC(安全多方計算)、聯(lián)邦學(xué)習(xí)、同態(tài)加密等。也正是因為其技術(shù)路線的復(fù)雜性以及高昂成本,讓眾多企業(yè)望而卻步。

舉一個例子 ,在隱私計算技術(shù)的開發(fā)過程中,開發(fā)者需要有一個技術(shù)框架,用來基于實際業(yè)務(wù)場景、以及功能來設(shè)計。而實際情況是,如果開發(fā)者想使用聯(lián)邦學(xué)習(xí),那么就要使用A框架來做研發(fā);如果想使用多方安全計算,那么又要使用B框架來做研發(fā),如果想使用可信硬件,還要去熟悉所選硬件的架構(gòu)才能真正開始使用。但現(xiàn)實的業(yè)務(wù)需求是,經(jīng)常是需要多個技術(shù)一起來使用的,那么這時候就會出現(xiàn)繁瑣、重復(fù)的開發(fā)工作量。

而“隱語”可以讓開發(fā)者收獲“開箱即用”、更加兼容通用的開發(fā)體驗。同時,提供豐富的聯(lián)邦學(xué)習(xí)算法和差分隱私機制,技術(shù)能力涵蓋了多方安全計算、聯(lián)邦學(xué)習(xí)、同態(tài)加密、差分隱私、機密計算等,供開發(fā)者靈活選擇,開發(fā)者可以簡單、快速上手,大大降低了算法、研發(fā)技術(shù)人員使用隱私計算技術(shù)的門檻。

“隱語”開源恰逢其時。開源一方面可以規(guī)避后門風(fēng)險,破除信任難題;另一方面開放透明人人可以參與,系統(tǒng)的可持續(xù)發(fā)展性得到保障。

而在王磊看來:首先從技術(shù)層面,如果別人看不到我們的代碼,就不能確認產(chǎn)品的安全性,那又談何信任。只有以開源共享的方式,吸引更多優(yōu)秀的開發(fā)者加入,才能凝聚技術(shù)合力降低隱私計算開發(fā)者和使用者的技術(shù)門檻。

其次從產(chǎn)業(yè)層面,只有整個隱私計算行業(yè)發(fā)展好了,我們才能做更多的事情。隱語開源,就是希望能夠通過開源共享回饋行業(yè),推動技術(shù)產(chǎn)品化、規(guī)?;瘧?yīng)用落地,構(gòu)建商業(yè)生態(tài),最終推動整個隱私計算行業(yè)的發(fā)展。

目前,“隱語”已向社區(qū)開放了多方安全計算和聯(lián)邦學(xué)習(xí)的核心代碼。對于算法/模型研發(fā)開發(fā)者,可以使用隱語提供的編程能力,方便快捷地將更多算法和模型遷移來,并得到隱私保護增強。對于底層安全開發(fā)者,可將底層密碼/安全研究成果嵌入隱語,完善密態(tài)設(shè)備的能力、性能和安全,轉(zhuǎn)化實際業(yè)務(wù)應(yīng)用。

螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」

2.隱語開源的底氣

當(dāng)隱語框架2年前決定開源,就注定踏上了一條不平凡之路。

螞蟻集團副總裁兼首席技術(shù)安全官、隱語開源指導(dǎo)委員會主席韋韜曾表示:“2022年整個數(shù)據(jù)行業(yè)將邁向“數(shù)據(jù)密態(tài)時代?!边^去在數(shù)據(jù)要素行業(yè),數(shù)據(jù)易復(fù)制,而明文流通易導(dǎo)致分發(fā)失控。若數(shù)據(jù)以密態(tài)形式流通,可以保障其流轉(zhuǎn)、計算、融合到銷毀全鏈路安全可控;并保證數(shù)據(jù)要素持有權(quán)和使用權(quán)分離,進而支持數(shù)據(jù)要素產(chǎn)業(yè)更加安全健康的發(fā)展。

邁進數(shù)據(jù)密態(tài)時代,螞蟻集團看到,隱私計算技術(shù)需要進一步升級,“可信隱私計算”是非常重要的方向。而隱語毫無疑問成為了其技術(shù)支撐底座。

在經(jīng)過螞蟻集團內(nèi)部大規(guī)模業(yè)務(wù)以及外部金融、醫(yī)療等場景的淬煉,可信隱私計算框架“隱語”,擁有了卓越的安全性和性能,可支持大規(guī)模數(shù)據(jù)集。具體來看主要有以下幾大優(yōu)勢:

完備性:針對隱私計算技術(shù)方向多,且各方向優(yōu)劣勢不同的問題,通過密文計算設(shè)備對不同技術(shù)進行抽象,使得同一套框架能支持所有主流的隱私計算技術(shù),且可以靈活組裝,以適應(yīng)不同場景的需求;

透明性:針對隱私計算技術(shù)底層技術(shù)與上層應(yīng)用耦合性強,導(dǎo)致每種底層技術(shù)的更新都重復(fù)開發(fā)上層應(yīng)用的問題,通過編譯器和IR層的抽象,將底層協(xié)議與上層應(yīng)用分離,上層可以對接傳統(tǒng)數(shù)據(jù)處理的SQL、Pytorch、TF、JAX框架,底層安全協(xié)議和技術(shù)的更新上層不感知;

開放性:針對當(dāng)前隱私計算沒有可以容納多方共同參與開發(fā)的良好抽象的框架,通過明密文編程范式的抽象,使得非安全背景的開發(fā)者也可以開發(fā)出安全的隱私計算算法;

聯(lián)通性:針對多種隱私計算技術(shù)無法互通的問題,采用混合協(xié)議設(shè)計,使得不同隱私計算技術(shù)之間的數(shù)據(jù)也可以相互聯(lián)通,讓組建大型數(shù)據(jù)網(wǎng)絡(luò)成為可能。

隱語所做的事情,一方面是將隱私計算所涉及的各主流技術(shù)分支分別抽象為加減乘除等具備基礎(chǔ)功能的“設(shè)備和原語”,基礎(chǔ)符號越多意味著組合計算的方式越多;另一方面,是繼續(xù)向上建設(shè)AI & BI 隱私算法層,提供像勾股定理一樣的具備特定功能的公式,這些公式開箱即用,可供我們在解決完整的應(yīng)用題時自由調(diào)用。

螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」

本次隱語的開源內(nèi)容如上圖中的點亮模塊,主要包含以下要點:

1.MPC設(shè)備。支持大部分Numpy API,支持自動求導(dǎo),提供LR和NN相關(guān)的demo,支持pade 高精度定點數(shù)擬合算法,支持 ABY3、 Cheetah 協(xié)議。用戶可以采用傳統(tǒng)的算法編程模式,在不了解MPC協(xié)議的情況下開發(fā)出基于MPC協(xié)議的AI算法;


2. HE設(shè)備。支持Paillier同態(tài)加密算法,向上層提供Numpy編程接口,用戶可以使用Numpy接口做矩陣加法或者明密文矩陣乘法運算。且實現(xiàn)了與MPC密態(tài)設(shè)備之間的數(shù)據(jù)可流轉(zhuǎn);


3. 差分隱私安全原語。實現(xiàn)了一些差分隱私噪聲機制、安全噪聲生成器、隱私開銷計算器;


4. 明密文混合編程。支持中心化編程模式,使用@device標(biāo)記構(gòu)建明文和密文設(shè)備混合計算圖,基于計算圖進行并行、異步任務(wù)調(diào)度;


5.數(shù)據(jù)預(yù)處理。提供水平場景下的數(shù)據(jù)標(biāo)準化、離散化、分箱功能,提供垂直場景下的相關(guān)系數(shù)矩陣、WOE分箱功能。無縫對接已有的dataframe,提供和sklearn一致的使用體感;


6. AI & BI 隱私算法-多方安全計算。提供水平場景下的XGBoost算法、新增垂直場景下的HESS-LR算法,并結(jié)合差分隱私增強了對拆分學(xué)習(xí)的隱私保護;


7.AI & BI 隱私算法-聯(lián)邦學(xué)習(xí)。提供聯(lián)邦學(xué)習(xí)模型構(gòu)建和包括SecureAggregation,MPC Aggregation, PlaintextAggregation在內(nèi)的多種安全模式的梯度聚合,用戶只需要在模型構(gòu)建時給出參與方list和聚合方法,之后的數(shù)據(jù)讀取,預(yù)處理到模型訓(xùn)練的體驗和傳統(tǒng)明文編程幾乎一致。

目前,隱語框架已經(jīng)制定了后續(xù)版本將逐步開源的既有內(nèi)容;隨著隱語開源,更多的需求和建議將被提出,隱語這一社區(qū)將探索更大的成長空間。

3.六年規(guī)?;瘧?yīng)用探索之路

隱私計算目前面臨著定制化程度高、沒有標(biāo)準化的產(chǎn)品,難以規(guī)?;l(fā)展的問題。王磊表示,“很多時候定制化的產(chǎn)品利潤率非常薄,未來如果要實現(xiàn)隱私計算大規(guī)模應(yīng)用,除了產(chǎn)品標(biāo)準化之外,還需要做很多超出隱私計算之外的事情,只有大家群策群力才能助力國家數(shù)據(jù)要素市場化建設(shè)?!?/p>

2016年,螞蟻的隱私計算就開始了規(guī)?;瘧?yīng)用探索之路,在這期間螞蟻集團在隱私計算領(lǐng)域逐步推出了摩斯多方安全計算平臺,可信隱私計算框架隱語、螞蟻鏈數(shù)據(jù)隱私協(xié)作平臺FAIR、螞蟻隱私計算一體機等產(chǎn)品。

據(jù)介紹,在眾多產(chǎn)品中,螞蟻隱語主要解決的技術(shù)先進性問題,就是底層技術(shù)的長期發(fā)展。拿摩斯多方安全平臺來說,它是一個商業(yè)化的產(chǎn)品,所以摩斯跟隱語也可以被認為是上下層的戰(zhàn)略模式,摩斯是上層的隱私計算產(chǎn)品,螞蟻會在其他方面支撐,包括提供螞蟻鏈的計算、隱語技術(shù)產(chǎn)品升級等。

另外,隱語框架的另一大亮點,就是集合了阿里巴巴雙子實驗室的Cheetah(獵豹)安全兩方計算協(xié)議,該框架性能比目前世界最好的計算方案——微軟CryptFlow2快5倍以上,通信量少90%。阿里巴巴集團安全部資深安全專家洪橙告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)):“隱語團隊非常擅長框架能力和機器學(xué)習(xí)算法,獵豹團隊則擅長密碼技術(shù)相關(guān)的能力,兩方強強聯(lián)合,能發(fā)揮隱語和獵豹最大的影響力?!?/p>

那么,螞蟻可信隱私計算框架“隱語”能夠做什么呢?針對不同的應(yīng)用場景,螞蟻可以基于隱語的技術(shù)框架構(gòu)建相應(yīng)的產(chǎn)品。

目前隱語已經(jīng)在聯(lián)合風(fēng)控、政務(wù)數(shù)據(jù)、聯(lián)合營銷等業(yè)務(wù)場景中得到了成熟的應(yīng)用。在金融、醫(yī)療等領(lǐng)域也有成功的大規(guī)模落地經(jīng)驗、支持了浦發(fā)銀行跨機構(gòu)數(shù)據(jù)流通、浙江某三甲醫(yī)院醫(yī)保 DRG(Diagnosis Related Group,疾病診斷相關(guān)分組)改革,獲得過中國信通院頒發(fā)的 “星河案例” 獎,CCF 科學(xué)技術(shù)獎科技進步優(yōu)秀獎、中國網(wǎng)絡(luò)空間安全協(xié)會 “數(shù)據(jù)安全典型實踐案例”,入選了工信部 2021 年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點示范項目名單等。

例如,醫(yī)保DRGs分組器初始版本,成功實現(xiàn)多家醫(yī)療機構(gòu)數(shù)據(jù)進行聯(lián)合訓(xùn)練,在保護患者隱私前提下,增加樣本數(shù)量、擴大數(shù)據(jù)規(guī)模,通過更為準確的DRG分類模型幫助醫(yī)療機構(gòu)提升預(yù)測準確率,對于優(yōu)化臨床路徑、規(guī)范診療行為、提高服務(wù)效率有顯著的作用。

螞蟻“隱語”開源,邁過隱私計算的「界河鴻溝」

圖:隱私計算框架“隱語”在醫(yī)保DRGs建模中應(yīng)用總體框架

4.開源成為應(yīng)用落地和生態(tài)構(gòu)建的關(guān)鍵

如果一個公司僅僅關(guān)注自己的技術(shù)而不去關(guān)注市場的走向、別人的需求,那么它往往會做出一些很高端的軟件,但使用者卻少之又少。而螞蟻集團等科技公司,開源自己的學(xué)習(xí)框架,在提升行業(yè)熱度、價值落地和生態(tài)構(gòu)建中發(fā)揮著積極的作用。

目前隱語社區(qū)已經(jīng)成立,螞蟻集團及隱語也將在多個方面與開發(fā)者、研究者聯(lián)動共建隱私計算生態(tài):

其一是圍繞隱私計算這一技術(shù)核心通過多種渠道以文字、視頻等多樣的內(nèi)容,普及這一技術(shù),通過開放的交流探討增強生態(tài)中各界之間的粘度;

其二是在普及之上,聯(lián)動高校科研等科研機構(gòu),形成產(chǎn)業(yè)視角與教學(xué)視角的結(jié)合,打造一套體系化的隱私計算教學(xué)材料,助力社會培養(yǎng)會用隱私計算的人才體系;

其三是在會用之上給予實質(zhì)性的孵化支持,即設(shè)立隱私計算科研基金,公開招募、評選、扶持有創(chuàng)新有價值的項目深度發(fā)展。

最后,王磊強調(diào):“開源最重要的目標(biāo),是能夠吸引更多的人進來一起合作,這不是螞蟻集團一方的事情,而是多方合作的事情,是讓隱私計算行業(yè)能夠得到認可,大家都能夠在上面做貢獻,這是比較最重要的一點?!?/p>

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

“聚焦安全領(lǐng)域,關(guān)注數(shù)據(jù)安全、隱私計算的等互聯(lián)網(wǎng)熱點 ”VX聯(lián)系:Dec9102
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說