0
本文作者: 王德清 | 2021-04-20 22:08 |
兩個(gè)百萬(wàn)富翁在街上相遇,他們都想知道誰(shuí)更富有,但又不愿意讓對(duì)方知道自己擁有的真正財(cái)富。如何在沒有第三方的情況下,讓對(duì)方知道誰(shuí)更有錢?
這是中國(guó)科學(xué)院院士姚期智在1982年提出的“百萬(wàn)富翁”設(shè)想。隨著云計(jì)算、人工智能技術(shù)的不斷發(fā)展,數(shù)據(jù)成為了繼土地、勞動(dòng)力、資本、技術(shù)之外的第五大生產(chǎn)要素,其價(jià)值不言而喻。
與此同時(shí),無(wú)論是個(gè)人還是企業(yè),對(duì)于數(shù)據(jù)的隱私保護(hù)也愈加重視。此外,我國(guó)的《數(shù)據(jù)安全法》(草案)、《個(gè)人信息保護(hù)法》(草案)等代表性法律法規(guī)相繼出臺(tái),嚴(yán)格要求在數(shù)據(jù)使用過(guò)程中做好隱私保護(hù),例如不允許數(shù)據(jù)離開本地、不允許未經(jīng)授權(quán)使用個(gè)人數(shù)據(jù)等等。
然而隨著數(shù)字化進(jìn)程的不斷深入,數(shù)據(jù)融合應(yīng)用成為了關(guān)鍵一環(huán),如何打破數(shù)據(jù)保護(hù)與數(shù)據(jù)價(jià)值挖掘之間的矛盾,成為了行業(yè)亟需解決的痛點(diǎn)。
姚期智院士針對(duì)數(shù)據(jù)領(lǐng)域所提出的“百萬(wàn)富翁”設(shè)想,正一步一步的走進(jìn)現(xiàn)。
事實(shí)上,就在姚期智提出“百萬(wàn)富翁”設(shè)想的同時(shí),姚期智還發(fā)布了一個(gè)名為“多方安全計(jì)算”(Secure Multi-Party Computation,簡(jiǎn)稱MPC)的理論框架。然而,由于算力等因素的制約,MPC并未在提出之初,就凸顯出其價(jià)值。
隨著,IT基礎(chǔ)設(shè)施的不斷發(fā)展,數(shù)據(jù)融合應(yīng)用趨勢(shì)不斷加快,以MPC為代表的隱私計(jì)算再次“躥火”。
學(xué)術(shù)界,近年來(lái)有關(guān)隱私計(jì)算的學(xué)術(shù)會(huì)議和論文呈現(xiàn)爆發(fā)式增長(zhǎng),產(chǎn)業(yè)界則也愈發(fā)關(guān)注隱私計(jì)算技術(shù)和產(chǎn)品,各企業(yè)都爭(zhēng)相投入到隱私計(jì)算的研發(fā)和產(chǎn)品化工作。
中國(guó)互聯(lián)網(wǎng)金融協(xié)會(huì)發(fā)布的《金融業(yè)數(shù)據(jù)要素融合應(yīng)用研究》的報(bào)告中,將多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、數(shù)據(jù)脫敏、差分隱私、可信計(jì)算列為可用于支撐金融業(yè)數(shù)據(jù)要素更好融合的五種技術(shù)。
Gartner則預(yù)測(cè),到2025年,將有一半的大型企業(yè)會(huì)通過(guò)隱私計(jì)算賦能多方數(shù)據(jù)合作場(chǎng)景中的數(shù)據(jù)融合應(yīng)用。
在騰訊高級(jí)執(zhí)行副總裁看來(lái),隱私計(jì)算的興起,為人們提供了在數(shù)據(jù)安全合規(guī)、融合應(yīng)用過(guò)程中尋求發(fā)展和安全之間平衡點(diǎn)的技術(shù)路徑和解決思路,其正在成為未來(lái)數(shù)字治理的最有效路徑之一。
隱私計(jì)算到底又是什么東西呢?據(jù)騰訊近日發(fā)布的《隱私計(jì)算白皮書》(下稱:白皮書)解釋:隱私計(jì)算(Privacy Computing)是一種由兩個(gè)或多個(gè)參與方聯(lián)合計(jì)算的技術(shù)和系統(tǒng),參與方在不泄露各自數(shù)據(jù)的前提下通過(guò)協(xié)作對(duì)他們的數(shù)據(jù)進(jìn)行聯(lián)合機(jī)器學(xué)習(xí)和聯(lián)合分析。
說(shuō)的文藝一點(diǎn),隱私計(jì)算可以讓數(shù)據(jù)相知但并不相識(shí)。
對(duì)于個(gè)人消費(fèi)者而言,隱私計(jì)算的應(yīng)用可以保障個(gè)人的信息安全;對(duì)于企業(yè)和機(jī)構(gòu),隱私計(jì)算不僅可以保護(hù)企業(yè)在采集、存儲(chǔ)、分析等過(guò)程中的關(guān)鍵信息、商業(yè)秘密等數(shù)據(jù),還可以促進(jìn)企業(yè)的跨界數(shù)據(jù)合作;而對(duì)于政府而言,隱私計(jì)算在提升了社會(huì)數(shù)據(jù)安全保護(hù)的同時(shí),還可以將數(shù)據(jù)要素融合從而推動(dòng)城市產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程。
隨著國(guó)家、地方、企業(yè)一級(jí)個(gè)人對(duì)于數(shù)據(jù)安全愈加重視,數(shù)字化進(jìn)程又依賴于數(shù)據(jù)的融合應(yīng)用。
因此,在騰訊數(shù)據(jù)平臺(tái)部總經(jīng)理蔣杰看來(lái),隱私計(jì)算需要以更加安全的方式打通數(shù)據(jù)孤島,橋接多方數(shù)據(jù),以統(tǒng)一的數(shù)據(jù)處理引擎更高效地挖掘數(shù)據(jù)價(jià)值,并以智能化的方式驅(qū)動(dòng)整個(gè)數(shù)據(jù)處理閉環(huán),為開發(fā)者、企業(yè)、以及政府的數(shù)字化、智能化升級(jí)打下堅(jiān)實(shí)基礎(chǔ)。
就在此洞察之下,騰訊發(fā)布了第四代數(shù)智融合計(jì)算平臺(tái)“騰訊大數(shù)據(jù)-天工”
據(jù)蔣杰介紹,在安全方面,“騰訊大數(shù)據(jù)-天工”采用自研隱私計(jì)算技術(shù),從機(jī)器學(xué)習(xí)到大數(shù)據(jù)分析為各個(gè)場(chǎng)景提供全方位保護(hù),去中心化的架構(gòu)則能避免單點(diǎn)隱私泄露風(fēng)險(xiǎn)。除此之外,在安全性上,“騰訊大數(shù)據(jù)-天工”可以提供3072bit(金融行業(yè)要求的是2048bit)業(yè)界最高強(qiáng)度加密和TEE硬件雙保險(xiǎn),最大限度確保數(shù)據(jù)安全。
憑借該技術(shù),騰訊大數(shù)據(jù)相關(guān)團(tuán)隊(duì)獲得iDash 2020世界隱私計(jì)算大賽冠軍,安全性能領(lǐng)冠全球。據(jù)雷鋒網(wǎng)了解,金融級(jí)安全強(qiáng)度的騰訊隱私計(jì)算技術(shù)已廣泛應(yīng)用在醫(yī)療、金融風(fēng)控、數(shù)字政務(wù)等眾多領(lǐng)域。
在此基礎(chǔ)之上,鑒于大數(shù)據(jù)和人工智能二者技術(shù)本質(zhì)類似,“騰訊大數(shù)據(jù)-天工”平臺(tái)通過(guò)解決大數(shù)據(jù)和人工智能計(jì)算框架的統(tǒng)一,從而更好地適配CPU、GPU、NPU、FPGA等硬件。包括通過(guò)構(gòu)建大數(shù)據(jù)、AI基礎(chǔ)算子,統(tǒng)一元數(shù)據(jù)用于執(zhí)行優(yōu)化,統(tǒng)一批、流、圖計(jì)算形態(tài)來(lái)統(tǒng)一計(jì)算引擎,并及時(shí)編譯,代碼生成適配異構(gòu)硬件。
在智能化運(yùn)維方面,騰訊構(gòu)建了平臺(tái)大腦,從快速發(fā)現(xiàn)大數(shù)據(jù)運(yùn)行問(wèn)題到主動(dòng)發(fā)現(xiàn)問(wèn)題,再到主動(dòng)解決問(wèn)題,以此來(lái)推動(dòng),推動(dòng)萬(wàn)億級(jí)大數(shù)據(jù)分析逐步實(shí)現(xiàn)“自動(dòng)駕駛”。
據(jù)騰訊數(shù)據(jù)平臺(tái)部副總經(jīng)理劉煜宏介紹,平臺(tái)大腦預(yù)計(jì)可讓數(shù)據(jù)中心研發(fā)效率提升60%,運(yùn)營(yíng)效率提升50%,平臺(tái)服務(wù)質(zhì)量提升80%。
在蔣杰看來(lái),騰訊大數(shù)據(jù)平臺(tái)的一個(gè)主要優(yōu)勢(shì),是騰訊自身即擁有海量的數(shù)據(jù)規(guī)模,這使得騰訊大數(shù)據(jù)平臺(tái)在推出的時(shí)候,就已經(jīng)經(jīng)過(guò)海量數(shù)據(jù)的驗(yàn)證。數(shù)據(jù)顯示,目前,騰訊大數(shù)據(jù)平臺(tái)日接入消息量超過(guò)55萬(wàn)億,日實(shí)時(shí)計(jì)算量超過(guò)65萬(wàn)億,平臺(tái)整體算力超過(guò)500萬(wàn)核,日分析任務(wù)達(dá)到1500萬(wàn)。
雷鋒網(wǎng)了解到,自2009年開始,騰訊就開始深耕海量大數(shù)據(jù)處理領(lǐng)域,并在過(guò)去十余年里完成了四代更迭。
第一代是2009年-2011年,騰訊大數(shù)據(jù)主要依托Hadoop生態(tài),圍繞離線計(jì)算模式化構(gòu)建出能夠穩(wěn)定支撐小時(shí)/天級(jí)別的計(jì)算任務(wù)數(shù)據(jù)處理平臺(tái);第二段是2012-2014年,騰訊大數(shù)據(jù)通過(guò)引入Spark、Storm等實(shí)時(shí)計(jì)算處理框架,讓大數(shù)據(jù)平臺(tái)處理性能邁入毫秒級(jí)別;第三代是2015年-2019年,騰訊大數(shù)據(jù)開始朝著機(jī)器學(xué)習(xí)發(fā)展,其自研機(jī)器學(xué)習(xí)框架Angel成為國(guó)內(nèi)第一個(gè)從Linux基金會(huì)畢業(yè)的頂級(jí)AI項(xiàng)目,并推動(dòng)國(guó)內(nèi)大數(shù)據(jù)處理正式進(jìn)入機(jī)器學(xué)習(xí)時(shí)代。
而對(duì)于第四代產(chǎn)品的推出,蔣杰表示,也將繼續(xù)把技術(shù)開源,回饋給開源社區(qū),讓業(yè)界更多的朋友和同行們了解騰訊的技術(shù)增長(zhǎng)?!耙蚕M信d趣的朋友加入到我們的項(xiàng)目中,同樣也可以加入到我們團(tuán)隊(duì)中一起開創(chuàng)第四代系統(tǒng)的研發(fā),或者未來(lái)的發(fā)展,或者是開拓之路。”
對(duì)于隱私計(jì)算的發(fā)展,《白皮書》中表示:隱私計(jì)算技術(shù)正處于快速迭代和發(fā)展的階段,目前仍在實(shí)現(xiàn)用戶授權(quán)同意、數(shù)據(jù)存儲(chǔ)安全、信息主體權(quán)利保障等關(guān)鍵合規(guī)要求的有效性上存在爭(zhēng)議,這些爭(zhēng)議在一定程度上限制了隱私計(jì)算的推廣應(yīng)用。
從技術(shù)層面而言,隱私計(jì)算實(shí)現(xiàn)的數(shù)據(jù)保護(hù)功能與國(guó)內(nèi)外數(shù)據(jù)保護(hù)相關(guān)立法精神高度契合,具有廣闊的發(fā)展前景。但在全球數(shù)據(jù)合規(guī)監(jiān)管日趨嚴(yán)格的大背景下,隱私計(jì)算仍具有較大提升空間。
比如在用戶授權(quán)同意方面,根據(jù)我國(guó)《網(wǎng)絡(luò)安全法》及《民法典》的規(guī)定,數(shù)據(jù)處理者在處理數(shù)據(jù)時(shí)應(yīng)公開收集、使用規(guī)則,并經(jīng)用戶同意。從理論上而言,數(shù)據(jù)合作方通過(guò)隱私計(jì)算技術(shù)實(shí)現(xiàn)數(shù)據(jù)分析與建模,不需實(shí)際流轉(zhuǎn)數(shù)據(jù),且處理過(guò)程中的數(shù)據(jù)都進(jìn)行了匿名化處理,或不需要獲得用戶授權(quán)同意。
但實(shí)踐中,在原始數(shù)據(jù)采集階段,數(shù)據(jù)合作各方仍需獲得用戶授權(quán)同意。此外,由于個(gè)人信息的匿名化標(biāo)準(zhǔn)尚存爭(zhēng)議,因此做好告知同意的授權(quán)管理,對(duì)強(qiáng)化企業(yè)數(shù)據(jù)合規(guī)仍具有重要意義。
同樣在盧山看來(lái),數(shù)字治理的探索是一項(xiàng)系統(tǒng)性工程,僅僅依靠單一技術(shù)無(wú)法滿足當(dāng)前和未來(lái)復(fù)雜的治理需求,需要技術(shù)、法律、制度等都不斷的演進(jìn)和配合,才能找到適應(yīng)數(shù)字社會(huì)發(fā)展的治理路徑。
而在當(dāng)前這一階段,騰訊數(shù)據(jù)平臺(tái)部AI平臺(tái)部總監(jiān)陶陽(yáng)宇表示,不妨讓子彈再飛一會(huì)兒。(雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。