0
本文作者: 王德清 | 2021-04-20 22:08 |
兩個百萬富翁在街上相遇,他們都想知道誰更富有,但又不愿意讓對方知道自己擁有的真正財富。如何在沒有第三方的情況下,讓對方知道誰更有錢?
這是中國科學(xué)院院士姚期智在1982年提出的“百萬富翁”設(shè)想。隨著云計算、人工智能技術(shù)的不斷發(fā)展,數(shù)據(jù)成為了繼土地、勞動力、資本、技術(shù)之外的第五大生產(chǎn)要素,其價值不言而喻。
與此同時,無論是個人還是企業(yè),對于數(shù)據(jù)的隱私保護(hù)也愈加重視。此外,我國的《數(shù)據(jù)安全法》(草案)、《個人信息保護(hù)法》(草案)等代表性法律法規(guī)相繼出臺,嚴(yán)格要求在數(shù)據(jù)使用過程中做好隱私保護(hù),例如不允許數(shù)據(jù)離開本地、不允許未經(jīng)授權(quán)使用個人數(shù)據(jù)等等。
然而隨著數(shù)字化進(jìn)程的不斷深入,數(shù)據(jù)融合應(yīng)用成為了關(guān)鍵一環(huán),如何打破數(shù)據(jù)保護(hù)與數(shù)據(jù)價值挖掘之間的矛盾,成為了行業(yè)亟需解決的痛點。
姚期智院士針對數(shù)據(jù)領(lǐng)域所提出的“百萬富翁”設(shè)想,正一步一步的走進(jìn)現(xiàn)。
事實上,就在姚期智提出“百萬富翁”設(shè)想的同時,姚期智還發(fā)布了一個名為“多方安全計算”(Secure Multi-Party Computation,簡稱MPC)的理論框架。然而,由于算力等因素的制約,MPC并未在提出之初,就凸顯出其價值。
隨著,IT基礎(chǔ)設(shè)施的不斷發(fā)展,數(shù)據(jù)融合應(yīng)用趨勢不斷加快,以MPC為代表的隱私計算再次“躥火”。
學(xué)術(shù)界,近年來有關(guān)隱私計算的學(xué)術(shù)會議和論文呈現(xiàn)爆發(fā)式增長,產(chǎn)業(yè)界則也愈發(fā)關(guān)注隱私計算技術(shù)和產(chǎn)品,各企業(yè)都爭相投入到隱私計算的研發(fā)和產(chǎn)品化工作。
中國互聯(lián)網(wǎng)金融協(xié)會發(fā)布的《金融業(yè)數(shù)據(jù)要素融合應(yīng)用研究》的報告中,將多方安全計算、聯(lián)邦學(xué)習(xí)、數(shù)據(jù)脫敏、差分隱私、可信計算列為可用于支撐金融業(yè)數(shù)據(jù)要素更好融合的五種技術(shù)。
Gartner則預(yù)測,到2025年,將有一半的大型企業(yè)會通過隱私計算賦能多方數(shù)據(jù)合作場景中的數(shù)據(jù)融合應(yīng)用。
在騰訊高級執(zhí)行副總裁看來,隱私計算的興起,為人們提供了在數(shù)據(jù)安全合規(guī)、融合應(yīng)用過程中尋求發(fā)展和安全之間平衡點的技術(shù)路徑和解決思路,其正在成為未來數(shù)字治理的最有效路徑之一。
隱私計算到底又是什么東西呢?據(jù)騰訊近日發(fā)布的《隱私計算白皮書》(下稱:白皮書)解釋:隱私計算(Privacy Computing)是一種由兩個或多個參與方聯(lián)合計算的技術(shù)和系統(tǒng),參與方在不泄露各自數(shù)據(jù)的前提下通過協(xié)作對他們的數(shù)據(jù)進(jìn)行聯(lián)合機器學(xué)習(xí)和聯(lián)合分析。
說的文藝一點,隱私計算可以讓數(shù)據(jù)相知但并不相識。
對于個人消費者而言,隱私計算的應(yīng)用可以保障個人的信息安全;對于企業(yè)和機構(gòu),隱私計算不僅可以保護(hù)企業(yè)在采集、存儲、分析等過程中的關(guān)鍵信息、商業(yè)秘密等數(shù)據(jù),還可以促進(jìn)企業(yè)的跨界數(shù)據(jù)合作;而對于政府而言,隱私計算在提升了社會數(shù)據(jù)安全保護(hù)的同時,還可以將數(shù)據(jù)要素融合從而推動城市產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程。
隨著國家、地方、企業(yè)一級個人對于數(shù)據(jù)安全愈加重視,數(shù)字化進(jìn)程又依賴于數(shù)據(jù)的融合應(yīng)用。
因此,在騰訊數(shù)據(jù)平臺部總經(jīng)理蔣杰看來,隱私計算需要以更加安全的方式打通數(shù)據(jù)孤島,橋接多方數(shù)據(jù),以統(tǒng)一的數(shù)據(jù)處理引擎更高效地挖掘數(shù)據(jù)價值,并以智能化的方式驅(qū)動整個數(shù)據(jù)處理閉環(huán),為開發(fā)者、企業(yè)、以及政府的數(shù)字化、智能化升級打下堅實基礎(chǔ)。
就在此洞察之下,騰訊發(fā)布了第四代數(shù)智融合計算平臺“騰訊大數(shù)據(jù)-天工”
據(jù)蔣杰介紹,在安全方面,“騰訊大數(shù)據(jù)-天工”采用自研隱私計算技術(shù),從機器學(xué)習(xí)到大數(shù)據(jù)分析為各個場景提供全方位保護(hù),去中心化的架構(gòu)則能避免單點隱私泄露風(fēng)險。除此之外,在安全性上,“騰訊大數(shù)據(jù)-天工”可以提供3072bit(金融行業(yè)要求的是2048bit)業(yè)界最高強度加密和TEE硬件雙保險,最大限度確保數(shù)據(jù)安全。
憑借該技術(shù),騰訊大數(shù)據(jù)相關(guān)團隊獲得iDash 2020世界隱私計算大賽冠軍,安全性能領(lǐng)冠全球。據(jù)雷鋒網(wǎng)了解,金融級安全強度的騰訊隱私計算技術(shù)已廣泛應(yīng)用在醫(yī)療、金融風(fēng)控、數(shù)字政務(wù)等眾多領(lǐng)域。
在此基礎(chǔ)之上,鑒于大數(shù)據(jù)和人工智能二者技術(shù)本質(zhì)類似,“騰訊大數(shù)據(jù)-天工”平臺通過解決大數(shù)據(jù)和人工智能計算框架的統(tǒng)一,從而更好地適配CPU、GPU、NPU、FPGA等硬件。包括通過構(gòu)建大數(shù)據(jù)、AI基礎(chǔ)算子,統(tǒng)一元數(shù)據(jù)用于執(zhí)行優(yōu)化,統(tǒng)一批、流、圖計算形態(tài)來統(tǒng)一計算引擎,并及時編譯,代碼生成適配異構(gòu)硬件。
在智能化運維方面,騰訊構(gòu)建了平臺大腦,從快速發(fā)現(xiàn)大數(shù)據(jù)運行問題到主動發(fā)現(xiàn)問題,再到主動解決問題,以此來推動,推動萬億級大數(shù)據(jù)分析逐步實現(xiàn)“自動駕駛”。
據(jù)騰訊數(shù)據(jù)平臺部副總經(jīng)理劉煜宏介紹,平臺大腦預(yù)計可讓數(shù)據(jù)中心研發(fā)效率提升60%,運營效率提升50%,平臺服務(wù)質(zhì)量提升80%。
在蔣杰看來,騰訊大數(shù)據(jù)平臺的一個主要優(yōu)勢,是騰訊自身即擁有海量的數(shù)據(jù)規(guī)模,這使得騰訊大數(shù)據(jù)平臺在推出的時候,就已經(jīng)經(jīng)過海量數(shù)據(jù)的驗證。數(shù)據(jù)顯示,目前,騰訊大數(shù)據(jù)平臺日接入消息量超過55萬億,日實時計算量超過65萬億,平臺整體算力超過500萬核,日分析任務(wù)達(dá)到1500萬。
雷鋒網(wǎng)了解到,自2009年開始,騰訊就開始深耕海量大數(shù)據(jù)處理領(lǐng)域,并在過去十余年里完成了四代更迭。
第一代是2009年-2011年,騰訊大數(shù)據(jù)主要依托Hadoop生態(tài),圍繞離線計算模式化構(gòu)建出能夠穩(wěn)定支撐小時/天級別的計算任務(wù)數(shù)據(jù)處理平臺;第二段是2012-2014年,騰訊大數(shù)據(jù)通過引入Spark、Storm等實時計算處理框架,讓大數(shù)據(jù)平臺處理性能邁入毫秒級別;第三代是2015年-2019年,騰訊大數(shù)據(jù)開始朝著機器學(xué)習(xí)發(fā)展,其自研機器學(xué)習(xí)框架Angel成為國內(nèi)第一個從Linux基金會畢業(yè)的頂級AI項目,并推動國內(nèi)大數(shù)據(jù)處理正式進(jìn)入機器學(xué)習(xí)時代。
而對于第四代產(chǎn)品的推出,蔣杰表示,也將繼續(xù)把技術(shù)開源,回饋給開源社區(qū),讓業(yè)界更多的朋友和同行們了解騰訊的技術(shù)增長?!耙蚕M信d趣的朋友加入到我們的項目中,同樣也可以加入到我們團隊中一起開創(chuàng)第四代系統(tǒng)的研發(fā),或者未來的發(fā)展,或者是開拓之路?!?/p>
對于隱私計算的發(fā)展,《白皮書》中表示:隱私計算技術(shù)正處于快速迭代和發(fā)展的階段,目前仍在實現(xiàn)用戶授權(quán)同意、數(shù)據(jù)存儲安全、信息主體權(quán)利保障等關(guān)鍵合規(guī)要求的有效性上存在爭議,這些爭議在一定程度上限制了隱私計算的推廣應(yīng)用。
從技術(shù)層面而言,隱私計算實現(xiàn)的數(shù)據(jù)保護(hù)功能與國內(nèi)外數(shù)據(jù)保護(hù)相關(guān)立法精神高度契合,具有廣闊的發(fā)展前景。但在全球數(shù)據(jù)合規(guī)監(jiān)管日趨嚴(yán)格的大背景下,隱私計算仍具有較大提升空間。
比如在用戶授權(quán)同意方面,根據(jù)我國《網(wǎng)絡(luò)安全法》及《民法典》的規(guī)定,數(shù)據(jù)處理者在處理數(shù)據(jù)時應(yīng)公開收集、使用規(guī)則,并經(jīng)用戶同意。從理論上而言,數(shù)據(jù)合作方通過隱私計算技術(shù)實現(xiàn)數(shù)據(jù)分析與建模,不需實際流轉(zhuǎn)數(shù)據(jù),且處理過程中的數(shù)據(jù)都進(jìn)行了匿名化處理,或不需要獲得用戶授權(quán)同意。
但實踐中,在原始數(shù)據(jù)采集階段,數(shù)據(jù)合作各方仍需獲得用戶授權(quán)同意。此外,由于個人信息的匿名化標(biāo)準(zhǔn)尚存爭議,因此做好告知同意的授權(quán)管理,對強化企業(yè)數(shù)據(jù)合規(guī)仍具有重要意義。
同樣在盧山看來,數(shù)字治理的探索是一項系統(tǒng)性工程,僅僅依靠單一技術(shù)無法滿足當(dāng)前和未來復(fù)雜的治理需求,需要技術(shù)、法律、制度等都不斷的演進(jìn)和配合,才能找到適應(yīng)數(shù)字社會發(fā)展的治理路徑。
而在當(dāng)前這一階段,騰訊數(shù)據(jù)平臺部AI平臺部總監(jiān)陶陽宇表示,不妨讓子彈再飛一會兒。(雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。