丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給蔣寶尚
發(fā)送

0

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

本文作者: 蔣寶尚 2020-02-17 16:55
導(dǎo)語:同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

歐洲的那本《通用數(shù)據(jù)保護(hù)條例》算是數(shù)據(jù)隱私保護(hù)領(lǐng)域的圣經(jīng)了。自2018年5月份實(shí)施以來,已經(jīng)開出上億美元的罰單。

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

據(jù)不完全統(tǒng)計(jì),在近兩年的時(shí)間內(nèi),因違法GDPR而被開出的罰單規(guī)模達(dá)到了1.26億美元,其中最大的一張罰單是由法國政府對(duì)谷歌開出的5000萬歐元的罰單。那么如此嚴(yán)格的立法監(jiān)管在保護(hù)我們隱私的同時(shí),讓我們損失了什么?

數(shù)據(jù)隱私保護(hù)并不是一蹴

而就在過去十幾年中,我們的社會(huì)已經(jīng)習(xí)慣了“免費(fèi)”的網(wǎng)絡(luò)服務(wù)。免費(fèi)的搜索引擎,免費(fèi)的電子郵件以及免費(fèi)的網(wǎng)上視頻觀看。當(dāng)數(shù)據(jù)能夠帶來何種價(jià)值尚不明確時(shí),這種交易似乎是劃算的。

那時(shí)的用戶們毫不猶豫的選擇相信存儲(chǔ)他們信息的公司,并盡情享受公司提供的無縫連接的在線體驗(yàn)。但是隨著人工智能的崛起和數(shù)據(jù)分析能力的大幅度的提升,一些公司可以將用戶的“隨機(jī)軌跡”轉(zhuǎn)換成有價(jià)值的見解。定向營銷、基于位置的搜索、個(gè)性化促銷逐漸成為數(shù)據(jù)應(yīng)用的新戰(zhàn)場。

用戶的各種數(shù)據(jù)不斷整合,用戶行為粒度不斷細(xì)化,個(gè)人健康風(fēng)險(xiǎn)和選舉選擇變得更加預(yù)測.......但是,數(shù)據(jù)作為“新石油”在推動(dòng)增長和創(chuàng)新的同時(shí),也在一定程度上侵犯了用戶的隱私權(quán)。

例如,當(dāng)年的劍橋分析事件就是一個(gè)典型案例。事件起因是一組學(xué)者收集了大量用戶數(shù)據(jù),并與劍橋分析公司分享了這些信息,劍橋分析公司是一家商業(yè)數(shù)據(jù)分析公司,據(jù)稱這家公司在2016年總統(tǒng)選舉中用這些方法影響選民?,F(xiàn)在也有事實(shí)證明,智能家居也在進(jìn)一步危害了隱私。

例如2019年的4月份,亞馬遜智能音箱Echo也被曝出隱私問題;同年7月份,比利時(shí)廣播公司(VRT)也曝出谷歌聘請(qǐng)的合同工收聽人們與谷歌智能音箱的對(duì)話錄音。

這些隱私問題都在意味著大眾對(duì)免費(fèi)數(shù)字服務(wù)的熱情,逐漸轉(zhuǎn)向了對(duì)大型科技公司及數(shù)據(jù)共享做法厭惡。因此數(shù)據(jù)監(jiān)管一詞應(yīng)運(yùn)而生,這也標(biāo)志著人們對(duì)機(jī)構(gòu)的信任度處于歷史的最低水平。大眾對(duì)立法的呼聲越來越高,那么立法是重新恢復(fù)秩序的正確方法么?

監(jiān)管能否恢復(fù)信任?

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

(雷鋒網(wǎng))

歐美立法者最早接受了監(jiān)管的挑戰(zhàn),2016年4月27 歐洲通過《通用數(shù)據(jù)保護(hù)條例》,并于2018年5月25日正式生效?!稐l例》為歐盟公民帶來了一套新的隱私權(quán)利。

它規(guī)定,歐盟消費(fèi)者將有權(quán)知道自己的哪些數(shù)據(jù)被社交媒體公司保存了下來,并有權(quán)要求刪除這些數(shù)據(jù)。新規(guī)實(shí)施以后,違規(guī)公司最高可能面臨全球年收入4%的巨額罰款。

但是健全的法律體系保護(hù)數(shù)據(jù)的隱私固然重要,可是也造成了一些意想不到的后果。隱私法規(guī)的問題在于:它限制了組織對(duì)數(shù)據(jù)的處理方式,限制各個(gè)領(lǐng)域的協(xié)作,對(duì)經(jīng)濟(jì)產(chǎn)生了不利影響,畢竟分工和協(xié)作才是人類進(jìn)步的根源。

另一方面,個(gè)人信息保護(hù)相關(guān)法律的出臺(tái)直接影響與數(shù)據(jù)產(chǎn)業(yè)相關(guān)的公司業(yè)務(wù)。例如由于于“通用數(shù)據(jù)保護(hù)條例”的提出,QQ國際版于2018年的5月20日后不再為歐洲用戶提供服務(wù),QQ國際版本退出了歐洲市場。

Google也因違反反壟斷法,被歐盟要求課以史上最貴27億美元罰金。當(dāng)時(shí)谷歌CEO Sundar Pichai提出警示稱:由于裁決,安卓可能不再免費(fèi),可能分配模式會(huì)變成像它的競爭對(duì)手蘋果一樣。也就是說,相關(guān)數(shù)據(jù)安全保護(hù)措施的出臺(tái),使得有些服務(wù)我們沒有辦法享受到了。

所以,歐洲監(jiān)管了,結(jié)果Google被罰,騰訊跑了。法律的出臺(tái)必然會(huì)在某種程度上促進(jìn)社會(huì)和行業(yè)的發(fā)展,遵守法律和提供更好的服務(wù)不是不可兼得的事情。那么除了監(jiān)管,還有別的方式來實(shí)現(xiàn)共贏么?

超越監(jiān)管,新技術(shù)打破數(shù)據(jù)孤島

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

(雷鋒網(wǎng))

當(dāng)前出臺(tái)的法規(guī)顯然沒有考慮到數(shù)字經(jīng)濟(jì)環(huán)境下的協(xié)作機(jī)會(huì)。

2018年5月美國國立衛(wèi)生研究院(National Institutes Of Health)關(guān)于2型糖尿病的研究暫停。原因是這項(xiàng)研究包括芬蘭的健康記錄,根據(jù)GDPR,歐盟的法律不允許再向美國研究人員提供這些記錄。隱私得到了保護(hù),合作者沒有得到分享的數(shù)據(jù),大規(guī)模數(shù)據(jù)集沒有得到有效利用,醫(yī)療技術(shù)無法進(jìn)步。

最終付出代價(jià)的患者有可能等不到新技術(shù)的出現(xiàn),從而喪失生命。如果由于數(shù)據(jù)隱私法規(guī)而無法進(jìn)行合作,從而阻礙我們進(jìn)步,那么我們的未來是否會(huì)發(fā)生倒退?會(huì)不會(huì)使得企業(yè)因?yàn)楸O(jiān)管喪失知識(shí)交流的能力?如果因?yàn)閿?shù)據(jù)隱保護(hù),合作、交流受到了限制。那么我們口中的效率、增長、科學(xué)發(fā)現(xiàn)以及重大科研創(chuàng)新都可能受到阻礙。

同態(tài)加密解決數(shù)據(jù)傳輸

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

(雷鋒網(wǎng))

幸好,上帝為我們關(guān)閉了一扇窗,就在另一個(gè)方向打開了一扇窗。同態(tài)加密(Homomorphic encryption)作為一種新的隱私增強(qiáng)技術(shù)出現(xiàn)了。這種技術(shù)可以使組織者無需信任就可以進(jìn)行協(xié)作。

同態(tài)加密理論在 1978 年首次推出,被認(rèn)為是密碼學(xué)領(lǐng)域的圣杯之一,自其出生以來就像傳奇一樣遙不可及;直到2009年,IBM的研究人員Gentry才首次設(shè)計(jì)出一個(gè)真正的全同態(tài)加密體制,即可以在不解密的條件下對(duì)加密數(shù)據(jù)進(jìn)行任何可以在明文上進(jìn)行的運(yùn)算,使得對(duì)加密信息仍能進(jìn)行深入和無限的分析,而不會(huì)影響其保密性。

翻譯成“中文”就是:加密算法可以隔著加密層去進(jìn)行運(yùn)算。經(jīng)過這一突破,存儲(chǔ)他人機(jī)密電子數(shù)據(jù)的服務(wù)提供商就能受用戶委托來充分分析數(shù)據(jù),不用頻繁地與用戶交互,也不必看到任何隱私數(shù)據(jù)。即人們可以委托第三方對(duì)數(shù)據(jù)進(jìn)行處理而不泄露信息。

具體而言,使用同態(tài)加密模型,可以保護(hù)隱私不受數(shù)據(jù)處理者身的影響:無法查看正在處理的個(gè)人詳細(xì)信息,只能看到處理的最終結(jié)果。企業(yè)可以對(duì)他們收集的數(shù)據(jù)感到更加安全。特別是云計(jì)算可以從同態(tài)加密方案中受益,因?yàn)樗鼈兛梢赃\(yùn)行計(jì)算而無需訪問原始未加密的數(shù)據(jù)。

在上述提到的糖尿病研究暫停的情況下,同態(tài)加密的使用可以緩解高度敏感數(shù)據(jù)共享的安全問題,并促進(jìn)重大疾病方面取得寶貴進(jìn)展。在網(wǎng)絡(luò)安全的世界中,可以將“攻擊的數(shù)據(jù)”與相應(yīng)的組織和政府共享,從而能夠在保護(hù)數(shù)據(jù)的機(jī)密性的同時(shí),不會(huì)違反數(shù)據(jù)保護(hù)法規(guī)。

聯(lián)邦學(xué)習(xí)解決數(shù)據(jù)應(yīng)用

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招


同態(tài)加密的運(yùn)算效率最近取得了重大提升,所以聯(lián)邦學(xué)習(xí)就變成可以解決隱私,同時(shí)又可以解決小數(shù)據(jù)、數(shù)據(jù)孤島問題的利器。聯(lián)邦學(xué)習(xí)的概念最初由谷歌在2016年提出,在中國,香港科技大學(xué)講席教授、微眾銀行首席人工智能官(CAIO)楊強(qiáng)教授算是聯(lián)邦學(xué)習(xí)研究第一人。

聯(lián)邦學(xué)習(xí)可以讓參與各方在不披露底層數(shù)據(jù)的前提下共建模型,之后利用整個(gè)數(shù)據(jù)聯(lián)邦內(nèi)的數(shù)據(jù)資源,提高每個(gè)成員的模型表現(xiàn)。通俗來說,深度學(xué)習(xí)時(shí)代,每個(gè)AI企業(yè)的技術(shù)能力是單打獨(dú)斗式的;而聯(lián)邦學(xué)習(xí)的出現(xiàn),更為緊密、安全地將各個(gè)AI企業(yè)聯(lián)系在了一起,聯(lián)邦中的每個(gè)成員都可以用最快的速度提升自身能力的同時(shí)汲取別人的長處,最終獲得共同成長。

譬如A廠商有校園數(shù)據(jù)、B廠商有工廠數(shù)據(jù)、C廠商有社區(qū)數(shù)據(jù),且這三家廠商都使用了聯(lián)邦學(xué)習(xí)技術(shù)。從業(yè)務(wù)層面出發(fā),A、B、C這三家廠商便直接獲得了兩種能力:1、最快速地優(yōu)化自身業(yè)務(wù);2、最快速地拓展新業(yè)務(wù)。

最快速地優(yōu)化自身業(yè)務(wù)表現(xiàn)在,平臺(tái)每天會(huì)有若干個(gè)類似A廠商的企業(yè)向平臺(tái)輸入加密后的數(shù)據(jù)模型,而這些數(shù)據(jù)模型中有A廠商非常缺乏的其他數(shù)據(jù)信息,而A廠商便可根據(jù)這些數(shù)據(jù)去更新自己的算法模型。

最快速地拓展新業(yè)務(wù)表現(xiàn)在,A、B、C每家廠商都有各自構(gòu)建好的模型,通過匯總?cè)サ玫礁蟮臄?shù)據(jù)模型,在不流通數(shù)據(jù)的情況下得到數(shù)據(jù)流通的最好效果,通過資源互補(bǔ)可以在最短時(shí)間內(nèi)安全地獲得對(duì)方的能力,去拓展新業(yè)務(wù)。

從隱私保護(hù)層面來看,通常智能攝像頭產(chǎn)生的數(shù)據(jù)會(huì)被上傳到后臺(tái)服務(wù)器中,然后由部署在服務(wù)器上的神經(jīng)網(wǎng)絡(luò)模型根據(jù)收集到的大量數(shù)據(jù)進(jìn)行訓(xùn)練得到一個(gè)模型,服務(wù)商根據(jù)這個(gè)模型來為用戶提供服務(wù)。這是一種集中式的模型訓(xùn)練方法,這種方式很難保證數(shù)據(jù)隱私安全。

而聯(lián)邦學(xué)習(xí)就不再是讓數(shù)據(jù)發(fā)送到后臺(tái),而是在每個(gè)企業(yè)自己的服務(wù)器上進(jìn)行訓(xùn)練,并加密上傳訓(xùn)練模型,后臺(tái)會(huì)綜合成千上萬的用戶模型后再反饋給用戶改進(jìn)方案。

相較傳統(tǒng)學(xué)習(xí)模式,聯(lián)邦學(xué)習(xí)的優(yōu)點(diǎn)是顯而易見的:1、在聯(lián)邦學(xué)習(xí)的框架下,各參與者地位對(duì)等,能夠?qū)崿F(xiàn)公平合作;2、數(shù)據(jù)保留在本地,避免數(shù)據(jù)泄露,滿足用戶隱私保護(hù)和數(shù)據(jù)安全的需求;3、能夠保證參與各方在保持獨(dú)立性的情況下,進(jìn)行信息與模型參數(shù)的加密交換,并同時(shí)獲得成長;4、建模效果與傳統(tǒng)深度學(xué)習(xí)算法建模效果相差不大;5、聯(lián)邦學(xué)習(xí)是一個(gè)閉環(huán)的學(xué)習(xí)機(jī)制,模型效果取決于數(shù)據(jù)提供方的貢獻(xiàn)。

在傳統(tǒng)的方法下,用戶只是人工智能的旁觀者——使用,但沒有參與;而在聯(lián)邦學(xué)習(xí)場景下,每個(gè)人都是“馴龍高手”,每個(gè)人都是人工智能發(fā)展的參與者。

綜上所述,現(xiàn)在是圍繞信息共享進(jìn)行范式轉(zhuǎn)變的時(shí)候了。當(dāng)可以不暴露而共享信息,不暴露就可以分析信息時(shí),我們無需為了信任而忍痛放棄協(xié)作。當(dāng)在數(shù)據(jù)共享下的協(xié)作變的頻繁,我們的想象力可以再次釋放,那么一些重大問題的解決只是時(shí)間的問題。

參考來源:
https://www.weforum.org/agenda/2020/01/new-paradigm-data-sharing/

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

數(shù)據(jù)共享面臨大考,同態(tài)加密+聯(lián)邦學(xué)習(xí)支招

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說