0
不久之前,奇績創(chuàng)壇創(chuàng)始人&CEO陸奇博士在一個問答欄目中被問到當下對AI的看法,他表示,“我對于AI的熱情和關注主要來自于它可以給我們社會帶來的前景。”在陸奇看來,AI的核心就是一種“獲取知識,并運用知識來達成目標的通用能力”。而這是人類至今為止發(fā)明的用途最廣、功能最強的通用能力。因為知識就是力量,是一種可以運用到我們想做的任何事物上的力量。
回看過去幾年,我國AI在數(shù)據(jù)驅動下走出實驗室,落地到金融、安防等多個領域,業(yè)內(nèi)甚至流傳“得數(shù)據(jù)者,得人工智能”的說法。2020年,國務院將數(shù)據(jù)列為繼土地、勞動力、資本、技術之后的第五種要素,以鼓勵數(shù)據(jù)的流通和價值體現(xiàn)。但出乎意料的是,短期內(nèi)AI公司獲取數(shù)據(jù)的渠道反而變得更少。一方面,數(shù)據(jù)成為生產(chǎn)要素后,個人及政府對數(shù)據(jù)的價值認識和保護意識有所提升,企業(yè)會更有選擇地開放分享數(shù)據(jù)的類型和方式;另一方面,數(shù)據(jù)作為驅動企業(yè)發(fā)展的因素之一,在法律限制及自身利益的考量下,受到各企業(yè)嚴格管控。
AI公司的進一步發(fā)展需要更多數(shù)據(jù),數(shù)據(jù)卻無法如過去般順暢流通,AI應用正陷入數(shù)據(jù)割裂的發(fā)展瓶頸。
對于如何在AI發(fā)展與隱私保護之間尋找平衡,清華大學計算機系教授張鈸給出兩個思路:一方面是隱私如何不被誤用和濫用。第二個方面是如何利用技術的手段來保護個人隱私或者團體的隱私,包括數(shù)據(jù)的安全等等。
前者屬于人工智能的治理問題,后者則是技術問題。
與此同時,一群人發(fā)現(xiàn),有著“數(shù)據(jù)可用不可見”特點的隱私安全計算或許能幫助AI公司走出數(shù)據(jù)困境,打開數(shù)據(jù)流通之門。
隱私安全計算,是在數(shù)據(jù)處理分析計算過程中,保證數(shù)據(jù)提供方不對外泄露數(shù)據(jù),無法被惡意攻擊或者其它非授權者獲取數(shù)據(jù)的技術集合,可實現(xiàn)數(shù)據(jù)的安全流通與利用。
一個經(jīng)典問題:兩個百萬富翁在街頭相遇,他們都想知道彼此誰最富有,但又不想向對方透底,在沒有第三方的幫助下,怎樣才能知道誰最有錢?
這是2000年圖靈獎得主姚期智1982年提出的“百萬富翁”問題。姚先生提出的這個問題和他提出的解決方案,成為密碼安全領域的一個大方向,推動了隱私安全計算技術的發(fā)展應用。
近兩年,隱私安全計算正成為投資人看好的新行業(yè)。據(jù)前瞻經(jīng)濟學人統(tǒng)計,2020年我國隱私安全計算行業(yè)新成立企業(yè)數(shù)量為71家,同比增長33.96%。
2021年5月至今的12個月中,該賽道的8家公司的8起融資累計超10億元,平均單輪融資金額過億元。
值得注意的是,大多數(shù)公司的融資事件發(fā)生在2020至2021年,這也反映著越來越多投資人發(fā)現(xiàn)了隱私安全計算的價值。
隱私安全計算的快速發(fā)展,一方面離不開算法的進步及計算機性能的大幅度提升,另一方面也與政策相關。
過去十幾年間隱私計算的算法得到了長足的進步,包括差分隱私、聯(lián)邦學習、同態(tài)加密和零知識證明等領域都獲得了突破性的進展。而隱私計算技術對算力與通訊帶寬的需求也由于計算機系統(tǒng)和硬件的發(fā)展獲得了很大的改善,隱私安全計算的技術終于能夠開始解決實際任務,而不僅僅是計算機領域的純理論問題。
政策方面,隨著《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》三法相繼生效,倒逼企業(yè)在數(shù)據(jù)采集、處理、使用、流通全環(huán)節(jié)重視及增強數(shù)據(jù)保護,隱私安全計算行業(yè)因此得利。
國務院今年一月印發(fā)的《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》更明確提出:“鼓勵重點行業(yè)創(chuàng)新數(shù)據(jù)開發(fā)利用模式,在確保數(shù)據(jù)安全、保障用戶隱私的前提下,調動行業(yè)協(xié)會、科研院所、企業(yè)等多方參與數(shù)據(jù)價值開發(fā)?!?/p>
這一文件的印發(fā),或將進一步加速隱私安全計算技術的發(fā)展與行業(yè)應用。
過去幾年,隱私安全計算從醫(yī)療行業(yè)不斷延伸應用至金融、政務等不同領域,整個行業(yè)也越發(fā)熱鬧。
沸點資本副總裁馬蘭從投資人的角度,向雷峰網(wǎng)(公眾號:雷峰網(wǎng))分享了近幾年她對隱私安全計算應用的觀察。
馬蘭注意到,2018年時很多金融機構將合規(guī)放在第一位,所以當時很多以監(jiān)管為切入口的企業(yè)成長。政府2019年正式提出將數(shù)據(jù)作為生產(chǎn)要素后,數(shù)據(jù)安全被提升到與合規(guī)同等重要的位置。
不過人們發(fā)現(xiàn),數(shù)據(jù)既做資產(chǎn)又做交易存在很大的數(shù)據(jù)安全問題,一批人此時將隱私安全計算引入以幫助解決這一問題。
得益于較大市場需求的出現(xiàn),2020年隱私安全計算行業(yè)的原有企業(yè)發(fā)力,同時出現(xiàn)了一些新的創(chuàng)業(yè)公司,資本也相繼跟進。因此2020年至2021年,隱私安全計算創(chuàng)業(yè)者接連找到新的落地場景,甚至產(chǎn)生一定收入。
在馬蘭看來,盡管隱私安全計算行業(yè)處于動態(tài)變化之中,但整體向著積極、更安全的狀態(tài)發(fā)展。
AAAI國際先進人工智能協(xié)會常務理事楊強曾向雷峰網(wǎng)表示,從2019年開始,他就明顯感受到人工智能難以落地、應用模式?jīng)]有普適性、AI產(chǎn)品通用性不夠等問題出現(xiàn)得更加頻繁。
近年來全球多國將數(shù)據(jù)列為核心資產(chǎn),數(shù)據(jù)因無法共享而形成一個個數(shù)據(jù)孤島,進一步阻礙AI落地。他認為,各行各業(yè)都存在數(shù)據(jù)壁壘,只有突破壁壘,增加數(shù)據(jù)的流通性,才能讓AI生態(tài)更好地發(fā)展。
在法規(guī)政策的要求下,科技頭部公司因為有著成熟的產(chǎn)品和龐大的用戶量,可從多個渠道獲取大量數(shù)據(jù),中小型企業(yè)卻沒有這種條件,難以突破數(shù)據(jù)瓶頸。
隱私安全計算是突破行業(yè)數(shù)據(jù)壁壘的一種方法,隱私安全計算讓數(shù)據(jù)在合作過程中得到安全保證,數(shù)據(jù)流通自然更為暢通。
目前,不少擁有大量數(shù)據(jù)的主體因為必須對數(shù)據(jù)信息嚴格保密,同時找不到合適的處理方式而導致數(shù)據(jù)閑置,無法發(fā)揮數(shù)據(jù)的價值。
譬如,某地方政府擁有當?shù)鼐用竦脑敿殧?shù)據(jù),為防控疫情希望建立智能傳染病防控體系,但是在缺少技術的支持下,政府很難憑一己之力建立該系統(tǒng)。如果外部招標公司幫助,居民個人數(shù)據(jù)存在泄漏風險,政府為了避免數(shù)據(jù)泄漏風險而不使用數(shù)據(jù),數(shù)據(jù)因此無法發(fā)揮應有的作用。
如果在雙方之間引入提供隱私安全計算服務的第三方,數(shù)據(jù)不直接在二者中流通,數(shù)據(jù)擁有方在合作中仗著擁有數(shù)據(jù)而強勢的情況將較少出現(xiàn),數(shù)據(jù)流通也將相對更安全。
具體而言,隱私安全計算企業(yè)將提供相應平臺,數(shù)據(jù)提供者將數(shù)據(jù)授權導入平臺中進行模型評估并優(yōu)化,完成后只向數(shù)據(jù)需求者輸出數(shù)據(jù)的價值和計算結果。整個過程中,原始數(shù)據(jù)不離開隱私安全計算平臺,數(shù)據(jù)只在平臺內(nèi)授權使用。
雙方合作過程中,隱私安全計算企業(yè)出現(xiàn)后可避免數(shù)據(jù)泄露。不過,如何保證隱私安全計算企業(yè)不會泄露、濫用數(shù)據(jù)?
隱私安全計算企業(yè)翼方健數(shù)首席科學家張霖濤表示,目前隱私安全計算仍然是一項處于發(fā)展早期的技術,各方面還有著較大的優(yōu)化空間,不過為了保護數(shù)據(jù)信息隱私,業(yè)內(nèi)已有多項措施。
以翼方健數(shù)為例,在其數(shù)據(jù)平臺訓練優(yōu)化的數(shù)據(jù)都經(jīng)過加密處理,密鑰由數(shù)據(jù)所有方擁有,翼方健數(shù)無法獲取數(shù)據(jù);其次,翼方健數(shù)的多方安全計算、聯(lián)邦學習、可信任執(zhí)行環(huán)境三大主流安全計算方式都已通過信通院認證,官方背書證明其數(shù)據(jù)安全性。
隱私安全計算的價值被看到后,包括阿里巴巴、微眾銀行、螞蟻集團、平安科技等多家公司已積極布局隱私安全計算,并推動技術應用。根據(jù)中國信通院調研數(shù)據(jù)顯示,2021年約有44%的隱私安全計算產(chǎn)品進入實施階段,占比進一步提升;處于研發(fā)階段的隱私安全計算產(chǎn)品占比相對下降,占比為19%。
在可預見的未來,隱私安全計算或將與AI深度結合,幫助AI公司更快速發(fā)展。
如張霖濤所言,隱私安全計算技術仍有不少問題等待被解決。
首先,隱私安全計算面臨生態(tài)壁壘問題。
隱私安全計算行業(yè)內(nèi)公司之間的技術不互通,數(shù)據(jù)模型在一個平臺輸出后,無法在另一家公司平臺復用,導致新的“數(shù)據(jù)孤島”問題出現(xiàn)。
其次,目前數(shù)據(jù)交易的意愿和市場還不成熟,導致很多企業(yè)把隱私安全計算當成安全合規(guī)的成本項建設。只有將場景與隱私安全計算技術深度結合,業(yè)務方從隱私安全計算受利后才能把成本項變?yōu)闋I收項,激發(fā)業(yè)務方可持續(xù)參與的意愿。
事實上,過去不少機構努力推動全國數(shù)據(jù)交易,但由于技術手段限制,結果卻不甚理想。
若結合隱私安全計算,數(shù)據(jù)交易或更為高效。
雷峰網(wǎng)了解到,翼方健數(shù)正在計劃推出一款基于隱私安全計算的“AI淘寶”。其首席市場官劉碩介紹,該平臺可將不同的AI需求方、供給方,以及數(shù)據(jù)需求方與供給方連接,使得AI產(chǎn)業(yè)鏈上有著不同能力的企業(yè)發(fā)揮各自長處,滿足不同的需求。
具體而言,該平臺集合國內(nèi)主流AI工具,平臺內(nèi)的AI企業(yè)及數(shù)據(jù)參與方可調取AI能力。與其它平臺的最大區(qū)別是,該平臺保護數(shù)據(jù)源的所有數(shù)據(jù)、AI模型。
“翼方健數(shù)是一家0數(shù)據(jù)的數(shù)據(jù)智能公司,不擁有數(shù)據(jù),只提供工具對數(shù)據(jù)進行管理,并允許客戶在獲得授權下加工和處理數(shù)據(jù),獲取數(shù)據(jù)價值。”張霖濤對雷峰網(wǎng)介紹。
翼方健數(shù)之所以有如此計劃,與其深耕行業(yè)多年,以及對不同領域公司業(yè)務發(fā)展的長期觀察相關。
翼方健數(shù)2016年成立便扎入研究隱私安全計算的開發(fā)與應用,目前其業(yè)務已從醫(yī)療拓展至政務、金融、營銷、科學等領域。過往案例中,翼方健數(shù)已在不同場景利用隱私安全計算技術解決實際問題:
利用隱私安全計算技術,翼方健數(shù)幫助有著“藥物-細胞-基因”數(shù)據(jù)庫的企業(yè),如格物致和,與AI制藥公司、生物醫(yī)藥研發(fā)技術公司,如燧坤智能達成供需合作,幫助數(shù)據(jù)所有者將數(shù)據(jù)的使用權和所有權進行分離,放心地對外賦權使用;針對招投標場景,翼方健數(shù)構建了一個AI驗證平臺,既保護了招標方的數(shù)據(jù),也保護了投標方AI企業(yè)的模型。不僅是應用在AI需求方的招標選擇上,AI驗證平臺還可以應用在技術賽事上,對AI實現(xiàn)真正的“技術評分”。
受限于實施交付復雜、計算量極大、客戶接受程度低、需要全環(huán)節(jié)保密等問題,隱私安全計算技術目前僅僅是剛剛開始被應用于越來越多的領域,隨著時間的推移和技術的進步,還許多場景有著隱私安全計算大展拳腳的機會。
以汽車行業(yè)為例,近幾年興起的智能網(wǎng)聯(lián)汽車行業(yè)中,已出現(xiàn)不少自動駕駛公司為車企提供輔助駕駛能力,比如百度Apollo牽手比亞迪、Momenta聯(lián)合上汽等。汽車行業(yè)迎來新的面貌同時,有人質疑自動駕駛公司為車企提供服務,可能通過量產(chǎn)汽車收集大量用戶、道路數(shù)據(jù),從而存在數(shù)據(jù)隱私泄露的風險。如果在雙方合作過程中引入隱私安全計算,或將避免自動駕駛公司獲得用戶敏感信息。
有著“計算機安全教母”之稱的宋曉冬教授曾公開表示,未來所有的計算都將是隱私計算。
隨著各行業(yè)數(shù)字化轉型升級的加快,數(shù)據(jù)對于行業(yè)發(fā)展的驅動作用也將越來越明顯,同時數(shù)據(jù)流動也將受到更多限制。
目前,多家公司已提出不同技術路線,提升隱私安全計算安全合規(guī)程度。隨著隱私計算逐步深入應用至更多場景,補足當前缺陷,隱私安全計算或將迎來更光明的未來。
雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。