0
本文作者: 木子 | 2020-12-23 15:27 |
你還記得大名鼎鼎的超文本傳輸協(xié)議(HTTP)協(xié)議嗎?作為互聯(lián)網(wǎng)應(yīng)用最為廣泛的一種網(wǎng)絡(luò)傳輸協(xié)議之一,它的出現(xiàn)奠定了整個(gè)互聯(lián)網(wǎng)時(shí)代數(shù)據(jù)通信的基礎(chǔ)。
現(xiàn)在,聯(lián)邦學(xué)習(xí)領(lǐng)域的“HTTP協(xié)議”也誕生了!由同盾科技人工智能研究院自主研發(fā)的標(biāo)準(zhǔn)化聯(lián)邦交互協(xié)議:FLEX(Federated Learning EXchange)近日在全球最大的開(kāi)源社區(qū)平臺(tái)GitHub上開(kāi)源,也在人工智能頂會(huì)NeurIPS的聯(lián)邦學(xué)習(xí)研討會(huì)SpicyFL 2020上首次公布。聯(lián)邦學(xué)習(xí)的發(fā)展即將拉開(kāi)新的篇章。
“看聯(lián)邦學(xué)習(xí)了么?最近又有什么新的技術(shù)進(jìn)展!”這大概是人工智能從業(yè)者常掛在嘴邊的一句話。
作為時(shí)下最火的數(shù)據(jù)安全類技術(shù)之一,聯(lián)邦學(xué)習(xí)已經(jīng)走入了銀行、證券、保險(xiǎn)、醫(yī)療、政務(wù)、城市管理等各類應(yīng)用場(chǎng)景。
這有著深刻的時(shí)代背景。
社會(huì)進(jìn)入互聯(lián)網(wǎng)時(shí)代至今,企業(yè)生產(chǎn)、管理,運(yùn)營(yíng)過(guò)程的數(shù)字化已經(jīng)在許多行業(yè)逐步實(shí)現(xiàn),數(shù)據(jù)的積累和數(shù)據(jù)價(jià)值的挖掘成為目前關(guān)注的重點(diǎn)。除了應(yīng)用自身積累的數(shù)據(jù)資源外,使用其他企業(yè)機(jī)構(gòu)、其他行業(yè)有價(jià)值的數(shù)據(jù)自然成為破解難題的方法之一。與之對(duì)應(yīng)的,如何在使用過(guò)程中保障數(shù)據(jù)的安全,保障個(gè)人隱私不被泄露,禁止未授權(quán)數(shù)據(jù)被不當(dāng)?shù)貍鞑?、存?chǔ)和使用成為了難題。
聯(lián)邦學(xué)習(xí)被視為化解這個(gè)難題的絕佳技術(shù)。聯(lián)邦學(xué)習(xí)(Federated Learning)的本質(zhì)是一種分布式機(jī)器學(xué)習(xí)技術(shù),可以在不交換數(shù)據(jù)樣本的情況下,在多個(gè)分散的邊緣設(shè)備或服務(wù)器上訓(xùn)練算法。以達(dá)到在數(shù)據(jù)“可用不可見(jiàn)”的基礎(chǔ)上進(jìn)行安全聯(lián)合建模的作用。
2017年谷歌AI在《聯(lián)合學(xué)習(xí):協(xié)作機(jī)器學(xué)習(xí)沒(méi)有集中訓(xùn)練數(shù)據(jù)》的博客文章中首次引入“聯(lián)邦學(xué)習(xí)”的概念。2019年,谷歌實(shí)現(xiàn)了首個(gè)產(chǎn)品級(jí)的聯(lián)邦學(xué)習(xí)系統(tǒng),主要側(cè)重針對(duì)C端,在移動(dòng)手機(jī)上運(yùn)行的聯(lián)邦平均算法和分析。
在國(guó)內(nèi),以同盾科技知識(shí)聯(lián)邦體系為代表的科技力量,針對(duì)B端對(duì)于聯(lián)邦學(xué)習(xí)技術(shù)的研究和應(yīng)用也在如火如荼地展開(kāi),提升到高級(jí)別的聯(lián)邦學(xué)習(xí),致力于最終打造可信AI 3.0,幫助中國(guó)率先實(shí)現(xiàn)下一代人工智能的突破。隨著越來(lái)越多的機(jī)構(gòu)投身到聯(lián)邦學(xué)習(xí)領(lǐng)域,除帶來(lái)技術(shù)的躍遷之外,各聯(lián)邦之間也出現(xiàn)了一種山頭林立、體系割裂的趨勢(shì),聯(lián)邦學(xué)習(xí)技術(shù)的初衷就是為打破數(shù)據(jù)孤島而生,而如今卻可能帶來(lái)了新的“孤島”現(xiàn)象,那么有沒(méi)有一種方法能打通這么多不同的聯(lián)邦學(xué)習(xí)技術(shù)架構(gòu)和應(yīng)用體系,讓聯(lián)邦能在更廣的疆域和空間尺度展開(kāi)呢?
同盾科技近期開(kāi)源的FLEX協(xié)議為這個(gè)宏大的設(shè)想提供了方案。
“目前市場(chǎng)上各家開(kāi)發(fā)的聯(lián)邦學(xué)習(xí)產(chǎn)品五花八門,在實(shí)際應(yīng)用上各不兼容,這就形成了產(chǎn)品上新的數(shù)據(jù)孤島和系統(tǒng)孤島?!蓖芸萍己匣锶恕⑷斯ぶ悄苎芯吭涸洪L(zhǎng)李曉林教授談起開(kāi)源FLEX的初衷時(shí)表示,他也在NeurIPS-SpicyFL 2020研討會(huì)的圓桌論壇上宣布FLEX開(kāi)源,不但打破數(shù)據(jù)孤島,而且打破系統(tǒng)孤島。我們希望未來(lái)聯(lián)邦學(xué)習(xí)技術(shù)能夠真正成為數(shù)據(jù)價(jià)值互聯(lián)互通的橋梁和紐帶,這就需要有一套標(biāo)準(zhǔn)化的聯(lián)邦協(xié)議去定義技術(shù)交互流程,我們的FLEX協(xié)議做到的就是這樣的事情。
FLEX(Federated Learning EXchange,F(xiàn)LEX)是同盾科技人工智能研究院為知識(shí)聯(lián)邦體系打造的一套標(biāo)準(zhǔn)化的聯(lián)邦協(xié)議。它約定了聯(lián)邦過(guò)程中參與方之間的數(shù)據(jù)交換順序,以及在交換前后采用的數(shù)據(jù)加解密方法。只要參與各方能夠遵守這些約定,就可以安全地加入到聯(lián)邦中提供數(shù)據(jù)或使用聯(lián)邦服務(wù)。
FLEX協(xié)議主要包括兩層內(nèi)容:
應(yīng)用協(xié)議:這一層協(xié)議是面向聯(lián)邦算法的,為聯(lián)邦算法提供多方數(shù)據(jù)交換的應(yīng)用支撐。協(xié)議中會(huì)約定多方間數(shù)據(jù)交換的順序和采用的具體密碼算法。聯(lián)邦過(guò)程中采用的通信協(xié)議也會(huì)被封裝在這里。
公共組件:是上層應(yīng)用協(xié)議所依賴的基礎(chǔ)密碼算法和安全協(xié)議,比如同態(tài)加密、秘密分享等。
在整個(gè)FLEX協(xié)議中,對(duì)于基礎(chǔ)架構(gòu)、通信和安全三方面進(jìn)行了詳細(xì)的闡述和約定,適用于跨特征、跨樣本和遷移聯(lián)邦學(xué)習(xí)三種場(chǎng)景下的多種不同算法,清晰的對(duì)聯(lián)邦學(xué)習(xí)技術(shù)過(guò)程中聯(lián)邦共享、聯(lián)邦預(yù)處理、聯(lián)邦計(jì)算、聯(lián)邦訓(xùn)練、聯(lián)邦預(yù)測(cè)、公共組件和聯(lián)邦安全性等流程進(jìn)行了闡釋和約定,是當(dāng)前首個(gè)開(kāi)源并定義完整的標(biāo)準(zhǔn)化聯(lián)邦協(xié)議。
同盾科技FLEX協(xié)議的開(kāi)發(fā)與開(kāi)源為聯(lián)邦學(xué)習(xí)技術(shù)的發(fā)展應(yīng)用奠定了更好的基礎(chǔ)。通過(guò)FLEX協(xié)議,各類高校、研究機(jī)構(gòu)、企業(yè)和個(gè)人可以對(duì)聯(lián)邦學(xué)習(xí)技術(shù)的開(kāi)發(fā)實(shí)現(xiàn)與安全性檢測(cè)進(jìn)行更進(jìn)一步的研究與驗(yàn)證,促進(jìn)不同行業(yè)更快落地聯(lián)邦應(yīng)用。
比如在智慧金融領(lǐng)域,F(xiàn)LEX定義的聯(lián)邦技術(shù)可以應(yīng)用在反欺詐、反洗錢、智能風(fēng)控、用戶畫像挖掘、智能交叉營(yíng)銷等場(chǎng)景,幫助金融機(jī)構(gòu)打通內(nèi)部各部門的數(shù)據(jù)價(jià)值,并利用更多不同外部數(shù)據(jù)源的價(jià)值。在智慧政務(wù)領(lǐng)域,政府部門不同委辦局的數(shù)據(jù)將能夠在統(tǒng)一的聯(lián)邦平臺(tái)上打通,為政府管理和百姓生活提供更好的支持保障。在智慧醫(yī)療領(lǐng)域,不同醫(yī)院的就診數(shù)據(jù)、病史信息能夠利用聯(lián)邦模式共享,為醫(yī)學(xué)研究發(fā)展和百姓的就醫(yī)提供便利。
目前,同盾科技的FLEX協(xié)議已經(jīng)在GitHub上進(jìn)行了開(kāi)源,后續(xù)也將逐步進(jìn)行完善和更新。李曉林教授對(duì)于FLEX協(xié)議充滿了期待:“我們非常歡迎和希望業(yè)界研究使用FLEX協(xié)議,也希望更多對(duì)聯(lián)邦學(xué)習(xí)技術(shù)感興趣的人能夠加入到技術(shù)的探討和優(yōu)化中來(lái),這正是我們開(kāi)源協(xié)議的意義?!?/p>
近年來(lái),同盾科技人工智能研究院在聯(lián)邦學(xué)習(xí)領(lǐng)域不斷取得重要突破,已經(jīng)成為行業(yè)內(nèi)一支重要的領(lǐng)軍力量,F(xiàn)LEX協(xié)議的誕生不僅是研究院自身發(fā)展的一件歷史性時(shí)刻,相信它也將為國(guó)內(nèi)聯(lián)邦學(xué)習(xí)的發(fā)展做出重要貢獻(xiàn)。
附:
GitHub鏈接:請(qǐng)戳此處
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。