0
本文作者: 張棟 | 2019-11-25 10:56 |
夢想與現(xiàn)實(shí)從來都是糾葛著的,AI也不例外。
以AI落地最多、最快的安防行業(yè)為例,過去幾年,行業(yè)各類神捕、鷹眼等產(chǎn)品讓人眼花繚亂。
漸漸地,AI成為了無所不能的代名詞。
但是AI在安防行業(yè)的真實(shí)應(yīng)用,還有很多現(xiàn)實(shí)問題亟需解決。
宇視CEO張鵬國提到,“當(dāng)前AI落地能力與用戶需求存有較大差距,前者還需面對數(shù)據(jù)隱私保護(hù)與安全管控、低成本、流程再造、組織變革等挑戰(zhàn)?!?nbsp;
具體來看,最為核心的痛點(diǎn)有二:
其一,數(shù)據(jù)不夠多元,且異常封閉。
中國擁有龐大的人口數(shù)量、用戶量及圖像采集點(diǎn),相關(guān)企業(yè)得到數(shù)據(jù)之后經(jīng)過篩選、過濾、疊加、組合,會(huì)對自身算法效果有階段性提升。
但這類提升屬于個(gè)人式的、微乎其微式的。
每個(gè)廠商所建設(shè)的AI系統(tǒng)類似一個(gè)又一個(gè)的“煙囪”,“煙囪式”架構(gòu)也就是垂直的體系結(jié)構(gòu)。
每一個(gè)IT系統(tǒng)都有自己的存儲和設(shè)備,以及獨(dú)立的管理工具和數(shù)據(jù)庫,不同的系統(tǒng)不能共享資源、不能交付和訪問,形成了資源孤島和信息孤島。
由于不同企業(yè)的數(shù)據(jù)庫模型設(shè)計(jì)和針對的目標(biāo)有所不同,他們也無法直接交換、共享模型。
即便相關(guān)企業(yè)間的數(shù)據(jù)庫可以融合,但受制于隱私、安全等問題,也絕不可如此為之。
有場景缺數(shù)據(jù)、有數(shù)據(jù)難共享。這是包括AI安防在內(nèi)的諸多行業(yè)目前存在的普遍問題,也是阻礙AI普惠的最大痛點(diǎn)。
其二,缺乏優(yōu)質(zhì)數(shù)據(jù),算法不夠精準(zhǔn)。
由于缺乏足夠優(yōu)質(zhì)數(shù)據(jù)作為訓(xùn)練支撐,大多企業(yè)依靠開源框架微創(chuàng)新,然后采用低價(jià)策略搶占市場,導(dǎo)致整個(gè)行業(yè)喪失了做基礎(chǔ)原創(chuàng)技術(shù)創(chuàng)新動(dòng)力的案例。
堅(jiān)持自研是一條漫長且艱苦的路,沒人知道數(shù)年的努力能不能換得一次數(shù)量級的提升,也沒人知道高投入后是否得到與之相匹配的回報(bào)。
對此有人或許會(huì)提到,基于安防行業(yè)自身天然的高試錯(cuò)率,小數(shù)點(diǎn)后的算法精度數(shù)量級提升對于項(xiàng)目的最終歸屬?zèng)]有大的改變。
其實(shí),現(xiàn)階段與安防相關(guān)的AI技術(shù)精準(zhǔn)度還遠(yuǎn)遠(yuǎn)沒有達(dá)到天花板,分類檢測、分割、以及對整個(gè)圖像區(qū)域分類問題均還未得到很好解決。
概括而言,AI技術(shù)在安防市場上的應(yīng)用主要還存有幾個(gè)挑戰(zhàn):
1、認(rèn)知問題相較感知問題較難解決。感知問題可以用神經(jīng)網(wǎng)絡(luò)函數(shù)逼近,相比之下認(rèn)知問題解決起來比較棘手,比如如何教會(huì)機(jī)器辨識一把椅子。
2、在弱線索、遮擋、模糊、對象追蹤等情況下,人類在識別的過程中通常會(huì)依據(jù)常識,并加入豐富的想象及推理。但是想要將這些能力傳授給機(jī)器則非常困難。
3、計(jì)算機(jī)視覺技術(shù)帶給機(jī)器的能力不只是用來觀察世界,而是需要與世界建立聯(lián)系,從而一起做交互,而想要做到“交互”這一步,還有很長一段距離。
基于安防場景的不斷變化,其對算法迭代的要求一定是非常嚴(yán)苛且上升的。
在這個(gè)市場中,誰能夠看到算法精度提升解鎖的更多場景,并根據(jù)場景的變化做到最為快速且精準(zhǔn)的反應(yīng),誰就能在未來競比中走得更遠(yuǎn)。
一方面,AI在安防行業(yè)的探索才剛剛開始;另一方面,做好AI所必須的數(shù)據(jù)養(yǎng)料有限且質(zhì)量較差,不同數(shù)據(jù)源之間存在難以打破的壁壘。
除了少數(shù)幾家擁有海量用戶、具備產(chǎn)品和服務(wù)優(yōu)勢的巨無霸企業(yè)外,大多數(shù)中小型AI安防企業(yè)難以以一種合理、合法的方式跨越人工智能落地的數(shù)據(jù)鴻溝,或者需要付出巨大的成本來解決這一問題。
此外,隨著大數(shù)據(jù)的發(fā)展,重視數(shù)據(jù)隱私和安全已經(jīng)成為一種世界性的趨勢,一系列條例的出臺更是加劇了數(shù)據(jù)獲取的難度,這也給人工智能的落地應(yīng)用帶來了前所未有的挑戰(zhàn)。
何解?
針對這個(gè)問題,雷鋒網(wǎng)同時(shí)采訪了六位學(xué)術(shù)界、工業(yè)界領(lǐng)頭人,得到的答案比較一致:從目前的研究進(jìn)展來看,“聯(lián)邦學(xué)習(xí)”技術(shù)可能是解決以上問題的最佳選擇。
聯(lián)邦學(xué)習(xí)的概念最初由谷歌在2016年提出,在中國,香港科技大學(xué)講席教授、微眾銀行首席人工智能官(CAIO)楊強(qiáng)教授算是聯(lián)邦學(xué)習(xí)研究第一人。之后包括微眾銀行、騰訊、平安科技、華為、京東等在內(nèi)的國內(nèi)企業(yè)和機(jī)構(gòu)推動(dòng)聯(lián)邦學(xué)習(xí)進(jìn)入了學(xué)術(shù)研究與行業(yè)落地新階段。
聯(lián)邦學(xué)習(xí)之所以能夠在如此短的時(shí)間里迅速由一個(gè)構(gòu)想變?yōu)橐婚T學(xué)科,主要因?yàn)樗梢宰寘⑴c各方在不披露底層數(shù)據(jù)的前提下共建模型,之后利用整個(gè)數(shù)據(jù)聯(lián)邦內(nèi)的數(shù)據(jù)資源,提高每個(gè)成員的模型表現(xiàn)。
通俗來說,深度學(xué)習(xí)時(shí)代,每個(gè)AI企業(yè)的技術(shù)能力是單打獨(dú)斗式的;而聯(lián)邦學(xué)習(xí)的出現(xiàn),更為緊密、安全地將各個(gè)AI企業(yè)聯(lián)系在了一起,聯(lián)邦中的每個(gè)成員都可以用最快的速度提升自身能力的同時(shí)汲取別人的長處,最終獲得共同成長。
譬如A廠商有校園數(shù)據(jù)、B廠商有工廠數(shù)據(jù)、C廠商有社區(qū)數(shù)據(jù),且這三家廠商都使用了聯(lián)邦學(xué)習(xí)技術(shù)。
從業(yè)務(wù)層面出發(fā),A、B、C這三家廠商便直接獲得了兩種能力:1、最快速地優(yōu)化自身業(yè)務(wù);2、最快速地拓展新業(yè)務(wù)。
最快速地優(yōu)化自身業(yè)務(wù)表現(xiàn)在,平臺每天會(huì)有若干個(gè)類似A廠商的企業(yè)向平臺輸入加密后的數(shù)據(jù)模型,而這些數(shù)據(jù)模型中有A廠商非常缺乏的其他數(shù)據(jù)信息,而A廠商便可根據(jù)這些數(shù)據(jù)去更新自己的算法模型。
最快速地拓展新業(yè)務(wù)表現(xiàn)在,A、B、C每家廠商都有各自構(gòu)建好的模型,通過匯總?cè)サ玫礁蟮臄?shù)據(jù)模型,在不流通數(shù)據(jù)的情況下得到數(shù)據(jù)流通的最好效果,通過資源互補(bǔ)可以在最短時(shí)間內(nèi)安全地獲得對方的能力,去拓展新業(yè)務(wù)。
從隱私保護(hù)層面來看,通常智能攝像頭產(chǎn)生的數(shù)據(jù)會(huì)被上傳到后臺服務(wù)器中,然后由部署在服務(wù)器上的神經(jīng)網(wǎng)絡(luò)模型根據(jù)收集到的大量數(shù)據(jù)進(jìn)行訓(xùn)練得到一個(gè)模型,服務(wù)商根據(jù)這個(gè)模型來為用戶提供服務(wù)。
這是一種集中式的模型訓(xùn)練方法,這種方式很難保證數(shù)據(jù)隱私安全。
而聯(lián)邦學(xué)習(xí)就不再是讓數(shù)據(jù)發(fā)送到后臺,而是在每個(gè)企業(yè)自己的服務(wù)器上進(jìn)行訓(xùn)練,并加密上傳訓(xùn)練模型,后臺會(huì)綜合成千上萬的用戶模型后再反饋給用戶改進(jìn)方案。
相較傳統(tǒng)學(xué)習(xí)模式,聯(lián)邦學(xué)習(xí)的優(yōu)點(diǎn)是顯而易見的:
1、在聯(lián)邦學(xué)習(xí)的框架下,各參與者地位對等,能夠?qū)崿F(xiàn)公平合作;
2、數(shù)據(jù)保留在本地,避免數(shù)據(jù)泄露,滿足用戶隱私保護(hù)和數(shù)據(jù)安全的需求;
3、能夠保證參與各方在保持獨(dú)立性的情況下,進(jìn)行信息與模型參數(shù)的加密交換,并同時(shí)獲得成長;
4、建模效果與傳統(tǒng)深度學(xué)習(xí)算法建模效果相差不大;
5、聯(lián)邦學(xué)習(xí)是一個(gè)「閉環(huán)」的學(xué)習(xí)機(jī)制,模型效果取決于數(shù)據(jù)提供方的貢獻(xiàn)。
在傳統(tǒng)的方法下,用戶只是人工智能的旁觀者——使用,但沒有參與;而在聯(lián)邦學(xué)習(xí)場景下,每個(gè)人都是“馴龍高手”,每個(gè)人都是人工智能發(fā)展的參與者。
值得一提的是,目前聯(lián)邦學(xué)習(xí)已經(jīng)從概念走進(jìn)商業(yè)世界,而且誕生了一系列基于行業(yè)場景的新平臺、新應(yīng)用。
今年9月,微眾銀行與極視角聯(lián)手打造了中國首個(gè)視覺聯(lián)邦學(xué)習(xí)系統(tǒng)。
以視頻攝像頭中的火焰識別為例,AI工程師們可能千辛萬苦訓(xùn)練了一個(gè)火焰檢測的識別模型,想要用在監(jiān)控?cái)z像頭中,識別是否有燃燒現(xiàn)象,從而對火災(zāi)發(fā)生的可能性進(jìn)行分析,實(shí)現(xiàn)火災(zāi)預(yù)警。
原有的AI算法可以比較準(zhǔn)確地識別有明顯大面積燃燒和明火發(fā)生的常見場景。然而,遇到打火機(jī)點(diǎn)出的火焰時(shí),攝像頭就有些“懵”了。
如果想讓模型增強(qiáng)識別能力,傳統(tǒng)的AI訓(xùn)練要求適用方能夠提供一些數(shù)據(jù)樣本,而這又出現(xiàn)了因網(wǎng)絡(luò)帶寬導(dǎo)致的算法準(zhǔn)確率不高及數(shù)據(jù)隱私等問題。
種種難題前,極視角與微眾銀行合作,利用聯(lián)邦學(xué)習(xí)技術(shù)打造了一個(gè)計(jì)算機(jī)視覺模型的“超級市場”。
圖片來源:fedai.org
在聯(lián)邦視覺系統(tǒng)中,依托本地建模,在保證各方數(shù)據(jù)不出本地的情況下,即可提升AI算法準(zhǔn)確率。
在一次公開分享中,微眾銀行AI部門副總經(jīng)理陳天健透露,“在‘聯(lián)邦視覺系統(tǒng)’項(xiàng)目中,通過聯(lián)邦學(xué)習(xí)技術(shù),整體模型的性能提升了15%,且模型效果無損失,極大地提升了建模效率。”
安防行業(yè)歷經(jīng)兩次跨越,從最開始的通用級產(chǎn)品到解決方案,再到內(nèi)容分析前置,接下來則是平臺運(yùn)營。
未來,安防行業(yè)背后是兆億級別且呈幾何式增長的巨大流量入口。
IoT時(shí)代,數(shù)據(jù)處理并非孤島式,未來智慧城市中的每個(gè)人、每個(gè)攝像頭都是可感知的,而聯(lián)邦學(xué)習(xí)可以發(fā)揮“群體智能”的力量,進(jìn)而升級和變革行業(yè)。
優(yōu)化、互補(bǔ)、安全、高效,毫不夸張地說,聯(lián)邦學(xué)習(xí)無疑是目前業(yè)界出現(xiàn)的最有可能推動(dòng)AI普惠的技術(shù)路線。
它也是AI行業(yè)從B2C到C2B模式的一個(gè)變革起點(diǎn),它的成熟發(fā)展可以讓更多人更低門檻地參與到AI社會(huì)的構(gòu)建。
同時(shí),安防領(lǐng)域的應(yīng)用還只是聯(lián)邦學(xué)習(xí)賦能的冰山一角,未來包括金融、零售、醫(yī)療、政務(wù)、工業(yè)等各行各業(yè)、各個(gè)場景都可以依據(jù)此技術(shù)實(shí)現(xiàn)降本增效、開源節(jié)流。
未來,聯(lián)邦學(xué)習(xí)必須生態(tài)化。聯(lián)邦學(xué)習(xí)的精髓在于互補(bǔ)、在于合作、在于生態(tài)。聯(lián)邦學(xué)習(xí)正如一個(gè)操作系統(tǒng),一家企業(yè)是玩不轉(zhuǎn)的,唯有各方共同參與,才有機(jī)會(huì)落地生花。
和羹之美,在于合異;上下之益,在能相濟(jì)。
聯(lián)邦學(xué)習(xí)全面賦能之路還很遙遠(yuǎn), 而這些已經(jīng)落地的“種子”,正在一粒粒萌芽、破土,被人們所肯定。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。