0
本文作者: 嘉嘉 | 2022-07-04 17:40 | 專題:IEEE X ATEC科技思享會 |
IEEE x ATEC
IEEE x ATEC科技思享會是由專業(yè)技術學會IEEE與前沿科技探索社區(qū)ATEC聯(lián)合主辦的技術沙龍。邀請行業(yè)專家學者分享前沿探索和技術實踐,助力數(shù)字化發(fā)展。
在社會數(shù)字化進程中,隨著網(wǎng)絡化、智能化服務的不斷深入,伴隨服務衍生出的各類風險不容忽視。本期分享會的主題是《網(wǎng)絡欺詐的風險與對抗》。五位嘉賓將從不同的技術領域和觀察視角,圍繞網(wǎng)絡欺詐場景下的風險及對抗技術展開分享。
以下是張曼老師的演講。
演講嘉賓 | 張 曼
IEEE WIE北京分會主席
北京郵電大學人工智能學院研究員、博士生導師
大家好,主持人好,各位嘉賓好。很榮幸在科技思享會上給大家做一個簡單的分享。在網(wǎng)絡時代的各種應用中,大家都不可避免地需要確認身份。我們今天介紹的內(nèi)容就是人工智能用于這個身份識別,也就是生物特征識別技術,以及這項技術在這個時代遇到的新的機遇、挑戰(zhàn)和新的安全問題。
相信大家在生活中,聽說過、甚至可能遇到過身份失竊,或者會被別人假冒。比如假冒某人身份,給其家人打電話說住院了急需用錢、需要匯款,以及新聞中我們會看到一些恐怖分子冒用身份實施恐怖行為。這種身份的失竊和假冒,會給個人造成巨大的經(jīng)濟損失,也威脅著國家安全,我們需要尋找更加安全、可靠、簡單、便捷的身份認證方式。
隨著智能化的發(fā)展,人與人在網(wǎng)絡上的接觸日益增加,網(wǎng)絡身份認證也更加頻繁,在網(wǎng)頁上、智能家居、智能汽車等各個方面都有這種互聯(lián)網(wǎng)身份認證需求。
在智能化網(wǎng)絡時代的身份認證,我們就需要用到生物特征識別技術,如指紋、人臉、虹膜……為智能設備、智能網(wǎng)絡、智能服務、智能安防等提供自動精準的身份標識。
生物特征是人體天然的密碼,這張圖上的綠色框線圈出的是生理特征,即身體的一部分(如指紋、人臉、靜脈、虹膜、靜脈等),紅色框線圈出的是行為特征(如步態(tài)、簽名、語音等),它是我們習慣性的動作。我們利用人體固有的生理特征、行為特征,來識別人的身份,叫做生物特征識別。生物特征應該是長時間之內(nèi)是不變的,并且隨身攜帶,比如“出門忘了帶手”是不可能發(fā)生的。它比起傳統(tǒng)的密碼、鑰匙,會更加方便安全和可靠。
我們列出的這些用于身份識別的生物特征,是比較常見的。它主要有以下特點。第一是普遍性,大部分人都應該有這個生物特征。第二是唯一性,每一個人都是不一樣的,才能用來認證身份。第三是穩(wěn)定性,他在很長一段時間,甚至人的整個生命周期內(nèi)都是不變的。第四是可采集性,這不得不提到大家熟知的DNA,DNA做身份識別確實很準確,但如果我回家開個門還需要拔根頭發(fā)或者抽管血來驗一下DNA,這樣的身份認證方式是非常不方便的。那么DNA,就不適用于我們?nèi)粘5纳矸葑R別。另外,就是安全性和用戶的可接受性,用于身份識別的生物特征應該不能夠被篡改,而且用戶操作方便,能夠接受才可以。
生物特征識別技術和我們公眾的個人利益是息息相關的,它也是我們國家信息化建設重大戰(zhàn)略需求的具體體現(xiàn)。我們國家近些年來就已經(jīng)發(fā)布了很多的政策來支持生物特征識別技術的發(fā)展,比如十三五規(guī)劃、“互聯(lián)網(wǎng)+”人工智能三年行動實施方案。在2017年的《新一代人工智能發(fā)展規(guī)劃》中,也提到了我們國家要大力地發(fā)展生物特征識別技術。
近幾年,工信部也發(fā)布了一系列文件來支持生物特征識別的發(fā)展。當然他們會更加側(cè)重于生物特征識別技術的產(chǎn)業(yè)和應用。比如提到了拓展生物特征識別技術在安防、金融一些重點領域的應用;支持構(gòu)建基于商用密碼、指紋識別、人臉識別等技術的網(wǎng)絡身份認證體系,這也就將生物識別技術和網(wǎng)絡安全有機地結(jié)合到一起。
整個生物特征識別的產(chǎn)業(yè)發(fā)展正在以一個非??斓乃俣仍谠鲩L,大約每年27%的增幅,預計到2023年全球的生物特征識別市場將超過400億的美元。
我們在生活當中會看到非常多的生物特征識別的應用。比如手機、門鎖用指紋、人臉來解鎖;智能汽車駕駛座有人臉識別的模塊,可以識別出你的身份,并將汽車自動調(diào)整成自己所喜歡的參數(shù),從而有非常舒適的駕駛體驗。除此之外,在一些國家的管理,如出入境管理、社會福利、生產(chǎn)管理、金融安全等等,幾乎每一個領域都能看到生物識別的應用場景。
第二部分來談一談生物特征識別在新的時代所遇到的新的機遇和新的挑戰(zhàn)。剛才我們說到,現(xiàn)在是一個智能化時代,也是一個網(wǎng)絡的時代,很多事情都需要在網(wǎng)絡上完成。在看不見摸不著的時候,我們對身份認證的要求更加高了。這個時代為生物特征識別技術提供了新的機遇,同時也提出了非常多的挑戰(zhàn)。比如,原來我們進行生物特征識別,是需要人來配合機器,擺一個非常板正的姿勢來拍一張圖像,對用戶來講非常不方便。如何使用戶舒適且快捷地進行生物特征識別認證。是一個我們目前面臨的新的挑戰(zhàn)。
第二個是魯棒性問題,現(xiàn)在有非常多的身份認證需求、非常多的傳感器,就拿攝像頭來說,不同的廠家有很多的不同的型號,不同的參數(shù)等等。那么它們拍攝的圖像一定會有非常大的差異。再加上一些外部的影響,比如光照、噪聲等,也會影響到認證結(jié)果。怎樣在多元化的數(shù)據(jù)中快速準確地進行身份認證,也是一個新的挑戰(zhàn)。
最后是泛在網(wǎng)絡環(huán)境下,怎么樣來保證生物識別系統(tǒng)的安全性,下面來一一進行講解。
首先是便捷性。在生物特征識別技術發(fā)展初期,我們是用一個非常笨重的機器來讀取,但現(xiàn)在正逐步往便攜式、移動式的方向發(fā)展。比如在手表上、眼鏡上嵌入非常小的生物識別模塊等,這種小巧精致,經(jīng)濟時尚的設備,能夠讓用戶在整個穿戴過程中的認證體驗非常好。同時,對圖像的質(zhì)量,以及輕量級計算提出了非常高的要求。
第二個難點是在復雜場景中的生物特征識別,這也是行業(yè)公認的一個難題。2013年,IEEE TPAMI(人工智能領域頂級期刊)前主編Anil K.Jain寫了一篇生物特征識別綜述,里面描述了這個生物特征識別技術已經(jīng)解決的問題、沒有解決的問題,以及未來發(fā)展中可能遇到的一些問題等等。但是實際上他所提到的一些解決的問題,并非完全解決。在這種受控場景中,人臉識別、指紋識別能夠達到將近100%的準確率。但是一旦到了這種復雜場景、非受控場景,圖像會有一些背景的變化、姿態(tài)的變化,有形變、有噪聲等等影響。那么就會對識別系統(tǒng)的魯棒性提出非常大的挑戰(zhàn)。
在生物特征識別的過程中,傳統(tǒng)的視覺感知處理流程是先對輸入的圖像對做一個定位和分割,提取其中的特征,通過特征的表達、分類,最終得到識別結(jié)果。這種傳統(tǒng)的處理方式,需要有經(jīng)驗的人手工來設置一些生物特征提取算法,它缺少了和環(huán)境信息的交互以及一些知識庫的決策支持?,F(xiàn)在,我們用到的是基于深度網(wǎng)絡的生物特征識別方法,這是一種端到端的模式識別方法,我們輸入一個圖像,系統(tǒng)自動輸出結(jié)果,可以是有效區(qū)域標注,也可以是識別的結(jié)果等等。把特征提取和模式分類的兩個小階段,集合到一個非線性影射的深度模型里去,從而對大數(shù)據(jù)的語義理解產(chǎn)生了變革性的思路,即從大數(shù)據(jù)中來直接挖掘其中包含的語義信息。
再舉一個例子,就是我們這種復雜背景下的人形分割。原來我們訓練進行檢測和分割的小模塊,可能會受噪聲、光照、姿態(tài)影響。而我們基于深度學習的方法可以設定不同模塊的大小,它可以由粗到精,輸入到不同的深度神經(jīng)網(wǎng)絡。最后再來對它的分割結(jié)果進行一個融合,能夠得到精度比較高的人形分割結(jié)果。
我們提出了泛在網(wǎng)絡采集的虹膜圖像數(shù)據(jù)驅(qū)動的方式。原來我們需要對虹膜有效的紋理區(qū)域,先進行一個定位和分割,把虹膜紋理區(qū)域的光斑、眼睫毛區(qū)域去掉,最后得到它有效的紋理區(qū)域,然后再在它的紋理區(qū)域上,進行特征提取、進而比對等等。而使用數(shù)據(jù)驅(qū)動的自動學習方法,當輸入一張虹膜圖像,系統(tǒng)可自動地把它的概念要素等,直接從網(wǎng)絡當中輸出。我們既可以輸出有效的虹膜紋理區(qū)域,也可以輸出人員身份和相關標簽。 這種數(shù)據(jù)驅(qū)動的自動學習方法,比傳統(tǒng)的紋理分析,精度能夠得到有效的提升。
在步態(tài)識別領域當中,最近也有非常多深度學習的應用。步態(tài)就是利用人走路的姿勢進行身份的識別。左邊這張圖是一個人走路的步態(tài)序列圖的示意。下面是他在不同狀態(tài)下的走路姿態(tài)。原來我們是用步態(tài)能量圖進行分類來進行步態(tài)識別,外界干擾會影響識別精度,導致無法進行大規(guī)模實戰(zhàn)應用?,F(xiàn)在用了基于深度學習的方法,我們可以首先對步態(tài)特征進行能量圖的提取,再將它投入到我們的深度神經(jīng)網(wǎng)絡當中,最后得到一個比對的數(shù)值。然后,經(jīng)過基于深度學習研發(fā)之后,我們的步態(tài)識別的算法得到了非常大的提升,現(xiàn)在已經(jīng)在安防領域得到了應用。
第三部分就是這個生物特征識別領域常見的一些安全問題。不同模態(tài)的生物特征識別,它的流程都是相似的。它在這個生物特征識別系統(tǒng)的每一個環(huán)節(jié)都有可能遭受到安全的攻擊。
首先第一個就是假體攻擊,之前就有人用這個小熊軟糖或者透明膠帶獲取到別人的指紋信息,騙過了指紋的讀取器。還有人用靜態(tài)的人臉照片,通過了人臉識別系統(tǒng)。
為了應對這樣的風險,我們的方案主要是在生物特征識別系統(tǒng)當中加一些活體檢測的模塊,比如說虹膜識別當中,虹膜中間瞳孔的特性是對光照的敏感性,光照暗的時候瞳孔就會張大,光照弱的時候瞳孔就會縮小,我們通過環(huán)境光的變化、瞳孔縮放,來驗證該虹膜是不是來自真實的人體。
第二個就是人臉的活體檢測。相信大家都遇到過,比如在健康寶、支付寶登錄注冊的時候,讓用戶眨眨眼、張張嘴,或者念一段話,這種系統(tǒng)來引導用戶做出一些特定的動作,其實就是在對這個用戶進行一個活體檢測,確定用戶是不是來自于一個活的人體。除此之外,還可以使用多模態(tài)融合的方式,比如說想要仿造生物特征數(shù)據(jù),仿造一個相對容易,如果需要仿造一個人所有的生物特征數(shù)據(jù),基本上是不可能的。這種多模態(tài)的融合認證就可以在很大程度上來保障安全性。
第二個安全問題是數(shù)據(jù)泄露的問題,大家可能也都看過一些新聞,人臉圖像、生物特征圖像遭到了泄露,引起非常大的恐慌。
除了一些比較常用的信息安全、網(wǎng)絡安全的方法,比如在可信執(zhí)行環(huán)境中進行數(shù)據(jù)加密、本地存儲方案之外,目前在生物特征識別領域,提到比較多的是聯(lián)邦學習。聯(lián)邦學習有一個非常有意思的解釋:這個圖上,羊相當于我們要訓練的模型,草相當于訓練模型需要的數(shù)據(jù),原來我們的訓練需要把數(shù)據(jù)聚集到一起訓練模型,相當于把草聚到一起給羊吃飽。把所有數(shù)據(jù)聚集到一起,勢必會有一定的數(shù)據(jù)泄露風險。聯(lián)邦學習讓草還呆在原來的地方,羊去不同的地方吃草。相當于模型在不同的數(shù)據(jù)庫訓練,羊在這里吃點、那里吃點,最終還給主人一個吃飽的羊,主人不去關心吃了什么草,只要吃飽就行。同理,在生物識別當中,我們只需要最終得到一個訓練好的模型,至于他用到什么樣的數(shù)據(jù)進行訓練,我們不去過多關注,也不會隱含數(shù)據(jù)泄漏風險,這個是生物特征識別領域中比較火的話題。
最后就是“偽造”的問題。大家可能看過,視頻、圖像的篡改、偽造、自動生成等等技術,這些技術如果僅僅用于娛樂還是挺好玩的。但是一旦被濫用,它一定會威脅到個人和企業(yè)的合法權(quán)益,甚至危害到公共安全和國家安全。比如惡意地偽造一些國家領導人,或者惡意入侵用戶系統(tǒng)等等,都是非常危險的事情。
現(xiàn)在我們也在研究面向開放環(huán)境的人臉鑒別。我們通過人臉的局部特征和全局特征的多流感知特征融合的方法來區(qū)分當前圖像到底是真實的圖像還是偽造的圖像。
國家出臺了很多的法律來保障我們的這項技術安全健康地發(fā)展。如前幾年頒布的《網(wǎng)絡安全法》,《個人信息保護法》等等。在法律的要求下,相關機構(gòu)也制定了很多的國家標準。比如像《信息安全技術》,《個人信息安全規(guī)范》。在《個人信息安全規(guī)范》的大框架下,對人臉、步態(tài)、聲紋、基因等又做了細化的要求,現(xiàn)在已經(jīng)到了報批的階段,預計會很快實行。
最后,再做一個小結(jié),今天的分享當中提到的生物特征識別技術,為我們保障社會穩(wěn)定和公共安全,以及為網(wǎng)絡上方便快捷的認證,提供了一種便捷可靠的身份認證方式。我們在工作、生活等很多場合都能夠見到生物特征識別技術的身影。
當然,不同的生物特征模態(tài),一定是有不同的特點和不同的適用場景。比如指紋識別就適用于近距離的場所進行接觸式的識別。步態(tài)識別適用于遠距離的識別,我們可以采用多模態(tài)的方式,使應用場景更加豐富。這就好比一個人在成長過程中,如果只攝入一種食物,身體上攝入的維生素就比較單一,我們需要攝取多樣的蔬菜和水果來獲取全面的維生素,生物特征識別系統(tǒng)也是需要用多種模態(tài)進行融合,最終能提升精度,拓展應用場景。
右上方這張圖就是一個人臉、手形、指紋多模態(tài)融合的一個系統(tǒng)。或者用一種模態(tài)的不同信息也可以進行融合,比如每個人有10個指頭,我把10個指頭的指紋來進行一個融合,這樣子也能夠有效地提升識別精度和安全性。
生物特征識別技術,在我們的實際應用當中,目前還是面臨著非常多的挑戰(zhàn)。便捷性、魯棒性、安全性等等,也都是未來重要的發(fā)展方向。生物識別安全和隱私問題,得到了高度的關注,也需要我們從技術、法律層面提供多方面、綜合的解決方案。
以上就是我的分享,謝謝大家。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。