0
雷鋒網(wǎng) AI 科技評論按:2018 年 4 月 14 日-15 日,中國圖象圖形學(xué)學(xué)會圍繞「生物特征識別」這一主題,在中科院自動化所成功舉辦了第四期「CSIG 圖像圖形學(xué)科前沿講習(xí)班」。
生物特征識別 (BIOMETRICS),是指通過計算機(jī)利用人體所固有的生理特征(指紋、虹膜、面相、DNA 等)或行為特征 (步態(tài)、擊鍵習(xí)慣等) 來進(jìn)行個人身份鑒定的技術(shù)。
本期講習(xí)班邀請有曠視科技首席科學(xué)家孫劍,中科院自動化所研究員孫哲南、山世光、郝然、王亮,清華副教授馮建江、徐明星,中山大學(xué)教授鄭偉詩等八位學(xué)者分別就人臉、虹膜、指紋、步態(tài)、音紋等人體特征的研究現(xiàn)狀做了詳細(xì)報告。
雷鋒網(wǎng)在本文中將對 15 日王亮、鄭偉詩、徐明星、山世光的 4 場精彩報告進(jìn)行介紹。
中科院自動化所的王亮研究員首先開講,為大家?guī)聿綉B(tài)識別的報告。
首先王亮研究員介紹了步態(tài)識別的概念。步態(tài)是一種生物行為特征,步態(tài)識別的原始數(shù)據(jù)是人類行走視頻,步態(tài)識別就是通過視頻中的步態(tài)特征識別行人。
接著王亮研究員介紹了步態(tài)識別的歷史與傳統(tǒng)步態(tài)識別方法。步態(tài)識別的概念起源非常早,亞里士多德就曾分析過動物的步態(tài)。之后經(jīng)歷了19世紀(jì)的圖片、影像運(yùn)動研究,到20世紀(jì)則有了運(yùn)動模式的概念。1997有了第一篇生物步態(tài)論文。當(dāng)下則使用深度學(xué)習(xí)進(jìn)行步態(tài)識別。至于傳統(tǒng)模式識別方法,王亮研究員將其概括為基于模型的步態(tài)識別和基于姿態(tài)的步態(tài)識別。
王亮研究員進(jìn)一步介紹了當(dāng)前基于深度學(xué)習(xí)的步態(tài)識別。王亮研究員接著介紹了他們團(tuán)隊目前采用基于CNNs的多視角人類步態(tài)識別技術(shù),這項技術(shù)的識別效果良好。這項技術(shù)目前面臨訓(xùn)練數(shù)據(jù)過少的問題。
最后王亮研究員介紹了如何建立一個簡單實用的的步態(tài)識別系統(tǒng)。該系統(tǒng)使用端到端的深度神經(jīng)網(wǎng)絡(luò)來進(jìn)行步態(tài)分割以及步態(tài)識別。介紹完技術(shù),王亮研究員還展示了系統(tǒng)demo,他表示以后會著手解決多人重疊等步態(tài)識別急需解決的問題。
中山大學(xué)鄭偉詩教授接著做了行人重識別的報告。
首先鄭偉詩教授介紹了行人重識別的概念,即在不同的場景或攝像頭下如何定位識別同一個人,去追蹤這個人的運(yùn)動。隨后,他圍繞行人重識別這五年的發(fā)展和目前學(xué)術(shù)上的研究兩個方面進(jìn)行介紹。
在五年發(fā)展歷史這一部分,鄭偉詩教授從 2013 的基于 Handcrafted Feature 的 Re-ID 一直介紹到現(xiàn)在他目前正在做的 Metric Learning。今年鄭偉詩老師團(tuán)隊還將超分辨率和 Re-ID 結(jié)合在一起。
至于當(dāng)前的學(xué)術(shù)研究,鄭偉詩教授提到他們把行人重識別中傳統(tǒng)的 Metric Learning 變?yōu)榉菍ΨQ的。這是一個很好的的處理方法。在面臨一致性的問題,鄭偉詩老師采用 LDA 的方法來處理該問題,并取得很不錯的結(jié)果。
鄭偉詩教授最后總結(jié)道,不應(yīng)該把行人重識別看作一個簡單識別問題,實際應(yīng)用中的問題非常復(fù)雜。在數(shù)量眾多的攝像頭跟蹤過程中有一個攝像頭出錯很可能就會丟失目標(biāo),這是一個很值得研究解決的課題。
清華大學(xué)的徐明星教授從產(chǎn)、學(xué)、研等方面介紹了語音處理技術(shù)特別是聲紋識別的應(yīng)用。
徐明星教授首先介紹了基本概念。聲紋屬于行為特征(區(qū)別于人臉等生理特征)。相較于生理特征,語音具有雙向傳遞信息、周邊無死角、高可變性與唯一性完美統(tǒng)一等特點。這些特點不僅讓語音適合用作識別,也因此僅憑軟件算法就可以防止攻擊。
介紹完基本概念,徐明星教授將目前的聲紋應(yīng)用概括為以下幾個部分:
一:移動支付。
二:社保生存認(rèn)證。
三:社區(qū)矯正系統(tǒng)。
四:公共安全。
五:電子政務(wù)。
六:移動領(lǐng)域。
七:車聯(lián)網(wǎng)、門禁、考勤。
徐明星教授進(jìn)一步補(bǔ)充應(yīng)用中的挑戰(zhàn)即對魯棒性的要求。其中包括環(huán)境相關(guān)的聲紋魯棒性,說話人相關(guān)的聲紋魯棒性,應(yīng)用相關(guān)的聲紋魯棒性。
徐明星教授最后介紹了當(dāng)前的聲紋識別發(fā)展比較好的方向,包括語音支付、網(wǎng)絡(luò)安全、生物認(rèn)證等。
中科院計算所研究員山世光作為最后一位講者,做了本期講習(xí)班最后一場關(guān)于人臉識別技術(shù)概況的報告。
山世光研究員首先介紹了深度學(xué)習(xí)對人臉識別的影響。主要包括這幾個方面:
一:基于CNN的人臉檢測,之后拓展為多任務(wù) CNN 和 PCN。
二:完全端到端的級聯(lián)CNN用于人臉特征定位。
三:基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取,再在卷積神經(jīng)網(wǎng)絡(luò)之前加上ReST進(jìn)行人臉識別。
接著山世光研究員介紹了比較高階的新工作。包括新的損失函數(shù)如L-Softmax 、A-Softmax 、CosFace 、ArcFace 、Range Loss 、L2-constrained Softmax Loss 、Ring loss 。姿態(tài)穩(wěn)健的人臉識別如DREAM(Deep Residual Equivariant Mapping CVPR2018 )。以及基于視頻的人臉識別如DCRL(Discriminative Covariance Oriented Representation Learning )、DAN(Discriminative Aggregation Network )等。
山世光研究員緊接著介紹了當(dāng)前中國比較好的應(yīng)用方向,例如智慧社區(qū)和智慧樓宇的人臉驗證,省級甚至全國級的身份查重等。他表示深度學(xué)習(xí)給人臉識別帶來的變化是翻天覆地的,從檢測到特征定位到識別都發(fā)生了質(zhì)的變化,這個變化的主要指的是錯誤出現(xiàn)的數(shù)量級下降。但目前,仍然需要解決大數(shù)據(jù)下的精度問題,以及假臉等攻擊問題。
以上是雷鋒網(wǎng)全部報道,CSIG 圖像圖形學(xué)科前沿講習(xí)班第四期至此落下帷幕。兩天時間,八位專家為大家?guī)Я耸志视指韶浭愕膱蟾?,對人臉識別、聲紋識別、指紋識別等生物特征識別領(lǐng)域的技術(shù)發(fā)展歷史、技術(shù)原理、發(fā)展現(xiàn)狀、未來前景等進(jìn)行了深入介紹。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。