0
雷鋒網(wǎng) AI 科技評(píng)論按:2018 年 4 月 14 日-15 日,中國(guó)圖象圖形學(xué)學(xué)會(huì)圍繞「生物特征識(shí)別」這一主題,在中科院自動(dòng)化所成功舉辦了第四期「CSIG 圖像圖形學(xué)科前沿講習(xí)班」。
生物特征識(shí)別 (BIOMETRICS),是指通過(guò)計(jì)算機(jī)利用人體所固有的生理特征(指紋、虹膜、面相、DNA 等)或行為特征 (步態(tài)、擊鍵習(xí)慣等) 來(lái)進(jìn)行個(gè)人身份鑒定的技術(shù)。
本期講習(xí)班邀請(qǐng)有曠視科技首席科學(xué)家孫劍,中科院自動(dòng)化所研究員孫哲南、山世光、郝然、王亮,清華副教授馮建江、徐明星,中山大學(xué)教授鄭偉詩(shī)等八位學(xué)者分別就人臉、虹膜、指紋、步態(tài)、音紋等人體特征的研究現(xiàn)狀做了詳細(xì)報(bào)告。
雷鋒網(wǎng)在本文中將對(duì) 15 日王亮、鄭偉詩(shī)、徐明星、山世光的 4 場(chǎng)精彩報(bào)告進(jìn)行介紹。
中科院自動(dòng)化所的王亮研究員首先開(kāi)講,為大家?guī)?lái)步態(tài)識(shí)別的報(bào)告。
首先王亮研究員介紹了步態(tài)識(shí)別的概念。步態(tài)是一種生物行為特征,步態(tài)識(shí)別的原始數(shù)據(jù)是人類(lèi)行走視頻,步態(tài)識(shí)別就是通過(guò)視頻中的步態(tài)特征識(shí)別行人。
接著王亮研究員介紹了步態(tài)識(shí)別的歷史與傳統(tǒng)步態(tài)識(shí)別方法。步態(tài)識(shí)別的概念起源非常早,亞里士多德就曾分析過(guò)動(dòng)物的步態(tài)。之后經(jīng)歷了19世紀(jì)的圖片、影像運(yùn)動(dòng)研究,到20世紀(jì)則有了運(yùn)動(dòng)模式的概念。1997有了第一篇生物步態(tài)論文。當(dāng)下則使用深度學(xué)習(xí)進(jìn)行步態(tài)識(shí)別。至于傳統(tǒng)模式識(shí)別方法,王亮研究員將其概括為基于模型的步態(tài)識(shí)別和基于姿態(tài)的步態(tài)識(shí)別。
王亮研究員進(jìn)一步介紹了當(dāng)前基于深度學(xué)習(xí)的步態(tài)識(shí)別。王亮研究員接著介紹了他們團(tuán)隊(duì)目前采用基于CNNs的多視角人類(lèi)步態(tài)識(shí)別技術(shù),這項(xiàng)技術(shù)的識(shí)別效果良好。這項(xiàng)技術(shù)目前面臨訓(xùn)練數(shù)據(jù)過(guò)少的問(wèn)題。
最后王亮研究員介紹了如何建立一個(gè)簡(jiǎn)單實(shí)用的的步態(tài)識(shí)別系統(tǒng)。該系統(tǒng)使用端到端的深度神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行步態(tài)分割以及步態(tài)識(shí)別。介紹完技術(shù),王亮研究員還展示了系統(tǒng)demo,他表示以后會(huì)著手解決多人重疊等步態(tài)識(shí)別急需解決的問(wèn)題。
中山大學(xué)鄭偉詩(shī)教授接著做了行人重識(shí)別的報(bào)告。
首先鄭偉詩(shī)教授介紹了行人重識(shí)別的概念,即在不同的場(chǎng)景或攝像頭下如何定位識(shí)別同一個(gè)人,去追蹤這個(gè)人的運(yùn)動(dòng)。隨后,他圍繞行人重識(shí)別這五年的發(fā)展和目前學(xué)術(shù)上的研究?jī)蓚€(gè)方面進(jìn)行介紹。
在五年發(fā)展歷史這一部分,鄭偉詩(shī)教授從 2013 的基于 Handcrafted Feature 的 Re-ID 一直介紹到現(xiàn)在他目前正在做的 Metric Learning。今年鄭偉詩(shī)老師團(tuán)隊(duì)還將超分辨率和 Re-ID 結(jié)合在一起。
至于當(dāng)前的學(xué)術(shù)研究,鄭偉詩(shī)教授提到他們把行人重識(shí)別中傳統(tǒng)的 Metric Learning 變?yōu)榉菍?duì)稱(chēng)的。這是一個(gè)很好的的處理方法。在面臨一致性的問(wèn)題,鄭偉詩(shī)老師采用 LDA 的方法來(lái)處理該問(wèn)題,并取得很不錯(cuò)的結(jié)果。
鄭偉詩(shī)教授最后總結(jié)道,不應(yīng)該把行人重識(shí)別看作一個(gè)簡(jiǎn)單識(shí)別問(wèn)題,實(shí)際應(yīng)用中的問(wèn)題非常復(fù)雜。在數(shù)量眾多的攝像頭跟蹤過(guò)程中有一個(gè)攝像頭出錯(cuò)很可能就會(huì)丟失目標(biāo),這是一個(gè)很值得研究解決的課題。
清華大學(xué)的徐明星教授從產(chǎn)、學(xué)、研等方面介紹了語(yǔ)音處理技術(shù)特別是聲紋識(shí)別的應(yīng)用。
徐明星教授首先介紹了基本概念。聲紋屬于行為特征(區(qū)別于人臉等生理特征)。相較于生理特征,語(yǔ)音具有雙向傳遞信息、周邊無(wú)死角、高可變性與唯一性完美統(tǒng)一等特點(diǎn)。這些特點(diǎn)不僅讓語(yǔ)音適合用作識(shí)別,也因此僅憑軟件算法就可以防止攻擊。
介紹完基本概念,徐明星教授將目前的聲紋應(yīng)用概括為以下幾個(gè)部分:
一:移動(dòng)支付。
二:社保生存認(rèn)證。
三:社區(qū)矯正系統(tǒng)。
四:公共安全。
五:電子政務(wù)。
六:移動(dòng)領(lǐng)域。
七:車(chē)聯(lián)網(wǎng)、門(mén)禁、考勤。
徐明星教授進(jìn)一步補(bǔ)充應(yīng)用中的挑戰(zhàn)即對(duì)魯棒性的要求。其中包括環(huán)境相關(guān)的聲紋魯棒性,說(shuō)話(huà)人相關(guān)的聲紋魯棒性,應(yīng)用相關(guān)的聲紋魯棒性。
徐明星教授最后介紹了當(dāng)前的聲紋識(shí)別發(fā)展比較好的方向,包括語(yǔ)音支付、網(wǎng)絡(luò)安全、生物認(rèn)證等。
中科院計(jì)算所研究員山世光作為最后一位講者,做了本期講習(xí)班最后一場(chǎng)關(guān)于人臉識(shí)別技術(shù)概況的報(bào)告。
山世光研究員首先介紹了深度學(xué)習(xí)對(duì)人臉識(shí)別的影響。主要包括這幾個(gè)方面:
一:基于CNN的人臉檢測(cè),之后拓展為多任務(wù) CNN 和 PCN。
二:完全端到端的級(jí)聯(lián)CNN用于人臉特征定位。
三:基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取,再在卷積神經(jīng)網(wǎng)絡(luò)之前加上ReST進(jìn)行人臉識(shí)別。
接著山世光研究員介紹了比較高階的新工作。包括新的損失函數(shù)如L-Softmax 、A-Softmax 、CosFace 、ArcFace 、Range Loss 、L2-constrained Softmax Loss 、Ring loss 。姿態(tài)穩(wěn)健的人臉識(shí)別如DREAM(Deep Residual Equivariant Mapping CVPR2018 )。以及基于視頻的人臉識(shí)別如DCRL(Discriminative Covariance Oriented Representation Learning )、DAN(Discriminative Aggregation Network )等。
山世光研究員緊接著介紹了當(dāng)前中國(guó)比較好的應(yīng)用方向,例如智慧社區(qū)和智慧樓宇的人臉驗(yàn)證,省級(jí)甚至全國(guó)級(jí)的身份查重等。他表示深度學(xué)習(xí)給人臉識(shí)別帶來(lái)的變化是翻天覆地的,從檢測(cè)到特征定位到識(shí)別都發(fā)生了質(zhì)的變化,這個(gè)變化的主要指的是錯(cuò)誤出現(xiàn)的數(shù)量級(jí)下降。但目前,仍然需要解決大數(shù)據(jù)下的精度問(wèn)題,以及假臉等攻擊問(wèn)題。
以上是雷鋒網(wǎng)全部報(bào)道,CSIG 圖像圖形學(xué)科前沿講習(xí)班第四期至此落下帷幕。兩天時(shí)間,八位專(zhuān)家為大家?guī)Я耸志视指韶浭愕膱?bào)告,對(duì)人臉識(shí)別、聲紋識(shí)別、指紋識(shí)別等生物特征識(shí)別領(lǐng)域的技術(shù)發(fā)展歷史、技術(shù)原理、發(fā)展現(xiàn)狀、未來(lái)前景等進(jìn)行了深入介紹。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。