1
本文作者: 溫曉樺 | 2016-07-25 17:57 |
金融中的人臉識別,主要用途分兩種:一種是身份核驗,即一對一。其實你已經(jīng)知道了你當(dāng)前操作的這個待核驗人的身份,接下來只要對這個身份和這個人之間進(jìn)行一個信息核驗。;另外一種我們稱之為叫1對N,應(yīng)用在規(guī)?;膱鼍皯?yīng)用中,打個比方你光顧一家服務(wù),你可能辦了貴賓卡,那么我們可以不用報名字,也不用掏出VIP卡,到門口刷一下臉?biāo)椭朗悄囊晃唬灰淄瓿珊笞詣涌坼X。這樣一個場景因為實際上誰也沒有說出誰是誰,但在這樣1:N的的情況下應(yīng)用,它可以對于不清楚的目標(biāo)對象進(jìn)行了檢索然后找到了正確的目標(biāo)對象。
其實在遠(yuǎn)程身份核驗的業(yè)務(wù)場景中,所使用的技術(shù)不只人臉識別一項。任何一個技術(shù)落地到一個實際應(yīng)用時,實際上是一種綜合的技術(shù)解決方案的應(yīng)用。比如說在1對1的識別中最常用的輔助技術(shù):身份證文字內(nèi)容識別(身份證OCR)。還有一些行業(yè)特殊性問題的解決,以手機刷臉為例,需要解決的一個問題是防止用戶在用照片偽造刷臉,我們稱之為活體識別,需要判斷進(jìn)行刷臉的是一個真人還是一個照片還是一個視頻。
很多人可能會問,人臉識別的技術(shù)水平到達(dá)一個什么樣的程度了?其實,現(xiàn)在在金融行業(yè)進(jìn)行這樣的認(rèn)證支付,其安全性已經(jīng)非常高了。單純從人臉識別這一點上來講,現(xiàn)在比較常用的是把通過率、便捷性控制在90%或者是95%,去看誤識率、安全性。
有人說為什么不設(shè)到99%,我們可以設(shè)到99%,但是99%對安全性會有影響,這兩個指標(biāo)會有沖突,金融行業(yè)要求在便捷性可接受的情況下安全性越高越好。
是不是意味著說人臉識別就已經(jīng)可以完全取代銀行卡密碼甚至達(dá)到一個更高的安全性呢?非也。
科大訊飛云平臺事業(yè)部人臉聲紋技術(shù)主管李繁表示,以人臉識別的技術(shù)來說,在最新的DFDR算法下面,人臉的分辯能力已經(jīng)達(dá)到了99.47%的狀態(tài)。但是在實際的應(yīng)用中仍然面臨著一些挑戰(zhàn)——比如當(dāng)面對一位韓國小姐的時候。當(dāng)然,聲紋技術(shù)同樣也有應(yīng)用上的一些挑戰(zhàn),比如說聲紋易變形,易受身體狀況,年齡,情緒等的影響;實際應(yīng)用中也可能會受到錄音設(shè)備的影響,所以作為一個單一的生物特征都有各己的不穩(wěn)定性。
為應(yīng)對支付領(lǐng)域的一個高安全性需求,也為了解決單一生物特征存在的一個不穩(wěn)定性,業(yè)內(nèi)提出了多生物特征融合認(rèn)證解決方案,從不同維度對兩種生物特征進(jìn)行融合計算。
早前國際生物特征組織分別從干擾用戶程度,獨立性,費用代價,易用性這四個層面對市場上在用的生物特征進(jìn)行了一個系統(tǒng)的統(tǒng)計分析,分析包括掌紋識別,簽名識別,指紋識別,語音識別,虹膜識別,視網(wǎng)膜識別,臉部識別以及溫譜識別。
理想的生物特征系統(tǒng)當(dāng)然是要具備高獨特性,高易用性,對用戶干擾程度低,且費用代價低,從這里可以看出,在人類認(rèn)知的范圍內(nèi)的聲紋識別,人臉識別技術(shù)以及人類認(rèn)知范圍內(nèi)的指紋識別,虹膜識別,和掌紋識別,為何能在各自的領(lǐng)域中發(fā)揮著重要的作用。
其中,聲紋識別技術(shù)和人臉識別技術(shù)能夠被用作便捷的身份認(rèn)證形式,與其擁有的特點是分不開的,首先這些生物特征與生俱來的,而且它都具備唯一性,不易被復(fù)制。其次這些特征都是易采集,且采集隱蔽性較強,還能夠被遠(yuǎn)程操作。
以聲紋技術(shù)來說,聲紋是根據(jù)語音波形中反映說話人心理和行為特征的語音參數(shù),自動識別說話人身份,每個人無論別人說話模仿的多么相似,他都具有獨一無二的聲紋。這是由每個人的發(fā)聲器官在成長過程中形成的,這個唯一性能夠唯一確定一個用戶的身份。
目前,聲紋識別模式對外支持了聲紋自由說、動態(tài)數(shù)字密碼、開放文本密碼、固定文本密碼。在金融支付中,動態(tài)數(shù)字密碼因其使用便捷性,目前也成為最為廣泛的聲紋識別模式,當(dāng)然它其他三種模式也有相應(yīng)的適用場景。
在這個領(lǐng)域中聲紋識別主要用途分為兩種,與人臉識別相似,一是聲紋確認(rèn),一比一比對,二是聲紋鑒別一比N比對。
而相信大家最好奇的是這個聲紋模型建立和配對的過程,究竟是怎樣的原理,能夠用算法和代碼來量化一個人的聲音。李繁告訴雷鋒網(wǎng),就科大訊飛來說,其使用了混合高斯-通用背景模型(GMM-UBM),是基于高速混合模型的說話人系統(tǒng),是說話人識別中的主流算法。
然而,基于生理特征的生物識別技術(shù)存在以下幾個先天性缺陷:一、成本高昂,通常需要專門的硬件支持;二、容易泄露和仿冒,安全性低;三、應(yīng)用不當(dāng)后果嚴(yán)重,一旦泄露身份信息幾乎無法更改。所以,生物特征識別除了基于人體本身的生物對象進(jìn)行安全監(jiān)控,業(yè)內(nèi)人士也在研究基于擊鍵等行為類生物特征進(jìn)行識別的方式。
擊鍵過程看似簡單,實際上卻非常復(fù)雜,需要很多肌肉的高度配合。久而久之,就形成了一種固定的習(xí)慣,這種習(xí)慣會在擊鍵的時間和壓力上有所反映。
研究者表示,具體的應(yīng)用中,自由文本的擊鍵特征識別和固定文本的擊鍵特征識別也有所不同。對于固定文本而言,一般長度較短,用戶鍵入固定文本時所表達(dá)的擊鍵特征受限制條件影響較大,最終的擊鍵形態(tài)也與限制條件有著緊密的聯(lián)系。這種情況下,可以直接存儲和比對擊鍵形態(tài)……對于自由文本而言,其內(nèi)容和長度不受限制,限制條件對于最終擊鍵形態(tài)的影響可能十分有限。這種情況下,可以通過兩個方面辨識用戶的擊鍵特征樣本:一是限制條件;二是傳統(tǒng)的自由文本擊鍵特征識別算法。限制條件即與數(shù)據(jù)庫存儲進(jìn)行比對;自由文本擊鍵特征識別算法也有許多現(xiàn)成方案,比如,曼哈頓距離、歐氏距離、神經(jīng)網(wǎng)絡(luò)、相對熵等等。
但也有用戶覺得,擊鍵特征是個偽命題,因為不同鍵盤實現(xiàn)的標(biāo)準(zhǔn)不同,鍵程、彈力都會受到影響。事實上,每一種技術(shù)都有缺陷,我們能做的是不斷優(yōu)化,或以多種方式彌補配合。
相關(guān)閱讀:
金融科技火熱無比時,支付場景下的風(fēng)控可以怎么做?(上)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。