6
本文作者: 宮雅卓 | 2015-09-10 14:31 |
編者按:本文作者宮雅卓,聚虹光電創(chuàng)始人,上海交大博士。對(duì)生物特征識(shí)別有所研究,尤在虹膜識(shí)別領(lǐng)域有15年的專研。
2015年9月8日,被眾多極客戲稱為“全球最不務(wù)正業(yè)”的“百度深度學(xué)習(xí)實(shí)驗(yàn)室”,向全球正式發(fā)布了趣味換臉APP——臉優(yōu)Face It.
在這款A(yù)PP上,用戶自拍或上傳任意一張臉部照片,即可自動(dòng)生成素材。“臉優(yōu)”既可以利用前置攝像頭將素材貼合到用戶的臉上,進(jìn)行實(shí)時(shí)演繹;也可以使用后置攝像頭,將不同的臉與海報(bào)、電影、電視劇畫面貼合,毫無PS痕跡。通過“點(diǎn)擊拍照”或“錄制20秒視頻”分享到微信、微博、QQ空間。
“不開刀不留疤,臉優(yōu)一鍵變大咖”,這款趣味換臉應(yīng)用的背后,是人臉識(shí)別技術(shù)。
人臉識(shí)別技術(shù),由三個(gè)關(guān)鍵部分組成:人臉檢測(cè)、特征提取、匹配識(shí)別。
1、在背景景物中進(jìn)行人臉檢測(cè)
也就是說,臉優(yōu)首先判斷用戶上傳的照片中有沒有人臉,如果有,再利用人臉的左右對(duì)稱性定位臉形,并通過膚色、眼睛顏色、毛發(fā)等特征確定種族。
2、對(duì)人臉進(jìn)行預(yù)處理,提取人臉特征
一旦臉形確定,就可以從中心擴(kuò)散,利用人體特征器官的灰度變化、縱深復(fù)雜度和匹配度算法,對(duì)諸多關(guān)鍵點(diǎn)進(jìn)行檢測(cè)。
(臉優(yōu):帥哥變狗狗)
臉優(yōu)的“圖像拼合”功能,是找到嘴、鼻子、眼睛、眉毛等關(guān)鍵點(diǎn),與用戶選定的圖片素材相互拼合。人臉的關(guān)鍵點(diǎn)數(shù)量,可以分為不同等級(jí),如5、25兩級(jí),分別對(duì)應(yīng)不同的調(diào)整需求。一般情況下,檢測(cè)到雙眼、鼻尖、兩邊嘴角這5個(gè)關(guān)鍵點(diǎn),就可以實(shí)現(xiàn)步驟1的定位人臉。
(湯姆·克魯斯的5個(gè)人臉關(guān)鍵點(diǎn) )
如果采用25個(gè)人臉關(guān)鍵點(diǎn),在娛樂性應(yīng)用中可以對(duì)更多人臉細(xì)節(jié)進(jìn)行調(diào)整,如修片神器“美圖秀秀”深諳“大眼睛小臉”的審美,鎖定眼睛、嘴、下頜等多個(gè)關(guān)鍵點(diǎn),讓女生一秒變女神。
2015年火爆全球的微軟“猜年齡 How-Old.net”,則是根據(jù)臉上27個(gè)隨著年齡變化明顯的人臉特征,如眼角、嘴角、鼻子等關(guān)鍵點(diǎn),判斷用戶的性別和年齡?!皻q月是把殺豬刀”,隨著時(shí)光流逝,歲月磨蝕,皮膚會(huì)出現(xiàn)棕褐色暗斑和皺紋,眼角和嘴角也會(huì)下垂,而老化正是影響人臉識(shí)別精度的關(guān)鍵因素。
(25個(gè)關(guān)鍵點(diǎn)對(duì)應(yīng)的人臉部位)
3、匹配識(shí)別
人臉識(shí)別(Face Identification)就是將待識(shí)別的人臉與數(shù)據(jù)庫(kù)中的已知人臉匹配,判斷用戶的身份。國(guó)內(nèi)婚戀網(wǎng)站世紀(jì)佳緣,采用人臉識(shí)別技術(shù),從海量數(shù)據(jù)中篩選出與用戶上傳照片最相似的人臉,為單身男女“牽線搭橋”,本質(zhì)上就是看哪一對(duì)年輕人最有“夫妻相”。百度魔圖,曾經(jīng)推出一款HTML5游戲,用戶自拍或上傳照片后,游戲就會(huì)告訴你和哪個(gè)明星相似,相似度是多少百分比。
人臉識(shí)別技術(shù),用于“征婚”、“追星”這類對(duì)識(shí)別精度要求不高的娛樂應(yīng)用,是可以滿足要求的。但是,一旦用于高安全等級(jí)的場(chǎng)景,人臉識(shí)別精度就很不理想了。最戲劇性的案例是,澳大利亞悉尼機(jī)場(chǎng)曾采用一套具有最高識(shí)別精度的人臉識(shí)別系統(tǒng),希望在乘客中識(shí)別出恐怖分子,而這套人臉識(shí)別系統(tǒng)的精度實(shí)在讓人失望,居然把美國(guó)著名女明星薇諾娜-瑞德 Winona Ryder 錯(cuò)認(rèn)成了恐怖大亨本-拉登 Osama bin Laden。
(人臉識(shí)別出錯(cuò)啦:薇諾娜-瑞德與本-拉登真的像嗎?)
花巨資采購(gòu)的人臉識(shí)別系統(tǒng),為什么會(huì)犯這樣的低級(jí)錯(cuò)誤?
最重要的原因是,人臉的“非剛體性”特征。
“非剛體性”主要表現(xiàn)為人臉圖像在光照、姿態(tài)、表情等不同采集條件下的差異,發(fā)型、胡須、化妝、飾物、著裝的變化,以及年齡、疾病、外傷等因素的影響。人臉特征先天就是不穩(wěn)定的,隨著外部條件不斷變化的,這才是導(dǎo)致人臉識(shí)別精確度不高的根本原因。
在高安全性應(yīng)用中,人臉識(shí)別技術(shù)是不能獨(dú)立使用的,往往要與識(shí)別精度更高的其他生物特征配合使用,進(jìn)行多模態(tài)識(shí)別。最常見的多模態(tài)組合,就是“人臉+虹膜”。
“人臉+虹膜”的多模態(tài)識(shí)別系統(tǒng)
“人臉+虹膜”的多模態(tài)識(shí)別系統(tǒng),一般使用流程是:采用監(jiān)控?cái)z像頭對(duì)來往人流進(jìn)行精度較低的人臉識(shí)別(誤識(shí)率大約1/1000),一旦發(fā)現(xiàn)與警方提供的嫌疑犯面部相似的人,便會(huì)發(fā)出警報(bào),再采用精度更高的虹膜識(shí)別(誤識(shí)率大約1/100萬),進(jìn)一步精準(zhǔn)判斷罪犯的身份。
人臉,在無需用戶配合的情況下就可以采集到照片,幾乎沒有侵犯性的用戶體驗(yàn),使其成為“具有最高易用性”的生物特征;而虹膜,是公認(rèn)具有“最高識(shí)別精度”的生物特征。因此,“人臉+虹膜”的多模態(tài)應(yīng)用,將兩者的優(yōu)點(diǎn)(高易用性、高精確性)集于一身,才是目前生物識(shí)別應(yīng)用中最有優(yōu)勢(shì)的技術(shù)方案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。