5
繼百度深度學(xué)習(xí)研究院、騰訊優(yōu)圖以及Face++之后,小米最新的人臉檢測算法日前也在業(yè)界最權(quán)威的FDDB數(shù)據(jù)集上拿下了第一的成績。
根據(jù)小米聯(lián)合創(chuàng)始人黃江吉公開的信息,小米此次研發(fā)的新算法基于深度卷積檢測網(wǎng)絡(luò)(Faster RCNN Bootstrapped by Hard Negative Mining),即利用深度卷積檢測網(wǎng)絡(luò),同時學(xué)習(xí)人臉和非人臉特征,從而準(zhǔn)確識別出人臉的位置和大小。
雷鋒網(wǎng)第一時間聯(lián)系了參與這一項目的小米聯(lián)合創(chuàng)始人黃江吉,他表示小米人臉檢測改良了現(xiàn)有的方法,尤其是針對比較模糊的人臉有明顯的優(yōu)化,不過具體細(xì)節(jié)還要等到相關(guān)論文公布才能知曉。
當(dāng)然,在此之前我們需要了解的是,人臉測試可分為人臉識別、人臉檢測、人臉表情、人臉年齡、人臉性別等等,這其中人臉識別和人臉檢測是最主流的兩個方向。
人臉識別的目的就是找出圖片中的人臉,然后識別人臉是誰,目前,全球人臉識別的數(shù)據(jù)集最多,如WebFace、MegaFace以及LFW(Labeled Faces in the Wild)等。LFW是人臉識別研究領(lǐng)域比較有名的人臉圖像集,LFW庫共有5749個人的13233幅圖像,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。
例如,F(xiàn)acebook Deepface、香港中文大學(xué)湯曉鷗教授的DeepID以及Face++都在LFW上進(jìn)行了相應(yīng)的測試。
事實上,相比人臉識別,人臉檢測的任務(wù)要稍微簡單一些,它只關(guān)注前者的第一步,就是給出一張照片,找出有人臉的區(qū)域(橢圓型或矩陣)就達(dá)到目的了。
FDDB(Face Detection Data Set and Benchmark)是最具權(quán)威的人臉檢測評測平臺。FDDB和LFW一樣,都是馬薩諸塞大學(xué)的人臉數(shù)據(jù)庫,它包含2845張圖片,共有5171個人臉作為測試集。測試集范圍包括:不同姿勢、不同分辨率、旋轉(zhuǎn)和遮擋等圖片,同時包括灰度圖和彩色圖,標(biāo)準(zhǔn)的人臉標(biāo)注區(qū)域為橢圓形。小米人臉檢測的測試就是在FDDB進(jìn)行的。
“檢測和識別都是基于特征提取,檢測相當(dāng)于一張圖上有足夠多的選框(例如:20X20 的選框,各個像素點逐一篩選。)可先識別出人臉的位置,然后做選框,再根據(jù)選框內(nèi)部的像素點逐一篩選?!庇罘褐悄蹸EO趙弘毅如是說。
通俗點講,在圖片上任意給出一個框,判斷框是不是人臉,然后選框逐漸移動去判斷是不是人臉。這個過程在學(xué)術(shù)領(lǐng)域稱為“滑窗”,是特征提取的一個過程。所以,在一張圖片中至少需要對幾萬個框做分別提取特征,從而來識別人臉。
FDDB的數(shù)據(jù)集,有人臉的位置都會用橢圓形框好。要求自動算法標(biāo)識出來的區(qū)域和真實有人臉的區(qū)域,重疊部分(交集)對比并集超過一個閾值(例如50%),就算識別準(zhǔn)確了。
雷鋒咨詢了幾位業(yè)內(nèi)人士,一起看看他們是如何評價小米人臉檢測算法的。
深圖智服創(chuàng)始人吳鵬程:
FDDB數(shù)據(jù)集有兩個組,一個是有公開方法的,另一個是沒有公開方法的。小米這次特別厚道的把方法公開了,因此大家都可以去重現(xiàn)。
從結(jié)果看,他們在公開方法的組里,performance特別好,基本上和不公開方法的組里最好的很接近。
另外,小米這次也是改進(jìn)了faster RCNN來做人臉檢測,faster RCNN原本是孫劍(Face++首席科學(xué)家)提出來用來做對象檢測的,國內(nèi)不少用其來做人臉檢測,包括我們自己,效果確實不錯。
涂圖科技CMO王楠:
技術(shù)指標(biāo)只是一方面,還要看如何落地,因為難點都在商業(yè)化。
小米作為大公司有豐富的資源,BAT都在涉足這一領(lǐng)域,人臉識別還是最簡單的一部分。
閱面科技創(chuàng)始人趙京雷:
模糊的圖片會影響檢測和識別的準(zhǔn)確率,可以通過算法和數(shù)據(jù)等方式進(jìn)行優(yōu)化。小米所用的模糊人臉優(yōu)化應(yīng)該是刷了不少數(shù)據(jù),F(xiàn)DDB刷數(shù)據(jù)大家都能做到,但實際應(yīng)用如何又是另一回事了。
圖普科技創(chuàng)始人李明強(qiáng):
從這個評測結(jié)果來看,小米的人臉檢測確實做得還不錯,不過這個榜單中大家的水平都差不多,而且在LFW、FDDB甚至是ImageNet庫中都存在統(tǒng)計誤差。
宇泛智能CEO趙弘毅:
單一的刷榜單意義不大,國內(nèi)有些企業(yè)就在FDDB這些數(shù)據(jù)集惡意刷榜單,但要注意的是人臉檢測不僅要求精度還要速度。
另外還有業(yè)內(nèi)人士告訴雷鋒網(wǎng),小米這一表現(xiàn)確實很優(yōu)秀,但也不能說明什么問題。FDDB的庫只有2000多張圖片,而Wider庫比它的照片數(shù)量多兩三個數(shù)量級,而且單張圖片多的有將近一百個人臉,雖然FDDB是主流的數(shù)據(jù)集,但沒有挑戰(zhàn)性。
從幾位業(yè)界專家的觀點可以得出結(jié)論,小米在跑分上擊敗其它企業(yè)和機(jī)構(gòu)已經(jīng)證實了其人臉檢測算法的能力,但是回到應(yīng)用層,跑分的意義就大打折扣了。小米官方已經(jīng)確認(rèn)這一技術(shù)將很快運用到MIUI面孔相冊中,所以具體表現(xiàn)如何,我們將持續(xù)關(guān)注。
推薦閱讀:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。