1
本文作者: 章敏 | 2016-06-29 14:28 |
摘要:計(jì)算機(jī)科學(xué)家和工程師們推出了“大集合臉圖挑戰(zhàn),“世界第一的競爭旨在評估和提升百萬人規(guī)模的人臉識(shí)別算法性能”
大的臉圖集包含了1百萬張圖片,代表了超過690,000個(gè)不同的人。這是第一次在一百萬規(guī)模下測試面部識(shí)別算法。在最近幾年中,已經(jīng)有幾個(gè)團(tuán)隊(duì)聲稱,他們的臉部識(shí)別算法系統(tǒng)的精準(zhǔn)率已經(jīng)近乎完美。
但本次測試只會(huì)在一個(gè)僅有13,000張圖片的數(shù)據(jù)集上進(jìn)行-比參加美國職業(yè)足球賽的平均人數(shù)還少。隨著這些人群增長到一個(gè)美國主要城市的規(guī)模,他們的表現(xiàn)將如何?
華盛頓大學(xué)的研究者回應(yīng)了這個(gè)人臉挑戰(zhàn)問題。世界的第一個(gè)競爭,旨于在百萬人的數(shù)據(jù)規(guī)模下評估和提高人臉識(shí)別算法的性能。當(dāng)面臨著更多的干擾時(shí),所有的算法都面臨精準(zhǔn)率的考核,但有些算法的表現(xiàn)比別其他的好得多。
“我們需要在星球的尺度上測試臉部識(shí)別,確保他能實(shí)際應(yīng)用--在更大范圍進(jìn)行測試,以便你發(fā)現(xiàn)識(shí)別算法的缺陷和優(yōu)點(diǎn)?!庇?jì)算機(jī)科學(xué)助理教授和UW項(xiàng)目的首席研究員 Ira Kemelmacher-Shlizerman說道。
UW團(tuán)隊(duì)首先開發(fā)了一個(gè)有一百萬相冊圖片的數(shù)據(jù)集,圖片來自于全世界并且可公開提供創(chuàng)意共享許可證,代表著690572個(gè)獨(dú)特的個(gè)人。隨后他們考驗(yàn)人臉識(shí)別團(tuán)隊(duì),讓他們下載數(shù)據(jù)庫然后觀察當(dāng)必須區(qū)分有一百萬種可能性的匹配時(shí)他們算法的運(yùn)行效率。
Google的臉部網(wǎng)絡(luò)在其中一項(xiàng)測試中展現(xiàn)出了非常高的性能,當(dāng)面對更小的圖片集時(shí),達(dá)到了近乎完美的精準(zhǔn)度,在百萬人測試中精準(zhǔn)度達(dá)到了75%。一個(gè)來自于俄羅斯N-TechLab的團(tuán)隊(duì)在另一個(gè)測試中脫穎而出,降到73%。
相比之下,其他算法的精準(zhǔn)率也很不錯(cuò)--大概95%--在一個(gè)小規(guī)模內(nèi)下降了更大的百分比,當(dāng)面臨著更艱巨的任務(wù)時(shí)精度低至33%。初步的結(jié)果,在計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR 2016)6月30日的論文中被非常詳細(xì)的展現(xiàn)出,以及項(xiàng)目網(wǎng)站上更新正在進(jìn)行的結(jié)果,超過300個(gè)研究小組正在努力攻克大規(guī)模的臉圖。
大規(guī)模的臉圖挑戰(zhàn)在查證方面測試了算法,或者說他們在正確的識(shí)別兩個(gè)照片是否是同一個(gè)人方面能表現(xiàn)的多好。這就是一個(gè)iPhone的安全功能如何運(yùn)作,例如,能夠識(shí)別你的臉并且決定是否解鎖你的手機(jī),而不是要你輸入密碼。
“如果你在阿姆斯特丹的火車站丟失了你的手機(jī)會(huì)發(fā)生什么?,或者有人想偷他呢?”共同領(lǐng)導(dǎo)UW圖像算法和成像實(shí)驗(yàn)室的Kemelmacher-Shlizerman說道?!拔蚁敕浅5目隙ㄎ业氖謾C(jī)可以在一百萬甚至七百萬人中正常的識(shí)別出我,而不是在僅僅10,000或者更少”
他們同樣也在識(shí)別方面測試了算法,或者說他們能夠多精準(zhǔn)的匹配一個(gè)單一個(gè)體的照片,從一百萬“分心”中找到同樣是這個(gè)人的不同照片。這正是在進(jìn)行的,例如,當(dāng)執(zhí)法部門有一個(gè)犯罪嫌疑人的照片,并通過在地鐵站臺(tái)或機(jī)場拍攝的照片,看看是否該人試圖逃跑。
“你可以看出這個(gè)問題的難點(diǎn)-從不同的年齡階段中識(shí)別出同一個(gè)人是無法解決的問題。因此從他們二重身識(shí)別出個(gè)人和匹配不同姿勢的個(gè)人就像側(cè)視圖到正視圖一樣。 ”Kemelmacher-Shlizerman說道。在評估規(guī)模時(shí),文章同樣分析了在人臉識(shí)別時(shí)年齡和姿勢的不變性。
總體來說,“學(xué)習(xí)”在大規(guī)模圖片數(shù)據(jù)集中如何正確片匹配的算法勝了那些只獲得較小的訓(xùn)練數(shù)據(jù)集的算法。除了中國研究團(tuán)隊(duì)演算出的SIAT MMlab算法,在更小數(shù)量的圖片集上學(xué)習(xí),逆流而,上通過比其他的算法做的更好。
團(tuán)隊(duì)的下一步包括收集一半一百萬的個(gè)體--每一個(gè)都有一定數(shù)量的照片--為了一個(gè)將被用于臉部識(shí)別算法的數(shù)據(jù)集。這將有助平衡運(yùn)行場地于并且測試給出相同數(shù)量的大規(guī)模訓(xùn)練數(shù)據(jù),那個(gè)的算法優(yōu)于其他人,當(dāng)大多數(shù)研究者無法獲得和Google或者Facebook一樣大的圖片集時(shí)。該訓(xùn)練集將被發(fā)布到夏季結(jié)束。
“最先進(jìn)的深神經(jīng)網(wǎng)絡(luò)算法有數(shù)以百萬計(jì)的參數(shù)要學(xué)習(xí)并且要求有大量的例子來調(diào)整他們”Aaron Nech說道,華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程碩士的學(xué)生在為訓(xùn)練數(shù)據(jù)集而努力。
“和人不一樣,這些模型最初是一個(gè)空白的石板。具有數(shù)據(jù)的多樣性 ,例如在超過500,000個(gè)不同個(gè)體發(fā)現(xiàn)的雜的身份線索,通過提供各種各樣現(xiàn)在未出現(xiàn)的樣本,能夠提高算法的性能”
Via :https://www.sciencedaily.com
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。