0
本文作者: 劉偉 | 2019-10-29 18:56 | 專題:首屆“全國人工智能大賽” |
談到人工智能,大眾最耳熟能詳?shù)漠?dāng)屬人臉識別技術(shù),它已經(jīng)滲透到了我們生活的方方面面。但在計算機(jī)視覺領(lǐng)域,另一項技術(shù)的重要性也不遑多讓,那就是行人重識別(ReID)技術(shù)。
行人重識別(Person Re-Identification,簡稱 ReID)也稱作跨鏡追蹤技術(shù),是當(dāng)前計算機(jī)視覺領(lǐng)域的熱門研究方向。顧名思義,這項技術(shù)可以根據(jù)行人的衣著、體態(tài)、發(fā)型等一系列特征檢索不同攝像頭下的同一個目標(biāo)人物,以此描繪出他的行進(jìn)軌跡。
近年來越來越多的研究人員和機(jī)構(gòu)開始投身到ReID技術(shù)的研究中來。這一趨勢從歷年計算機(jī)視覺頂會發(fā)表的ReID相關(guān)論文數(shù)量就可窺見一斑。2013年,計算機(jī)視覺頂級會議CVPR上發(fā)表的ReID相關(guān)論文數(shù)量只有1篇,到2018年已經(jīng)增加到了32篇。同一時間,另外兩大計算機(jī)視覺頂會ECCV和ICCV發(fā)表的ReID相關(guān)論文數(shù)量也都從3篇增加到了19篇。
在眾多科研人員的共同努力下,近年來ReID技術(shù)已經(jīng)取得了長足的發(fā)展。但必須承認(rèn)的是,現(xiàn)階段ReID技術(shù)的研究仍然面臨著不少的現(xiàn)實挑戰(zhàn),主要有幾個方面:
首先是數(shù)據(jù),和其他視覺任務(wù)相比,ReID的數(shù)據(jù)規(guī)模是非常小的。目前ReID領(lǐng)域的公開數(shù)據(jù)集所含的ID數(shù)量不超過6000個。相比之下,人臉識別的公開數(shù)據(jù)集ID數(shù)量已經(jīng)超過了100萬,而企業(yè)私有的ID規(guī)模更在此之上。
導(dǎo)致ReID訓(xùn)練數(shù)據(jù)缺乏的主要原因在于,行人數(shù)據(jù)集需要采集同一個人在一段時間內(nèi)同時出現(xiàn)在多個攝像頭下的畫面,如此嚴(yán)苛的條件無疑對行人數(shù)據(jù)集的構(gòu)建造成了巨大挑戰(zhàn)。
除了數(shù)據(jù)缺失,數(shù)據(jù)標(biāo)注也是一個不小的挑戰(zhàn)。數(shù)據(jù)標(biāo)注是一件工作量特別龐大的事情,要知道大規(guī)模圖像分類數(shù)據(jù)集 ImageNet通過眾包的形式,前后有4.8 萬人花了近兩年時間才標(biāo)注完成。此外,行人數(shù)據(jù)的標(biāo)注本身有時也是非常困難的。區(qū)分貓狗非常容易,但要在視頻中將兩個年齡、體貌相似,穿著同樣衣服的不同行人分開是比較困難的。
其次是算法。ReID技術(shù)的發(fā)展大致經(jīng)歷了兩個階段:2014年以前主要是依靠一些傳統(tǒng)方法,比如設(shè)計手工特征等;2014年以后則基本是基于深度學(xué)習(xí)的方法。眾所周知,深度學(xué)習(xí)算法的訓(xùn)練依賴于大量的高質(zhì)量數(shù)據(jù)。而ReID相關(guān)的訓(xùn)練數(shù)據(jù)不僅數(shù)量少,質(zhì)量也很難保障。
現(xiàn)有的視頻監(jiān)控設(shè)備受成像質(zhì)量、分辨率等因素的制約,抓取的圖像信息經(jīng)常是模糊不清的。另外,相機(jī)拍攝角度差異大、室內(nèi)室外環(huán)境變化、行人服裝配飾更換、季節(jié)性穿衣風(fēng)格差別大、白天晚上光線差異等因素,也給跨攝像頭、跨地區(qū)、跨時間的ReID分析造成了巨大挑戰(zhàn)。
最后,技術(shù)落地,性價比也是一個需要特別關(guān)注的問題。在一般人看來,算法的準(zhǔn)確率提升幾個百分點或許微不足道,但背后卻意味著巨額的成本提升。因此,在準(zhǔn)確率不夠完美的情況下要將技術(shù)落地,我們還必須做很多的應(yīng)用創(chuàng)新,比如計算速度和內(nèi)存開銷的優(yōu)化。
總而言之,ReID技術(shù)的突破肯定離不開兩個方面——數(shù)據(jù)和方法。數(shù)據(jù)層面,一方面我們要構(gòu)建更大的真實數(shù)據(jù)集,另一方面也可以通過3D Graphics等方法做數(shù)據(jù)生成。方法層面,業(yè)界之前往往只考慮視覺信息,其實現(xiàn)實世界中我們還可以對大量其他信息加以利用,比如WiFi、GPS等等。
針對數(shù)據(jù)和方法兩個層面,目前業(yè)內(nèi)部分科研機(jī)構(gòu)和企業(yè)已經(jīng)相繼有所突破。
比如,針對數(shù)據(jù)不足的問題,有研究團(tuán)隊提出了數(shù)據(jù)增強(qiáng)與數(shù)據(jù)遷移算法。假設(shè)我們想將標(biāo)注好的北京的數(shù)據(jù)用在上海的某個場景下,就可以通過遷移算法將其遷移到上海的場景中,遷移后的數(shù)據(jù)就像在上海拍攝的一樣。
再比如,為了應(yīng)對非理想場景的挑戰(zhàn),我們可以用人體部件提取的方法來提取人體的細(xì)粒度部件,并進(jìn)行矯正。值得注意的是,由于需要提取非常精細(xì)的人體部件,此類算法對遮擋以及人體關(guān)鍵點檢測誤差比較敏感?;诖?,有團(tuán)隊提出了粗粒度部件提取方法,僅需提取三個粗粒度部件就能得到非常好的性能。
此外,在應(yīng)用層面結(jié)合人臉識別和ReID各自的特點及優(yōu)勢,也是一個值得探索的話題。比如千視通提出的卡視聯(lián)動技戰(zhàn)法,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進(jìn)行覆蓋,具有極強(qiáng)的實戰(zhàn)價值。
首屆全國人工智能大賽由深圳市科創(chuàng)委、鵬城實驗室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)共同承辦,騰訊科技、創(chuàng)維集團(tuán)、云天勵飛、平安科技協(xié)辦。這是深圳市首次主辦高規(guī)格、大規(guī)模的人工智能領(lǐng)域權(quán)威賽事。大賽將鏈接全國頂尖AI科研平臺及行業(yè)巨頭,為我國AI大科學(xué)裝置豐富數(shù)據(jù)集,并精準(zhǔn)聚焦AI、4K、行人識別等前沿領(lǐng)域,打通產(chǎn)學(xué)研通道,立足深圳集聚全球AI青年人才,為深圳建設(shè)中國特色社會主義先行示范區(qū)、建設(shè)國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)、推動粵港澳大灣區(qū)人工智能產(chǎn)業(yè)發(fā)展提供重要支撐。
大賽技術(shù)委員會主席提到,本屆大賽賽題設(shè)計的目的主要聚焦于 Video和Vision領(lǐng)域。在“Person ReID”賽道,更多的是希望解決關(guān)于場景、跨視角、光照/分辨率影響等技術(shù)難題。
為了進(jìn)一步推動ReID的技術(shù)突破和落地應(yīng)用,10月22日啟動的首屆“全國人工智能大賽”專門設(shè)置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團(tuán)隊和個人參賽。獲獎?wù)叱@得20萬至100萬元獎金外,還有機(jī)會獲得頂尖高科技單位招聘綠色通道、科研經(jīng)費、人才政策、研發(fā)空間等全方位支持。
了解大賽詳情請點擊:http://www.china-ai.ac.cn/。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。