0
雷鋒網(wǎng)AI科技評(píng)論消息:10月29日上午,在意大利威尼斯召開(kāi)的計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)會(huì)議 ICCV 2017的 “Joint COCO and Places Recognition Challenge” 專(zhuān)題會(huì)上公布了COCO +Places 2017挑戰(zhàn)賽的排名情況。
COCO and Places Recognition Challenge共包括 COCO Challenge和Places Challenge兩部分。
COCO挑戰(zhàn)賽偏重對(duì)物體的理解。COCO Challenge ( Common Objects in Context,常見(jiàn)物體圖像識(shí)別挑戰(zhàn)) 和 ImageNet挑戰(zhàn)賽有相似之處,不過(guò)與關(guān)注整體圖像的 ImageNet 圖像分類(lèi)任務(wù)相比,COCO 中的物體檢測(cè)任務(wù)更關(guān)注的是場(chǎng)景理解中的物體識(shí)別,需要對(duì)圖像中出現(xiàn)的每個(gè)物體的個(gè)體(如各種小物體,各種遮擋物體)進(jìn)行識(shí)別,因此要求算法對(duì)圖像細(xì)節(jié)有更好的理解。
COCO是一個(gè)圖像數(shù)據(jù)集,是用來(lái)推動(dòng)物體檢測(cè)研究,特別是檢測(cè)上下文中的物體。其中提供的注釋包括80個(gè)分類(lèi)的物體像素級(jí)分割,人體實(shí)例的關(guān)鍵點(diǎn)注釋?zhuān)?1個(gè)類(lèi)別的背景語(yǔ)義分割,每張圖片中5條圖像標(biāo)注。
具體分為四類(lèi)任務(wù):COCO物體檢測(cè)挑戰(zhàn)(Detection Challenge),COCO物體分割挑戰(zhàn)(Segmentation Challenge),COCO關(guān)鍵點(diǎn)挑戰(zhàn)(Keypoint Challenge),COCO背景語(yǔ)義分割挑戰(zhàn)(Stuff Segmentation Challenge )。
COCO物體檢測(cè)/分割挑戰(zhàn)
COCO物體檢測(cè)\分割有四支參賽隊(duì)伍,曠視科技(face++)奪的物體檢測(cè)第一;由北京大學(xué)和香港中文大學(xué)組成的研究團(tuán)隊(duì)(Team UCenter)奪得物體分割挑戰(zhàn)第一。
COCO人體關(guān)鍵點(diǎn)挑戰(zhàn)
鼓勵(lì)團(tuán)隊(duì)參與兩種物體檢測(cè)挑戰(zhàn)中的一種(或兩種)競(jìng)爭(zhēng):使用包圍盒輸出或?qū)ο蠓指钶敵觥?/p>
人體關(guān)鍵點(diǎn)檢測(cè)有兩支參賽隊(duì),曠視科技(face++)奪得第一;第二名由商湯科技(Beihang University & Sense Time)團(tuán)隊(duì)獲得。
COCO背景語(yǔ)義分割挑戰(zhàn)
要求在不受外界控制的條件下,對(duì)人體關(guān)鍵點(diǎn)定位。挑戰(zhàn)的難點(diǎn)是同時(shí)檢測(cè)人的位置以及定位他們的關(guān)鍵點(diǎn)(測(cè)試中不提供人體位置)。鑒于COCO檢測(cè)挑戰(zhàn)主要檢測(cè)圖片中的“物”(如人,汽車(chē),大象),這個(gè)挑戰(zhàn)的重點(diǎn)放在圖片中的背景(如草,墻,天空)。
“Places挑戰(zhàn)"偏重對(duì)場(chǎng)景的理解?!癙laces挑戰(zhàn)"的數(shù)據(jù),是一個(gè)像素級(jí)標(biāo)注的圖像數(shù)據(jù)及ADE20K。這個(gè)數(shù)據(jù)集中有2萬(wàn)張圖像用于訓(xùn)練,2千張用于驗(yàn)證,3千張用于測(cè)試。
“Places挑戰(zhàn)”有三項(xiàng)任務(wù):場(chǎng)景解析( scene parsing);實(shí)例分割(instance segmentation);語(yǔ)義邊界檢測(cè)(semantic boundary detection)。共有四支隊(duì)伍參加,除了曠視科技,還有以下三支隊(duì)伍:
在場(chǎng)景解析任務(wù)中,冠軍由中科院自動(dòng)化所和京東聯(lián)合建立的CASIA_IVA_JD團(tuán)隊(duì)摘得,第二名是今日頭條的WinterIsComing團(tuán)隊(duì)。
場(chǎng)景解析也叫場(chǎng)景語(yǔ)義分割,是將圖像分割成物體和物類(lèi)的方法。任務(wù)是在Pascal上像素的分類(lèi),類(lèi)似語(yǔ)義分割任務(wù),但不同的是,要把每一個(gè)測(cè)試圖像的每個(gè)像素分若干語(yǔ)義范疇概念,“填充對(duì)象”如天空,草地,道路或離散對(duì)象,如人,車(chē),建筑。共有150個(gè)語(yǔ)義類(lèi)別,占所有圖像像素的89%。具體來(lái)說(shuō),挑戰(zhàn)數(shù)據(jù)分為訓(xùn)練兩萬(wàn)張圖像,兩千張圖像進(jìn)行驗(yàn)證,和三千張圖像測(cè)試。對(duì)于每個(gè)圖像,分割算法將產(chǎn)生一個(gè)語(yǔ)義分割掩模,預(yù)測(cè)圖像中每個(gè)像素的語(yǔ)義類(lèi)別。算法性能將根據(jù)在這150個(gè)語(yǔ)義類(lèi)別中的像素精度平均值來(lái)評(píng)定。
在實(shí)例分割任務(wù)中,冠軍由曠視科技(face++)摘得,第二名為G-RMI (Google Research and Machine Intelligence)谷歌團(tuán)隊(duì)獲得。
場(chǎng)景實(shí)例分割是將圖像分割為物體實(shí)例。該任務(wù)是類(lèi)似于任務(wù)1的像素級(jí)分類(lèi),但它也要求該算法從圖像中提取每個(gè)物體實(shí)例。這項(xiàng)工作的動(dòng)機(jī)有兩個(gè)方面:1)將語(yǔ)義分割的研究推向?qū)嵗指睢?)讓物體檢測(cè)、語(yǔ)義分割和場(chǎng)景分析之間有更多的協(xié)同作用。語(yǔ)義類(lèi)別會(huì)和任務(wù)1中共享數(shù)據(jù),但有100類(lèi)對(duì)象實(shí)例注釋。評(píng)價(jià)指標(biāo)是所有100個(gè)語(yǔ)義類(lèi)別的平均精度(AP)。
語(yǔ)義邊界檢測(cè)是檢測(cè)圖像中每一個(gè)物體實(shí)例的邊界。邊界檢測(cè)與邊緣檢測(cè)有關(guān),但更多地關(guān)注邊界及物體實(shí)例的關(guān)聯(lián)。以前在ade20k數(shù)據(jù)圖像的所有像素的注釋對(duì)象實(shí)例可以作為語(yǔ)義邊界檢測(cè)的基準(zhǔn),這是比以前更大的bsds500。此任務(wù)的數(shù)據(jù)與任務(wù)1和任務(wù)2中使用的圖像相同,共有150個(gè)語(yǔ)義類(lèi)別。提交的模型將在優(yōu)化數(shù)據(jù)規(guī)模使用F-measure評(píng)價(jià)(f-ods)。
雷鋒網(wǎng)AI科技評(píng)論小結(jié):繼ImageNet之后,計(jì)算機(jī)視覺(jué)領(lǐng)域最具有含金量的挑戰(zhàn)賽COCO +Places 2017幾乎又被華人拿下所有最高獎(jiǎng)。其中表現(xiàn)最為出色當(dāng)屬中國(guó)的幾家AI企業(yè),將國(guó)際巨頭微軟,谷歌,F(xiàn)acebook都甩在了后面。雷鋒網(wǎng)為中國(guó)科技業(yè)取得的成績(jī)感到無(wú)比驕傲,也祝愿中國(guó)AI技術(shù)今后能持續(xù)領(lǐng)跑全球。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。