0
本文作者: camel | 2018-05-01 18:12 |
雷鋒網(wǎng) AI 科技評(píng)論消息:4 月 30 日,谷歌在其官方博客上發(fā)文稱將開放 Images V4 數(shù)據(jù)庫,并同時(shí)開啟 ECCV 2018 公開圖像挑戰(zhàn)賽。雷鋒網(wǎng)編譯全文如下:
2016 年,我們發(fā)布了一個(gè)包含大約 900 萬張圖片、標(biāo)注了數(shù)千個(gè)對(duì)象類別標(biāo)簽的數(shù)據(jù)集 Open Images。發(fā)布之后,我們一直在努力更新和改進(jìn)數(shù)據(jù)集,以便為計(jì)算機(jī)視覺社區(qū)提供有用的資源來開發(fā)新模型。
今天,我們很高興地宣布開放 Open Images V4,它包含在 190 萬張圖片上針對(duì) 600 個(gè)類別的 1540 萬個(gè)邊框盒,這也是現(xiàn)有最大的具有對(duì)象位置注釋的數(shù)據(jù)集。這些邊框盒大部分都是由專業(yè)注釋人員手動(dòng)繪制的,確保了它們的準(zhǔn)確性和一致性。另外,這些圖像是非常多樣化的,并且通常包含有多個(gè)對(duì)象的復(fù)雜場景(平均每個(gè)圖像 8 個(gè))。
與此同時(shí),我們還將宣布啟動(dòng) Open Images 挑戰(zhàn)賽,這將是在 2018 計(jì)算機(jī)視覺歐洲會(huì)議(ECCV 2018)上舉辦的一場新的對(duì)象檢測挑戰(zhàn)賽。Open Images 挑戰(zhàn)賽將遵循 PASCAL VOC、ImageNet 和 COCO 等賽事的傳統(tǒng),但是其規(guī)模將是空前的。
Open Images 挑戰(zhàn)賽在一下這幾個(gè)方面將是獨(dú)一無二的:
有 170 萬張訓(xùn)練圖片,其中有 500 個(gè)類別和 1220 萬個(gè)邊框注釋;
與以前的檢測挑戰(zhàn)相比,將有更廣泛的類別,包括諸如「fedora」、「snowman」等這樣的新對(duì)象;
除了主流的物體檢測外,本次挑戰(zhàn)賽中在檢測物體對(duì)時(shí)還將包括視覺關(guān)系檢測,例如「woman playing guitar」。
訓(xùn)練數(shù)據(jù)集現(xiàn)在已經(jīng)可以使用;一個(gè)包含有 10 萬張圖片的測試集將于 2018 年 7 月 1 日發(fā)布在 Kaggle 上。挑戰(zhàn)賽提交結(jié)果的截止日期為 2018 年 9 月 1 日。
我們希望更大的訓(xùn)練集能夠刺激對(duì)更復(fù)雜檢測模型的研究,這些模型將超過當(dāng)前 state-of-the-art 的性能;而從另一方面,我們希望 500 個(gè)類別能夠更精確地評(píng)估不同探測器在哪些方面表現(xiàn)的更好。此外,擁有大量帶有多個(gè)對(duì)象標(biāo)注的圖像,可以幫組你探索視覺關(guān)系檢測,這還是一個(gè)熱門的新興話題,而且具有越來越多的子社區(qū)。
除了上述內(nèi)容外,Open Images V4 還包含了 3010 萬張經(jīng)過人工驗(yàn)證的針對(duì) 19794 個(gè)類別圖像級(jí)標(biāo)簽的圖片。當(dāng)然這些標(biāo)簽不屬于挑戰(zhàn)賽的一部分,其中的 550 萬張圖像級(jí)標(biāo)簽是由來自世界各地成千上萬名用戶通過 crowdsource.google.com 生成的。
via Google Blog,雷鋒網(wǎng) AI 科技評(píng)論編譯
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。