0
本文作者: camel | 2018-05-01 18:12 |
雷鋒網(wǎng) AI 科技評論消息:4 月 30 日,谷歌在其官方博客上發(fā)文稱將開放 Images V4 數(shù)據(jù)庫,并同時開啟 ECCV 2018 公開圖像挑戰(zhàn)賽。雷鋒網(wǎng)編譯全文如下:
2016 年,我們發(fā)布了一個包含大約 900 萬張圖片、標注了數(shù)千個對象類別標簽的數(shù)據(jù)集 Open Images。發(fā)布之后,我們一直在努力更新和改進數(shù)據(jù)集,以便為計算機視覺社區(qū)提供有用的資源來開發(fā)新模型。
今天,我們很高興地宣布開放 Open Images V4,它包含在 190 萬張圖片上針對 600 個類別的 1540 萬個邊框盒,這也是現(xiàn)有最大的具有對象位置注釋的數(shù)據(jù)集。這些邊框盒大部分都是由專業(yè)注釋人員手動繪制的,確保了它們的準確性和一致性。另外,這些圖像是非常多樣化的,并且通常包含有多個對象的復雜場景(平均每個圖像 8 個)。
與此同時,我們還將宣布啟動 Open Images 挑戰(zhàn)賽,這將是在 2018 計算機視覺歐洲會議(ECCV 2018)上舉辦的一場新的對象檢測挑戰(zhàn)賽。Open Images 挑戰(zhàn)賽將遵循 PASCAL VOC、ImageNet 和 COCO 等賽事的傳統(tǒng),但是其規(guī)模將是空前的。
Open Images 挑戰(zhàn)賽在一下這幾個方面將是獨一無二的:
有 170 萬張訓練圖片,其中有 500 個類別和 1220 萬個邊框注釋;
與以前的檢測挑戰(zhàn)相比,將有更廣泛的類別,包括諸如「fedora」、「snowman」等這樣的新對象;
除了主流的物體檢測外,本次挑戰(zhàn)賽中在檢測物體對時還將包括視覺關(guān)系檢測,例如「woman playing guitar」。
訓練數(shù)據(jù)集現(xiàn)在已經(jīng)可以使用;一個包含有 10 萬張圖片的測試集將于 2018 年 7 月 1 日發(fā)布在 Kaggle 上。挑戰(zhàn)賽提交結(jié)果的截止日期為 2018 年 9 月 1 日。
我們希望更大的訓練集能夠刺激對更復雜檢測模型的研究,這些模型將超過當前 state-of-the-art 的性能;而從另一方面,我們希望 500 個類別能夠更精確地評估不同探測器在哪些方面表現(xiàn)的更好。此外,擁有大量帶有多個對象標注的圖像,可以幫組你探索視覺關(guān)系檢測,這還是一個熱門的新興話題,而且具有越來越多的子社區(qū)。
除了上述內(nèi)容外,Open Images V4 還包含了 3010 萬張經(jīng)過人工驗證的針對 19794 個類別圖像級標簽的圖片。當然這些標簽不屬于挑戰(zhàn)賽的一部分,其中的 550 萬張圖像級標簽是由來自世界各地成千上萬名用戶通過 crowdsource.google.com 生成的。
via Google Blog,雷鋒網(wǎng) AI 科技評論編譯
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。