谷歌發(fā)布 Open Images V4數(shù)據(jù)集，190萬張圖片開啟公開圖像挑戰(zhàn)賽

本文作者： camel

2018-05-01 18:12

導(dǎo)語：190 萬張圖片、600 個類別、1540 萬個邊框

雷鋒網(wǎng) AI 科技評論消息：4 月 30 日，谷歌在其官方博客上發(fā)文稱將開放 Images V4 數(shù)據(jù)庫，并同時開啟 ECCV 2018 公開圖像挑戰(zhàn)賽。雷鋒網(wǎng)編譯全文如下：

2016 年，我們發(fā)布了一個包含大約 900 萬張圖片、標(biāo)注了數(shù)千個對象類別標(biāo)簽的數(shù)據(jù)集 Open Images。發(fā)布之后，我們一直在努力更新和改進(jìn)數(shù)據(jù)集，以便為計算機(jī)視覺社區(qū)提供有用的資源來開發(fā)新模型。

今天，我們很高興地宣布開放 Open Images V4，它包含在 190 萬張圖片上針對 600 個類別的 1540 萬個邊框盒，這也是現(xiàn)有最大的具有對象位置注釋的數(shù)據(jù)集。這些邊框盒大部分都是由專業(yè)注釋人員手動繪制的，確保了它們的準(zhǔn)確性和一致性。另外，這些圖像是非常多樣化的，并且通常包含有多個對象的復(fù)雜場景（平均每個圖像 8 個）。

谷歌發(fā)布 Open Images V4數(shù)據(jù)集，190萬張圖片開啟公開圖像挑戰(zhàn)賽

與此同時，我們還將宣布啟動 Open Images 挑戰(zhàn)賽，這將是在 2018 計算機(jī)視覺歐洲會議（ECCV 2018）上舉辦的一場新的對象檢測挑戰(zhàn)賽。Open Images 挑戰(zhàn)賽將遵循 PASCAL VOC、ImageNet 和 COCO 等賽事的傳統(tǒng)，但是其規(guī)模將是空前的。

Open Images 挑戰(zhàn)賽在一下這幾個方面將是獨(dú)一無二的：

有 170 萬張訓(xùn)練圖片，其中有 500 個類別和 1220 萬個邊框注釋；
與以前的檢測挑戰(zhàn)相比，將有更廣泛的類別，包括諸如「fedora」、「snowman」等這樣的新對象；
除了主流的物體檢測外，本次挑戰(zhàn)賽中在檢測物體對時還將包括視覺關(guān)系檢測，例如「woman playing guitar」。

訓(xùn)練數(shù)據(jù)集現(xiàn)在已經(jīng)可以使用；一個包含有 10 萬張圖片的測試集將于 2018 年 7 月 1 日發(fā)布在 Kaggle 上。挑戰(zhàn)賽提交結(jié)果的截止日期為 2018 年 9 月 1 日。

我們希望更大的訓(xùn)練集能夠刺激對更復(fù)雜檢測模型的研究，這些模型將超過當(dāng)前 state-of-the-art 的性能；而從另一方面，我們希望 500 個類別能夠更精確地評估不同探測器在哪些方面表現(xiàn)的更好。此外，擁有大量帶有多個對象標(biāo)注的圖像，可以幫組你探索視覺關(guān)系檢測，這還是一個熱門的新興話題，而且具有越來越多的子社區(qū)。

除了上述內(nèi)容外，Open Images V4 還包含了 3010 萬張經(jīng)過人工驗(yàn)證的針對 19794 個類別圖像級標(biāo)簽的圖片。當(dāng)然這些標(biāo)簽不屬于挑戰(zhàn)賽的一部分，其中的 550 萬張圖像級標(biāo)簽是由來自世界各地成千上萬名用戶通過 crowdsource.google.com 生成的。

via Google Blog，雷鋒網(wǎng) AI 科技評論編譯

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。