0
本文作者: 黃善清 | 2018-10-30 16:17 |
雷鋒網(wǎng)AI科技評論按:10月18日,騰訊 AI Lab 宣布正式開源「Tencent ML-Images」項目,該項目由多標簽圖像數(shù)據(jù)集 ML-Images,以及業(yè)內(nèi)目前同類深度學習模型中精度最高的深度殘差網(wǎng)絡 ResNet-101 構(gòu)成。
項目訪問地址:
據(jù)雷鋒網(wǎng) AI 科技評論了解,騰訊 AI Lab 此次公布的圖像數(shù)據(jù)集 ML-Images,包含了 1800 萬圖像和 1.1 萬多種常見物體類別,在業(yè)內(nèi)已公開的多標簽圖像數(shù)據(jù)集中規(guī)模最大,足以滿足一般科研機構(gòu)及中小企業(yè)的使用場景。此外,基于 ML-Images 訓練得到的深度殘差網(wǎng)絡 ResNet-101,具有優(yōu)異的視覺表示能力和泛化性能,在當前業(yè)內(nèi)同類模型中精度最高,將為包括圖像、視頻等在內(nèi)的視覺任務提供強大支撐,并助力圖像分類、物體檢測、物體跟蹤、語義分割等技術(shù)水平的提升。
本次正式開源,其主要內(nèi)容包括:
ML-Images 數(shù)據(jù)集的全部圖像 URLs, 以及相應的類別標注。因原始圖像版權(quán)問題,此次開源將不直接提供原始圖像,用戶可利用騰訊 AI Lab 提供的下載代碼和 URLs 自行下載圖像。
ML-Images 數(shù)據(jù)集的詳細介紹。包括圖像來源、圖像數(shù)量、類別數(shù)量、類別的語義標簽體系、標注方法,以及圖像的標注數(shù)量等統(tǒng)計量。
完整的代碼和模型。騰訊 AI Lab 提供的代碼涵蓋從圖像下載和圖像預處理,到基于 ML-Images 的預訓練和基于 ImageNet 的遷移學習,再到基于訓練所得模型的圖像特征提取的完整流程。項目提供了基于小數(shù)據(jù)集的訓練示例,以方便用戶快速體驗該訓練流程。項目還提供了具有極高精度的 ResNet-101 模型 (在單標簽基準數(shù)據(jù)集 ImageNet 的驗證集上的 top-1 精度為 80.73%)。用戶可根據(jù)自身需求,隨意選用該項目的代碼或模型。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。