1
本文作者: 老王 | 2016-09-27 00:00 |
今日,全球最為權(quán)威的計(jì)算機(jī)視覺大賽 ImageNet ILSVRC2016(大規(guī)模圖像識(shí)別競(jìng)賽)公布了算法排名結(jié)果,中國(guó)學(xué)術(shù)界和工業(yè)界團(tuán)隊(duì)包攬多項(xiàng)冠軍。
今年 ILSVRC2016 分為五大部分,包括:目標(biāo)檢測(cè)、目標(biāo)定位、視頻中目標(biāo)物體檢測(cè)、場(chǎng)景分類、場(chǎng)景分析。中國(guó)團(tuán)隊(duì)的成績(jī)?nèi)缦拢?/span>
CUImage(商湯科技和港中文)目標(biāo)檢測(cè)第一
Trimps-Soushen(公安部三所)目標(biāo)定位第一
CUvideo(商湯和港中文):視頻中物體檢測(cè)子項(xiàng)目第一
NUIST(南京信息工程大學(xué)):視頻中的物體探測(cè)兩個(gè)子項(xiàng)目第一
HikVision(??低暎簣?chǎng)景分類第一
SenseCUSceneParsing(商湯和港中文):場(chǎng)景分析第一
任務(wù) 1a:用提供的數(shù)據(jù)進(jìn)行目標(biāo)檢測(cè)
CUImage(商湯科技和港中文) 使用提供數(shù)據(jù)合成 6 個(gè)模型,檢測(cè)物體勝出種類數(shù)量 109,檢測(cè)準(zhǔn)確率為 0.662751。
任務(wù)1b:使用附加訓(xùn)練數(shù)據(jù)進(jìn)行目標(biāo)檢測(cè)
CUImage(商湯科技和港中文)采用帶標(biāo)注的 ImageNet Det 數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。識(shí)別物體勝出種類數(shù)量 176 個(gè),平均精準(zhǔn)度 0.66081。
任務(wù) 2a:基于給定數(shù)據(jù)進(jìn)行分類+定位
第一名 Trimps-Soushen(公安部三所)的模型定位錯(cuò)誤率為 0.077087,分類錯(cuò)誤率為 0.02991。
任務(wù) 2b:使用附加訓(xùn)練數(shù)據(jù)進(jìn)行分類和定位結(jié)果
Trimps-Soushen(公安部三所) 在定位和分類上位列第一。
任務(wù) 3a:基于給定訓(xùn)練數(shù)據(jù)進(jìn)行的視頻中的目標(biāo)物體檢測(cè)
NUIST(南京信息工程大學(xué)),識(shí)別物體勝出種類數(shù)量 10 個(gè),平均精準(zhǔn)度 0.808292。
任務(wù)3b:使用附加訓(xùn)練數(shù)據(jù)進(jìn)行的視頻中的目標(biāo)物體檢測(cè)
NUIST(南京信息工程大學(xué))識(shí)別物體勝出種類數(shù)量為 17 個(gè),平均精準(zhǔn)度 0.79593。
任務(wù)3c:給定訓(xùn)練數(shù)據(jù)進(jìn)行的視頻中物體檢測(cè)和追蹤
CUVideo(商湯科技和港中文) 采用基于多模型集成的方法在該項(xiàng)目獲得第一名。
任務(wù) 3d:附加訓(xùn)練數(shù)據(jù)進(jìn)行的視頻中目標(biāo)物體檢測(cè)和追蹤
NUIST(南京信息工程大學(xué)) 提出的基于級(jí)聯(lián)區(qū)域回歸和跟蹤的方法在改項(xiàng)目獲得第一。
Hikvision(海康威視)提取的模型在該項(xiàng)目排名第一。
SenseCUSceneParsing(商湯科技和港中文)提出的環(huán)境語義分割框架獲得該項(xiàng)目第一。
近兩個(gè)月,國(guó)內(nèi)團(tuán)隊(duì)先后在全球最權(quán)威的人臉檢測(cè)評(píng)測(cè)平臺(tái) FDDB 和全球自動(dòng)駕駛算法公開排行榜 KITTI 以及 Cityscapes 上取得非常好的成績(jī),這在一定程度上證明了國(guó)內(nèi)計(jì)算機(jī)視覺相關(guān)算法已達(dá)到國(guó)際頂尖水平。
人臉識(shí)別
上個(gè)月 FDDB 公開兩組數(shù)據(jù)集排名,一個(gè)是研究團(tuán)隊(duì)公開人臉檢測(cè)方法的評(píng)測(cè)組,另一個(gè)則不公開方法的評(píng)測(cè)組。其中小米在公開監(jiān)測(cè)方法組里面拿到了世界第一的好成績(jī),而在不公開方法的評(píng)測(cè)組中,中國(guó)公司搶占了整個(gè)榜單的半壁江山。
此外,近些年中國(guó)公司在人臉關(guān)鍵點(diǎn)定位 300-W Benchmark 和 LFW 人臉識(shí)別數(shù)據(jù)庫上,也多次包攬世界第一。
自動(dòng)駕駛
在自動(dòng)駕駛算法排行榜上,上周國(guó)內(nèi)初創(chuàng)公司圖森互聯(lián)在全球最權(quán)威的自動(dòng)駕駛算法公開排行榜 KITTI 和 Cityscapes 評(píng)測(cè)數(shù)據(jù)集上均獲得世界第一。在 KITTI 數(shù)據(jù)集中,圖森互聯(lián)獲得目標(biāo)檢測(cè)三個(gè)單項(xiàng)、目標(biāo)追蹤兩個(gè)單項(xiàng)、道路分割四個(gè)單項(xiàng),共計(jì)九個(gè)單項(xiàng)的世界第一。
從現(xiàn)在的勢(shì)頭來看,可以預(yù)見接下來國(guó)內(nèi)團(tuán)隊(duì)將會(huì)陸續(xù)在 ImageNet 等國(guó)際人工智能榜單中取得非常好的名次。
那么計(jì)算機(jī)視覺公司如何在 ImageNet 比賽中獲得冠軍?
9 月 27 日下午 3:00 ,雷鋒網(wǎng)硬創(chuàng)公開課邀請(qǐng)本次ImageNet 大賽中在場(chǎng)景分類中榮獲第一名的杭州??低暤氖紫茖W(xué)家 、??低曆芯吭撼?wù)副院長(zhǎng)浦世亮為大家公開講述他們是如何刷爆 ImageNet 的。敬請(qǐng)期待!
掃描二維碼,參與公開課主題分享
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。