0
本文作者: 老王 | 2017-05-18 13:17 |
雷鋒網(wǎng)按:5月18日,全球權(quán)威機(jī)器視覺(jué)算法測(cè)評(píng)平臺(tái)KITTI的世界紀(jì)錄被阿里云刷新。
KITTI算法評(píng)測(cè)平臺(tái)由德國(guó)卡爾斯魯厄理工學(xué)院和芝加哥豐田技術(shù)研究所聯(lián)合創(chuàng)辦,是目前國(guó)際上最大的自動(dòng)駕駛場(chǎng)景下的計(jì)算機(jī)視覺(jué)算法評(píng)測(cè)數(shù)據(jù)集,可以用于評(píng)測(cè)目標(biāo)檢測(cè)等計(jì)算機(jī)視覺(jué)技術(shù)在復(fù)雜真實(shí)環(huán)境下的性能。雷鋒網(wǎng)了解到,KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場(chǎng)景采集的真實(shí)圖像數(shù)據(jù),有大量的微小目標(biāo)、欠曝和過(guò)曝、多種視角變化以及各種遮擋情況。
業(yè)內(nèi)人士曾如此評(píng)價(jià)該榜單:相比而言,KITTI道路檢測(cè)樣本較少,對(duì)于深度學(xué)習(xí)任務(wù)來(lái)說(shuō)極具挑戰(zhàn)。
今日,阿里云將其車(chē)輛檢測(cè)的準(zhǔn)確率拉升至90.46%。
(阿里巴巴iDST團(tuán)隊(duì)以90.46%的準(zhǔn)確率奪得KITTI排名第一)
據(jù)了解,此次技術(shù)突破是由阿里巴巴iDST視覺(jué)計(jì)算研究員華先勝領(lǐng)導(dǎo)的團(tuán)隊(duì)完成。他們提出了基于區(qū)域融合決策和上下文相關(guān)的多任務(wù)深度神經(jīng)網(wǎng)絡(luò),用于復(fù)雜場(chǎng)景下的車(chē)輛檢測(cè)任務(wù),重點(diǎn)解決其中多視角,多姿態(tài)以及車(chē)輛遮擋等問(wèn)題。
在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)上,利用反卷積操作提高了小目標(biāo)的召回率,同時(shí)拼接了多層特征以融合低層的局部信息和高層的語(yǔ)義信息,提高了邊框定位的準(zhǔn)確率。在訓(xùn)練過(guò)程中,還借鑒了GAN(生成對(duì)抗網(wǎng)絡(luò))中的對(duì)抗訓(xùn)練模式。
華先勝表示,“現(xiàn)在我們已經(jīng)將這樣的技術(shù)集成到阿里云ET當(dāng)中,并在城市大腦中得以應(yīng)用。它能夠幫助城市大腦準(zhǔn)確的看懂車(chē)流信息,快速的做出全局性判斷”。
以交通治理為例,通過(guò)這項(xiàng)技術(shù),城市大腦通過(guò)普通攝像頭就可以感知復(fù)雜路況下車(chē)輛的運(yùn)行狀態(tài)和軌跡,對(duì)這些數(shù)據(jù)進(jìn)行實(shí)時(shí)分析?;诖诉M(jìn)行多種智能交通優(yōu)化。
在阿里云iDST奪魁之前,雷鋒網(wǎng)也曾報(bào)道過(guò)國(guó)內(nèi)AI公司在KITTI中取得的佳績(jī):去年9月份,圖森未來(lái)在KITTI數(shù)據(jù)集中獲得目標(biāo)檢測(cè)三個(gè)單項(xiàng)、目標(biāo)追蹤兩個(gè)單項(xiàng)、道路分割四個(gè)單項(xiàng),共計(jì)九個(gè)單項(xiàng)的世界第一。隨后在今年2月份,宇視在計(jì)算機(jī)視覺(jué)算法權(quán)威測(cè)評(píng)平臺(tái)KITTI以三個(gè)單項(xiàng)第一、總分第一刷新世界紀(jì)錄。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。