0
本文作者: 老王 | 2017-05-18 13:17 |
雷鋒網(wǎng)按:5月18日,全球權(quán)威機(jī)器視覺算法測評平臺KITTI的世界紀(jì)錄被阿里云刷新。
KITTI算法評測平臺由德國卡爾斯魯厄理工學(xué)院和芝加哥豐田技術(shù)研究所聯(lián)合創(chuàng)辦,是目前國際上最大的自動駕駛場景下的計(jì)算機(jī)視覺算法評測數(shù)據(jù)集,可以用于評測目標(biāo)檢測等計(jì)算機(jī)視覺技術(shù)在復(fù)雜真實(shí)環(huán)境下的性能。雷鋒網(wǎng)了解到,KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實(shí)圖像數(shù)據(jù),有大量的微小目標(biāo)、欠曝和過曝、多種視角變化以及各種遮擋情況。
業(yè)內(nèi)人士曾如此評價(jià)該榜單:相比而言,KITTI道路檢測樣本較少,對于深度學(xué)習(xí)任務(wù)來說極具挑戰(zhàn)。
今日,阿里云將其車輛檢測的準(zhǔn)確率拉升至90.46%。
(阿里巴巴iDST團(tuán)隊(duì)以90.46%的準(zhǔn)確率奪得KITTI排名第一)
據(jù)了解,此次技術(shù)突破是由阿里巴巴iDST視覺計(jì)算研究員華先勝領(lǐng)導(dǎo)的團(tuán)隊(duì)完成。他們提出了基于區(qū)域融合決策和上下文相關(guān)的多任務(wù)深度神經(jīng)網(wǎng)絡(luò),用于復(fù)雜場景下的車輛檢測任務(wù),重點(diǎn)解決其中多視角,多姿態(tài)以及車輛遮擋等問題。
在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)上,利用反卷積操作提高了小目標(biāo)的召回率,同時(shí)拼接了多層特征以融合低層的局部信息和高層的語義信息,提高了邊框定位的準(zhǔn)確率。在訓(xùn)練過程中,還借鑒了GAN(生成對抗網(wǎng)絡(luò))中的對抗訓(xùn)練模式。
華先勝表示,“現(xiàn)在我們已經(jīng)將這樣的技術(shù)集成到阿里云ET當(dāng)中,并在城市大腦中得以應(yīng)用。它能夠幫助城市大腦準(zhǔn)確的看懂車流信息,快速的做出全局性判斷”。
以交通治理為例,通過這項(xiàng)技術(shù),城市大腦通過普通攝像頭就可以感知復(fù)雜路況下車輛的運(yùn)行狀態(tài)和軌跡,對這些數(shù)據(jù)進(jìn)行實(shí)時(shí)分析?;诖诉M(jìn)行多種智能交通優(yōu)化。
在阿里云iDST奪魁之前,雷鋒網(wǎng)也曾報(bào)道過國內(nèi)AI公司在KITTI中取得的佳績:去年9月份,圖森未來在KITTI數(shù)據(jù)集中獲得目標(biāo)檢測三個(gè)單項(xiàng)、目標(biāo)追蹤兩個(gè)單項(xiàng)、道路分割四個(gè)單項(xiàng),共計(jì)九個(gè)單項(xiàng)的世界第一。隨后在今年2月份,宇視在計(jì)算機(jī)視覺算法權(quán)威測評平臺KITTI以三個(gè)單項(xiàng)第一、總分第一刷新世界紀(jì)錄。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。