0
本文作者: 么詠儀 | 2016-09-13 20:02 |
9月13日,GPU 開發(fā)者大會(huì)在北京舉辦,上??v目科技首席科學(xué)家馬慧敏教授針對(duì)智能駕駛與視覺感知方面的核心問題做了詳細(xì)的講解。
馬慧敏表示,2003年的3D Image Lab實(shí)驗(yàn)室在清華大學(xué)電子工程系掛牌,他們一直以來關(guān)注的是識(shí)別技術(shù)現(xiàn)在沒有攻克的難題。
小目標(biāo)、強(qiáng)遮擋、高動(dòng)態(tài)三個(gè)問題是他們重點(diǎn)要解決的。馬慧敏主要介紹了機(jī)器學(xué)習(xí)在自動(dòng)駕駛上的3個(gè)模型,用來解決上述的3個(gè)問題。
1、顯著性物體檢測(cè):語義注意認(rèn)知模型
2、部件與認(rèn)知模型:抵抗遮擋能力
3、3D場(chǎng)景物體識(shí)別:適應(yīng)復(fù)雜環(huán)境
首先,在顯著性物體檢測(cè)中要找到顯著物體為分割圖像做鋪墊;
其次,部件、結(jié)構(gòu)、環(huán)境3個(gè)方面是圖像識(shí)別中非常重要的因素,加入部件的特征也可以抵抗遮擋的問題;
最后,再進(jìn)一步就是要和環(huán)境交互,利用三維信息(立體視覺)做物體的語義模型。利用三維做道路的估計(jì)和語義特征再把它投入到二維的單目攝像頭中,會(huì)發(fā)現(xiàn)測(cè)試結(jié)果與雙目攝像頭效果相當(dāng)。原因就是自身的先驗(yàn)和語義上下維度之間的關(guān)聯(lián)。
在三維的先驗(yàn)測(cè)試中,可以確定汽車的高度、寬度以及和建筑物的比例,這些都在一定的范圍之內(nèi)。再從多模態(tài)、多任務(wù)、多視角三方面進(jìn)行道路檢測(cè),從平視到鳥瞰進(jìn)行多維檢測(cè),車輛檢測(cè)和定位精度等多方面指標(biāo)都能有6%以上的提升。
他們也將立體視覺和激光雷達(dá)效果以及混合傳感器效果做了比較,但是視覺傳感加入了激光傳感后在道路的測(cè)試效果并沒有顯著的提升,甚至還不如二維三維融合的純視覺識(shí)別。
在自動(dòng)駕駛中,車道檢測(cè)、交通標(biāo)識(shí)燈檢測(cè)、道路標(biāo)志以及整體路徑規(guī)劃等都需要在嵌入式發(fā)展的基礎(chǔ)上才能實(shí)現(xiàn)在無人車算法的運(yùn)行中,而實(shí)現(xiàn)智能駕駛和視覺感知,3D Image Lab實(shí)驗(yàn)室用到的就是通過了上述三個(gè)模型來解決問題。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。