0
本文作者: 么詠儀 | 2016-09-22 11:25 |
9月19日,圖森互聯(lián)宣布,他們研發(fā)的計算機視覺與深度學(xué)習(xí)算法在自動駕駛算法公開排行榜KITTI和Cityscapes評測數(shù)據(jù)集上均獲得優(yōu)異的成績。
這是一家國內(nèi)專注于計算機視覺與人工智能研發(fā)的創(chuàng)業(yè)企業(yè),圖森的CEO陳默是一位連續(xù)創(chuàng)業(yè)者,他的上一家公司被收購后,他接手了圖森互聯(lián)。
2015年9月圖森互聯(lián)成立,成立之時該公司CTO侯曉迪博士在美國組建了一個20人的視覺識別研究院,團(tuán)隊成員包括來自UCLA、卡耐基梅隆、MIT、 南洋理工等高校的華人。
起初,他們研發(fā)的是廣告視覺識別技術(shù),例如圖森曾經(jīng)給新浪微博開發(fā)了一個“識車神器”:用戶只要隨手上傳汽車圖片,微博即可識別主流乘用車品牌、車型,利于精準(zhǔn)廣告的投放。
在今年3月,陳默給了自己和公司一個巨大的挑戰(zhàn),全面轉(zhuǎn)型。
圖森最開始把北美研究院視覺識別的成果應(yīng)用在了在廣告領(lǐng)域,通過算法實現(xiàn)精準(zhǔn)匹配,可以提升廣告的轉(zhuǎn)化率。
不過陳默認(rèn)為,廣告的核心競爭力在于銷售及資源獲取能力,而計算機視覺可以幫助進(jìn)行優(yōu)化,起到的作用是的確有限。
它的問題出在了數(shù)據(jù)造假太多,如Facebook,他們的DSP產(chǎn)品碰到了數(shù)量驚人的劣質(zhì)廣告和虛假的機器人流量,盡管他們做了篩選,但依然被無價值流量的規(guī)模所打敗,最后還是決定以廣告質(zhì)量為先。所以技術(shù)公司用很大力氣投入并不一定能夠帶來明顯的銷量增長。
相比廣告投放,自動駕駛的難度非常大,汽車產(chǎn)業(yè)鏈非常長,本身也是一個5-10年才能落地的事情。圖森怎么做?
陳默表示,圖森短期的目標(biāo)是自動駕駛L3級,它將會在5年之內(nèi)實現(xiàn),讓商用車在指定路段(如高速公路)實現(xiàn)自動駕駛功能。
想要讓自動駕駛上路有很多問題,傳統(tǒng)視覺識別算法很難識別行人和自行車,但是深度學(xué)習(xí)可以。同時深度學(xué)習(xí)還可以對周圍物體的行為作出預(yù)測。陳默舉例:“不能車旁邊一有人就報警,它還要去預(yù)測人與車碰撞的可能,需要預(yù)測雙方的行駛軌跡?!彼砸粋€性能好的攝像頭是不夠的,物體的檢測分類、地標(biāo)的識別、駕駛行為的適配以及車輛的行為決策,每一步都需要深度學(xué)習(xí)的參與。
陳默很肯定,視覺識別的傳統(tǒng)算法是不可行的,普通的前車防碰撞是遠(yuǎn)遠(yuǎn)不夠的,它將會在一兩年后被深度學(xué)習(xí)替代。
對罕見的突發(fā)事件的反應(yīng),是訓(xùn)練自動駕駛系統(tǒng)至關(guān)重要的,需要兩個重要策略:
獲取海量駕駛數(shù)據(jù)的渠道;
具有從傳感器數(shù)據(jù)中精細(xì)還原物理世界的能力。
讓自動駕駛在全國各地收集數(shù)據(jù)不可能,但是在特定路段可以。陳默發(fā)覺,這種情況下將自動駕駛用在乘用車上面并沒有發(fā)揮很大的價值,甚至大材小用。
在普通乘用車行駛中,人們觀察前車動向時走神的概率其實很低。反而大型的交通工具以及貨運車存在的盲點更加危險,很容易把行人卷入車下。另外大型運輸車司機疲勞駕駛存在很大的安全隱患。
目前,圖森互聯(lián)已與北奔重汽、北京理工大學(xué)簽訂合作,幫助第三代解放軍運輸車做自動駕駛功能。最快需要1年的時間出原型車,在這段時間,車的不同位置還需要重新采集數(shù)據(jù)作為樣本,重新構(gòu)建模型。
商用車是生產(chǎn)工具,比乘用車對自動駕駛技術(shù)更有需求。當(dāng)然,圖森選擇做商用車還有很多原因:
中國有兩千多萬的運營車輛市場很大,自動駕駛可以減少貨運公司雇傭成本;
數(shù)據(jù)好采集,從一個集散地到另一個集散地重復(fù)路線,且高速路段的復(fù)雜程度比城市路段低;
人臉識別技術(shù)保障司機疲勞時的安全駕駛,車輛周身傳感器可減少盲區(qū)保證行人安全;
貨運公司大多靠近高速匝道而建,可以提供方便落地的解決方案。
在陳默的計劃中,他們將會組建一個自動駕駛的運輸車車隊。只需要第一輛車有司機,其余的車輛自適應(yīng)巡航,因此可以減少司機數(shù)量。這個原型化方案最快將在1年半之內(nèi)達(dá)成,屆時只需司機將車開到規(guī)定路段的起點,自動駕駛車便可以在高速上自動行駛并且下高速后會自動在匝道停車。這個方案類似美國Otto無人駕駛卡車,不過即便原型化方案落地,商用還要再等上至少1年的時間。
未來圖森的目標(biāo)就是做運輸車的自動駕駛車隊,只用1-2個司機。做這個事的目的就是節(jié)約成本、保證駕駛安全和快速提供解決方案。他認(rèn)為將自動駕駛應(yīng)用在商用車上可以盡快實現(xiàn),不希望給出的方案都是未來10年8年才能實現(xiàn)的。
目前國內(nèi)公開的地圖數(shù)據(jù)不足以支持自動駕駛的導(dǎo)航,圖森以分米級精度建立矢量模型,包括車道線、隔離帶、交通標(biāo)志牌、路面坑洼等,解決方案的成本也可比Nokia Here低至少兩級(HERE使用了LiDAR和4個1689萬像素的高精度攝像頭)。
他們?yōu)榱丝刂瞥杀具x用NVIDIA的TX1通用芯片,未來可能升級到TX2。陳默表示,雖然通用芯片比專用芯片性能差一些,但專用芯片它的出貨量不大,成本降不下來。
目前圖森的自動駕駛系統(tǒng)用的是多目攝像頭加毫米波雷達(dá)的綜合解決方案。系統(tǒng)全部Offline,避免網(wǎng)速和服務(wù)器信號問題帶來的延時誤差,也控制了數(shù)據(jù)存儲的成本。考慮成本是產(chǎn)品能否落地的前提,陳默預(yù)測,有一天計算機視覺識別和深度足夠強大的時候,再也不需要激光雷達(dá)了。
汽車與自動駕駛是個需要復(fù)雜工藝和高端技術(shù)的行業(yè),車企、Tier 1和技術(shù)提供商以及互聯(lián)網(wǎng)企業(yè)現(xiàn)在都在這個市場并肩作戰(zhàn)。或?qū)α?、或合作,在各自的領(lǐng)域物盡其用,這比那些PPT公司更加讓人興奮和期待。而他們改變的不僅是一輛交通工具,還是一種更多空間的生活方式、一個交通出行飛躍式的進(jìn)步、一個改變很多行業(yè)和從業(yè)者現(xiàn)狀的技術(shù)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。