0
本文作者: 李雨晨 | 2024-05-10 17:40 |
今年年初,F(xiàn)SD推送了V12.3版本,標(biāo)志著特斯拉的純視覺(jué)自動(dòng)駕駛系統(tǒng)進(jìn)入了一個(gè)新的階段。
4月28日馬斯克訪華,在不到24小時(shí)的時(shí)間里,特斯拉中國(guó)先后兩次在官方微博發(fā)聲,均提及加速自動(dòng)駕駛技術(shù)落地。這在智駕圈和車(chē)企圈內(nèi)再次掀起一輪討論——智能化,仍然是當(dāng)下最熱門(mén)的話題之一。
國(guó)內(nèi),從一開(kāi)始就走純視覺(jué)路線的一個(gè)車(chē)企玩家是極越。
在2024北京車(chē)展上,極越汽車(chē)旗下的第二款車(chē)型——極越07首發(fā)亮相,并將于下半年正式上市。
智能化是極越一直想要傳達(dá)給外界的形象。近日,極越發(fā)布2024五一假期AI出行報(bào)告,數(shù)據(jù)統(tǒng)計(jì)時(shí)間為4月30日至5月5日。極越的智駕滲透率達(dá)78.8%,單車(chē)平均 PPA 里程為181.6公里;自動(dòng)泊車(chē)功能滲透率達(dá)73.1%,單車(chē)單日自動(dòng)泊車(chē)最多達(dá)20次。
車(chē)展期間,雷峰網(wǎng)參加了極越汽車(chē)高層群訪,與極越智能軟件副總裁潘云鵬展開(kāi)交流。
潘云鵬表示,“我們現(xiàn)在是全中國(guó)唯一,全世界唯二純視覺(jué)高階輔助駕駛的方案?!?/p>
與在車(chē)展之前英偉達(dá)吳新宙所分享的類(lèi)似觀點(diǎn),潘云鵬也強(qiáng)調(diào)了“軟件定義汽車(chē)”以及“AI定義汽車(chē)”的區(qū)別:前者成功的要素是SOA軟硬解耦、高算力SOC,以及軟硬件背后所帶來(lái)的組織架構(gòu)的優(yōu)化;后者則是需要高質(zhì)量數(shù)據(jù)、大算力、大參數(shù)模型,靠的就是Scaling Laws(大力出奇跡)。
極越把自己的汽車(chē)定位成“汽車(chē)機(jī)器人”,這個(gè)汽車(chē)機(jī)器人具備三大基礎(chǔ)能力:自然交流、自由移動(dòng)、自我成長(zhǎng)。其中,在自由移動(dòng)層面,主要包括兩個(gè)部分:行泊一體以及純視覺(jué)。
極越一開(kāi)始所投入的純視覺(jué)智駕路線,已經(jīng)成為行業(yè)主流,很多廠商推出了沒(méi)有激光雷達(dá)的方案。
2023年,小鵬和蔚來(lái)分別宣布各自的第二品牌——MONA和樂(lè)道,明確采用純視覺(jué)路線。今年4月新發(fā)布的智界S7,個(gè)別車(chē)型也取消激光雷達(dá),用視覺(jué)直接實(shí)現(xiàn)全國(guó)高速和城市快速路智駕領(lǐng)航輔助和智能泊車(chē)。
極越技術(shù)架構(gòu)
廣汽集團(tuán)也正式推出了無(wú)圖純視覺(jué)智能駕駛技術(shù),目前在廣州核心城區(qū)的高速、城市NOA功能已經(jīng)基本實(shí)現(xiàn)無(wú)圖純視覺(jué)。
潘云鵬表示,在極越01的開(kāi)發(fā)階段,是保留了激光雷達(dá)的,在保險(xiǎn)杠燈下面的位置。后來(lái),極越?jīng)Q定要去掉激光雷達(dá),主要有幾個(gè)方面的原因:
第一,從人類(lèi)駕駛的模式來(lái)看,頭上沒(méi)頂一個(gè)主動(dòng)光傳感器,還是通過(guò)視覺(jué),人腦手腳配合形成一個(gè)動(dòng)作。車(chē)上的攝像頭包括毫米波雷達(dá)的覆蓋范圍比人類(lèi)廣,完全可以替代掉額外的激光雷達(dá),完成駕駛的動(dòng)作。
第二,激光雷達(dá)的成本問(wèn)題,即便成本下降很快,但比起攝像頭還是有很大差別,BOM成本是攝像頭的5-10倍。售后維修成本高。
第三,當(dāng)激光雷達(dá)給的結(jié)果和其它感知的結(jié)果不一致時(shí),難以仲裁。而且激光得滿足光學(xué)基本的物理屬性,在一些有金屬表面反射比較強(qiáng)的場(chǎng)景之下,必須得消除偽影和鬼影,這些東西的長(zhǎng)尾效應(yīng)比較明顯,需要導(dǎo)入大量的成本。
第四,激光雷達(dá)的布置,現(xiàn)在車(chē)企基本都是把激光雷達(dá)放在車(chē)頂,這個(gè)對(duì)設(shè)計(jì)提出挑戰(zhàn)。
在背靠百度智駕能力、積累了一億公里數(shù)據(jù)以后,極越在2023年決定徹底舍棄激光雷達(dá)。當(dāng)然,純視覺(jué)方案的挑戰(zhàn)也很明顯:深度信息的天然缺失,需要花費(fèi)大量精力進(jìn)行數(shù)據(jù)的升維,從2D到3D進(jìn)行轉(zhuǎn)換。
潘云鵬在2023年的時(shí)候判斷,2024年是一個(gè)拐點(diǎn)?!皬娜ツ?0月27號(hào)發(fā)布這款車(chē)1.1版本,到現(xiàn)在的1.4版本,以及即將推出的1.5版本,每一個(gè)版本都會(huì)發(fā)現(xiàn)它的視覺(jué)性能,包括智駕的體驗(yàn)都極大提升,這也印證了我們當(dāng)年對(duì)視覺(jué)路線的判斷,一旦拐點(diǎn)到來(lái)之后,它的迭代周期頻率更敏捷?!?/p>
潘云鵬表示,“(智能駕駛)這個(gè)行業(yè)里觀點(diǎn)越來(lái)越類(lèi)似,有幾個(gè)關(guān)鍵詞,一個(gè)是去圖化,一個(gè)是激光雷達(dá),還有一個(gè)端到端。做純視覺(jué)方案時(shí),大家會(huì)聊激光雷達(dá)會(huì)聊成本和可靠性,我們純視覺(jué)把售后成本壓低,但是研發(fā)成本是提高的,對(duì)數(shù)據(jù)量提升,對(duì)算力的要求越來(lái)越大,總體而言,一定是每家公司根據(jù)自己的特點(diǎn)選擇的最合適的路線。
純視覺(jué)的上限高,但是下限也低,一切取決于數(shù)據(jù)和算力的支撐。
比如,特斯拉今年1月剛剛追加了5億美元新投資,購(gòu)買(mǎi)約1萬(wàn)個(gè)英偉達(dá)H100 GPU,用于自動(dòng)駕駛的訓(xùn)練。有數(shù)據(jù)顯示,特斯拉擁有H100 GPU的數(shù)量可能超過(guò)3萬(wàn)個(gè)。
抵達(dá)北京的那天,馬斯克就說(shuō),今年特斯拉將會(huì)投資約100億美元用于AI的訓(xùn)練和推理,而推理主要用于汽車(chē)。而任何支出達(dá)不到每年100億美元水平或者無(wú)法高效部署的公司,都無(wú)法在市場(chǎng)上競(jìng)爭(zhēng)。
極越的視覺(jué)大模型,包含了四大基礎(chǔ)能力:
第一,把之前的智駕小模型匯集成更大的大模型。原先每個(gè)功能都有自己的感知模型、控制模型,預(yù)測(cè)模型。極越01上對(duì)這些模型做了重構(gòu),有一個(gè)比較大的基礎(chǔ)模型。這個(gè)基礎(chǔ)模型具備幾個(gè)能力,一,具備在線繪圖的能力,是幫助極越去泛化、開(kāi)城,主要是應(yīng)對(duì)地圖數(shù)據(jù)不完善、不準(zhǔn)確的場(chǎng)景,可以做一些實(shí)時(shí)線圖,這是為什么極越可以很快開(kāi)放全國(guó)的原因之一。
第二,目標(biāo)監(jiān)測(cè)和持續(xù)跟蹤,對(duì)行人的目標(biāo)軌跡,行人識(shí)別,可以做到持續(xù)的追蹤,持續(xù)的預(yù)測(cè),讓車(chē)有一些預(yù)處理的能力,而不是變成“鬼探頭”的場(chǎng)景。
第三,OCC的占用網(wǎng)絡(luò)。不需要對(duì)障礙物進(jìn)行識(shí)別,直接看到在目前的行駛區(qū)域或者行駛路徑被遮擋后繞開(kāi),極大的提升障礙物檢測(cè)和安全性能。
今年1月,在極越預(yù)告的V1.3版本OTA中,加入OCC占用網(wǎng)絡(luò)的“BEV+OCC+Transformer”智能駕駛方案,被正式命名為“B.O.T三向箔”。
相較于目前市場(chǎng)主流的“BEV+ Transformer”方案,OCC技術(shù)為整車(chē)智駕帶來(lái)的最大變化是感知識(shí)別能力的提升,能夠?qū)φ系K物進(jìn)行3D精細(xì)刻畫(huà),模型精度可達(dá)厘米級(jí),比肩甚至超越激光雷達(dá)。
最后是場(chǎng)景理解,基于所有基礎(chǔ)能力的加持,可以對(duì)每幀視頻的數(shù)據(jù)做出最準(zhǔn)確的判斷,跟看圖說(shuō)話類(lèi)似,可以幫助智駕在預(yù)測(cè)和溝通的過(guò)程中,做出更好的判斷。
潘云鵬表示,“在合并一些模型之后,發(fā)現(xiàn)它的性能有很大的提升,算力要求在減小,因?yàn)槲覀冎靶∧P偷臄?shù)量比較多,而且得益于數(shù)據(jù)訓(xùn)練之后,所有的行車(chē)和泊車(chē)場(chǎng)景都有收益,這也是感知和基礎(chǔ)的大模型帶來(lái)自動(dòng)駕駛泛化能力和性能提升的例子。”
據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))了解,PPA開(kāi)通之后的日均滲透率在50%,極越將會(huì)在5月中旬發(fā)布1.5版本。
在開(kāi)城計(jì)劃上,今年極越的PPA功能將實(shí)現(xiàn)全國(guó)都能開(kāi)。具體來(lái)講,將先開(kāi)放一百個(gè)城市,主要是用戶最多的一些地方,在未來(lái)的一到兩個(gè)月逐步開(kāi)放到300至360城的范圍,到2024年,所有的鄉(xiāng)間道路都能開(kāi)。
具體的車(chē)輛功能上,自動(dòng)轉(zhuǎn)向燈和屏幕換擋也用到純視覺(jué)的能力。
1.4版本的時(shí)候,極越通過(guò)車(chē)的角度判斷是否有變道的意圖,從而控制轉(zhuǎn)向燈以及屏幕換擋。潘云鵬表示,極越很快還有自動(dòng)換擋的功能,通過(guò)視覺(jué)的能力,知道車(chē)主想前進(jìn)還是后退,對(duì)視覺(jué)的范疇進(jìn)行進(jìn)一步豐富
2024北京車(chē)展上,我們能看到,許多車(chē)企在智能化上持續(xù)發(fā)力,技術(shù)的演變節(jié)奏不斷加快。
潘云鵬表示,“技術(shù)越有多樣性,對(duì)用戶來(lái)講是個(gè)好事,最后還是用戶體驗(yàn)來(lái)說(shuō)話,用數(shù)據(jù)來(lái)說(shuō)話。最終應(yīng)該是百花齊放,純視覺(jué)、非純視覺(jué)、5顆激光雷達(dá),8顆激光雷達(dá),這都不重要,只要用戶的成本是可接受的,體驗(yàn)是安全舒心的,這都是挺好的?!?span style="color: #FFFFFF;">雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。