0
本文作者: 盧潔萍 | 2024-04-28 21:31 |
北京車展仍在繼續(xù)。
和2023年的上海、廣州車展一樣,智能駕駛依舊是這次車展繞不開的主題,但同時(shí)市場也在迅速變化,技術(shù)迭代的速度正超乎所有人的意料。
“從去年的上海車展到今年的北京車展,智能駕駛的發(fā)展突飛猛進(jìn),連我自己都被驚訝到?!?/p>
理想汽車智能駕駛副總裁朗咸朋博士在北京車展期間地平線的生態(tài)圓桌論壇上講道,“去年大家還在講高速NOA、講Transformer 和BEV,今年行業(yè)卻已對城市NOA司空見慣,幾乎都在講無圖方案和端到端?!?/p>
一個更明顯的變化是,智能駕駛的核心正回歸至消費(fèi)者本質(zhì)——更好用、更擬人、更安全,為了提高L2+級智能駕駛功能的市場滲透率,如今行業(yè)關(guān)于城區(qū)NOA的規(guī)?;^量,正從比拼開城速度轉(zhuǎn)向比拼日活。
而日活,將成為衡量城區(qū)NOA是否好用的關(guān)鍵指標(biāo),消費(fèi)者對于智駕功能的實(shí)際體驗(yàn)評價(jià)、喜好也正被各車企放至愈加重要的位置。
然而一個問題是,從實(shí)際體驗(yàn)來看,城區(qū)NOA目前尚未達(dá)到用戶眼中“可用”標(biāo)準(zhǔn),距離“愛用”更是相距甚遠(yuǎn)。
“城區(qū)NOA真正做到讓消費(fèi)者愿意用是很難的。目前城區(qū)NOA的激活時(shí)間其實(shí)還是非常低的。”元戎啟行CEO周光則如此表示,“就算是愿意用了,但很多時(shí)候,這些功能給消費(fèi)者帶來的是驚嚇,而不是驚喜??赡芤淮危ú豁樌捏w驗(yàn))就會讓消費(fèi)者戒掉?!?/p>
從“可用”到“好用”,高階智駕的路還要走多久?如今眾多車企與Tier1們幾乎無人不談的端到端會是這個轉(zhuǎn)折點(diǎn)的答案嗎?端到端量產(chǎn)落地的最佳解法又會是什么?
各家車企關(guān)于高階智駕“開城大戰(zhàn)”的火藥味一路蔓延到了北京車展中。
“城市NOA在全國都能開我們肯定是第一,我們的目標(biāo)是到今年年內(nèi),在國內(nèi)大部分地區(qū)甚至小區(qū)內(nèi)都可以開?!毙※i汽車CEO何小鵬在北京車展接受新智駕等媒體采訪時(shí)如此表示。
小米汽車首次參展即虹吸巨大流量,雷軍在車展上自信喊話,“小米SU7的高速NOA絕對可以媲美華為、小鵬。”同時(shí)雷軍還宣布,小米SU7的城市NOA將會在5月份開始推送。
與此同時(shí),仰望汽車的仰望U7將在今年第三季度開通城市領(lǐng)航功能、魏牌的藍(lán)山智駕版將在5月進(jìn)行大規(guī)模NOA試駕體驗(yàn)、極越汽車計(jì)劃在今年實(shí)現(xiàn)城市NOA覆蓋全國......
從時(shí)間節(jié)點(diǎn)看,國內(nèi)一眾新能源品牌正在進(jìn)入高階智駕“全國都能開”“有路就能開”的規(guī)?;慨a(chǎn)新階段。
然而實(shí)際上,這兩年車企在大規(guī)模落地高階智能駕駛方案時(shí)卻遇到了不小的挑戰(zhàn)。
在中高階智駕方案,由于技術(shù)的不成熟,本應(yīng)給消費(fèi)者帶來極致體驗(yàn)的功能卻無法發(fā)揮出應(yīng)有的效果,從而吸引消費(fèi)者買單。
麥肯錫在《2024麥肯錫中國汽車消費(fèi)者洞察》報(bào)告中指出,消費(fèi)者對各類自動駕駛功能的興趣正在提升,但愿意為之額外付費(fèi)的意愿卻在下降;其中一線城市的付費(fèi)意愿下降尤為明顯。
事實(shí)上,雖然目前城區(qū)NOA功能上車已久,各家車企對城區(qū)NOA功能的落地和推廣也都相當(dāng)看重,但從市場反饋的情況來看,大多數(shù)車企的城市NOA仍處于起步階段,尚且無法滿足用戶的智駕需求,要么適用場景有限,要么駕駛體驗(yàn)不佳,難以稱得上好用。
地平線就在這次的北京車展上指出,智駕系統(tǒng)將經(jīng)歷從可用、好用到愛用的三個發(fā)展階段:
?可用:以滿足物理指標(biāo)為目標(biāo),聚焦場景通過率、通勤效率等物理指標(biāo),但在體驗(yàn)上要么“慫”要么“莽”,只能達(dá)到“可用”的標(biāo)準(zhǔn)。
?好用:在物理指標(biāo)基礎(chǔ)上,以達(dá)到擬人化體驗(yàn)為目標(biāo),聚焦實(shí)現(xiàn)更優(yōu)雅從容隨時(shí)可激活的體驗(yàn),達(dá)到用戶心中“好用”的標(biāo)準(zhǔn),真正改變消費(fèi)者的認(rèn)知。
?愛用:以達(dá)到智駕平權(quán)為目標(biāo),聚焦通過極致的應(yīng)用和量產(chǎn)效率,讓高階智駕體驗(yàn)人人可及,真正讓每個消費(fèi)者“愛用”。
而當(dāng)下量產(chǎn)的以城區(qū)NOA為代表的高階智駕系統(tǒng)尚未充分達(dá)到用戶眼中的“可用”狀態(tài),城市NOA目前的“慫”“莽”“急”“貴”四大問題成為阻礙消費(fèi)者為之付費(fèi)的關(guān)鍵因素:
1.慫:擁堵更添堵,導(dǎo)致體驗(yàn)接管;
2.莽:搶行太莽撞,導(dǎo)致安全接管;
3.急:為快速開城,系統(tǒng)可用性下降;
4.貴:不利于功能普惠與大規(guī)模市場落地。
以MPI為例,目前用戶在開啟城區(qū)NOA功能時(shí),基本幾十公里就得人工接管一次,離達(dá)到“輕松好用”相去甚遠(yuǎn),以路口轉(zhuǎn)彎這類典型高頻場景為例,目前用戶在開啟城區(qū)NOA功能時(shí),通常都會因?yàn)橄到y(tǒng)fullstop或軌跡生硬而選擇接管,離達(dá)到“輕松好用”相去甚遠(yuǎn)。
用戶體驗(yàn)不佳,再加上成本過高、全場景NOA受高精地圖覆蓋限制,城區(qū)NOA功能僅能在有限的、少數(shù)高線城市開通,且過于激進(jìn)的去高精地圖也一定程度帶來了系統(tǒng)性能下降,經(jīng)常隨機(jī)出現(xiàn)各種退功能問題,使得這些功能的實(shí)際用戶使用頻率并不高,從而進(jìn)一步造成功能迭代開發(fā)難度大、周期長的問題。
要想進(jìn)一步提高智能駕駛的市場滲透率,2024年,智駕功能的改善和迭代必須轉(zhuǎn)向?qū)嵱门c場景優(yōu)化,以“用戶粘性”作為自身核心競爭點(diǎn)。
而在價(jià)格戰(zhàn)愈加白熱化的當(dāng)下,如何在有限的成本下實(shí)現(xiàn)更好的功能體驗(yàn),又如何讓下一代高階智駕系統(tǒng)兼顧通行效率和擬人化體驗(yàn)?
地平線認(rèn)為,技術(shù)重構(gòu)是實(shí)現(xiàn)全場景高階智能駕駛系統(tǒng)量產(chǎn)的唯一途徑。
2023年特斯拉公布FSD V12版本,將城市街道駕駛堆棧升級為端到端神經(jīng)網(wǎng)絡(luò)這一技術(shù)路線,由此一股名為“端到端”熱潮開始席卷國內(nèi)智駕圈,在今年的北京車展上,更是逐漸升溫,成為各車企和Tier1們口中放不下的關(guān)鍵字之一。
所謂端到端,指的是一種新型的AI模型,采用BEV+Transformer技術(shù)架構(gòu)等方式來實(shí)現(xiàn)感知決策一體化,以達(dá)到輸入原始數(shù)據(jù)后便能輸出最終執(zhí)行指令的效果。這項(xiàng)技術(shù)令該版本比以往減少了數(shù)十萬代碼,讓汽車在沒有數(shù)據(jù)連接的情況下仍可在不熟悉的路段地形上行駛。
一位算法方案開發(fā)工程師曾對新智駕指出,“將感知與決策融合到同一個模型中,使得端到端模型能有效避免聯(lián)級之間的誤差值,無需任何人工規(guī)則介入,更加接近人類駕駛行為的高階智駕?!?/p>
2023年,特斯拉FSD V12展示了端到端模型上車的效果后,國內(nèi)主流車企與Tier1意識到這是一個未來趨勢,開始快馬加鞭地追趕。
在過去,智能駕駛從業(yè)者大多將整個自動駕駛?cè)蝿?wù)劃分為感知、預(yù)測、決策、控制等模塊,由于每個模塊的技術(shù)棧相差很大,且難度高,所以每個工程師都獨(dú)立負(fù)責(zé)其中一或兩個模塊。
因此目前已量產(chǎn)的智駕模型,也大多采用傳統(tǒng)模塊化的架構(gòu),即按照感知、預(yù)測等功能來劃分成不同的多個小模型,每個模型都要單獨(dú)對其進(jìn)行訓(xùn)練和優(yōu)化,且下游規(guī)控環(huán)節(jié)仍以規(guī)則為主。
與傳統(tǒng)模塊化架構(gòu)不同的是,端到端模型是由多個小模型(即神經(jīng)網(wǎng)絡(luò))級聯(lián)而成,并且只需通過訓(xùn)練這一個大模型,就能達(dá)到優(yōu)化和提升各個功能模塊的能力,從而減少傳統(tǒng)架構(gòu)下對逐一模塊訓(xùn)練所帶來的研發(fā)成本。
(新智駕整理制圖)
技術(shù)落地大戰(zhàn)爆發(fā)前夕,搶先一步的是學(xué)術(shù)預(yù)研。
學(xué)術(shù)界對端到端的研究始于1988年的ALVINN,隨后發(fā)展出端到端CNN原型系統(tǒng)。
地平線則早在2016年便率先提出了自動駕駛端到端的演進(jìn)理念,并在2017年就開始采用訓(xùn)練端到端系統(tǒng),同時(shí)發(fā)布軟件框架Hugo。
2022年,地平線又提出行業(yè)領(lǐng)先的自動駕駛感知端到端算法Sparse4D,2023年,由地平線學(xué)者一作的業(yè)界首個公開發(fā)表的端到端自動駕駛大模型UniAD,榮獲CVPR 2023最佳論文。
論文中, UniAD 框架被首次提出,成為業(yè)界首個感知決策一體化的自動駕駛通用模型。
基于此,研究人員將感知、預(yù)測和規(guī)劃等三大類主任務(wù)、六小類子任務(wù)(目標(biāo)檢測、目標(biāo)跟蹤、場景建圖、軌跡預(yù)測、柵格預(yù)測和路徑規(guī)劃)整合到統(tǒng)一的基于 Transformer 的端到端網(wǎng)絡(luò)框架下,實(shí)現(xiàn)全棧關(guān)鍵任務(wù)駕駛通用模型。
與此同時(shí),地平線還積累了基于蒙特卡洛樹搜索的端到端深度學(xué)習(xí)算法,大幅提升了智駕系統(tǒng)在復(fù)雜交通環(huán)境中的感知和交互式博弈能力。
一業(yè)界高管向新智駕透露,“實(shí)力強(qiáng)的企業(yè)將有望在1-2年內(nèi)推出端到端模型,慢慢地,供應(yīng)商與常規(guī)企業(yè)也會跟進(jìn),這是一個可以確定的趨勢。”
比如在2023年12月,理想汽車完成了OTA5.0更新。從發(fā)布的 AD Max 3.0 來看,在端到端架構(gòu)的支持下,理想汽車整合了BEV大模型、MPC模型預(yù)測控制以及時(shí)空聯(lián)合規(guī)劃等能力,還新增了Occupancy占用網(wǎng)絡(luò)算法。同時(shí),理想還利用自研的神經(jīng)先驗(yàn)網(wǎng)絡(luò)NPN(NeuralPriorNet)為BEV打“補(bǔ)丁”。
此外,為了處理復(fù)雜的交通紅綠燈信息,理想汽車曾表示,其采用信號燈通行意圖網(wǎng)絡(luò)TIN(Traffic Intention Net)來解決,而TIN正是端到端模型。
何小鵬也在這次的北京車展上透露,小鵬汽車將在第二季度上車端到端大模型AI智駕,這一大模型的應(yīng)用將過去基于圖片的算法框架,轉(zhuǎn)為視頻流。
在各家競相追逐端到端模型上車之際,業(yè)界被反復(fù)追問——端到端模型是否會成為高階智能駕駛的技術(shù)終局?
業(yè)內(nèi)人士向新智駕表示,智能駕駛技術(shù)最終的發(fā)展方向應(yīng)是更貼近人類開車的行為模式,至少與人類駕駛行為相似的模塊之間具有更強(qiáng)更緊密的關(guān)聯(lián)。
在他看來,高階智能駕駛最終的技術(shù)架構(gòu)應(yīng)是完全端到端的方案,以攝像頭、毫米波雷達(dá)、激光雷達(dá)等多傳感器、多模態(tài)的輸入,作為端到端的輸入端,車輛的控制命令成為輸出端,跳過了中間的定位、預(yù)測、規(guī)劃、決策等模塊,只有輸入和輸出這兩端,這是將來的技術(shù)框架。
綜合來看,端到端的路線意味著系統(tǒng)更大的部分是由數(shù)據(jù)驅(qū)動的模塊所構(gòu)建,那么就意味著由人所維護(hù)的模塊相應(yīng)的比例會降低,那么這樣的話,整個系統(tǒng)就更容易維護(hù)。
且端到端架構(gòu)通過一個模型實(shí)現(xiàn)多種模型的功能,研發(fā)人員只需要針對這一個模型進(jìn)行整體訓(xùn)練、調(diào)整優(yōu)化,即可實(shí)現(xiàn)性能上的提升,因此可以更好地集中資源,實(shí)現(xiàn)功能聚焦。
更關(guān)鍵的是,端到端模型方案的潛力在于擁有更高的性能上限。由于任務(wù)更少、避免了大量重復(fù)處理,端到端自動駕駛可以提高計(jì)算效率,并且可以通過不斷擴(kuò)展數(shù)據(jù)來提升系統(tǒng)的能力上限。
功能聚焦、易維護(hù)、擁有更高性能上限、更接近人類駕駛行為......端到端系統(tǒng)無疑是驅(qū)動城區(qū)NOA邁向“好用、愛用”的最優(yōu)實(shí)現(xiàn)路徑。
而隨著端到端系統(tǒng)的加速落地,行業(yè)關(guān)于高階智能駕駛的比拼也將迎來新節(jié)點(diǎn)。
事實(shí)上,端到端自動駕駛技術(shù)目前存在的發(fā)展瓶頸仍然是傳統(tǒng)的三大問題——算法、算力和數(shù)據(jù)。
其中算力平臺需要支持更大規(guī)模的端到端的自動駕駛系統(tǒng)里面的網(wǎng)絡(luò);數(shù)據(jù)層面需要有海量的、非常多樣性的,能夠覆蓋普通用戶生活場景中絕大部分 case 的數(shù)據(jù);而算法方面則需要探索可解釋、可干預(yù)性強(qiáng)的端到端自動駕駛系統(tǒng)。
誰能率先打通這三大關(guān)卡,無疑誰就能在這場關(guān)于端到端的洗牌局中更擁有走到最后的底氣和決勝牌面。
這意味著,各行業(yè)玩家們必須解決復(fù)雜嵌入式計(jì)算機(jī)系統(tǒng)技術(shù)和極致工程能力的雙重挑戰(zhàn),做到軟硬件高效協(xié)同。
這一方面需要各企業(yè)不斷拓展ODD,需要在盡可能大的地域空間及各種天氣條件下實(shí)現(xiàn)盡可能高的產(chǎn)品性能。
另一方面還要提升功能的性能和體驗(yàn),實(shí)現(xiàn)NCA、ICA+、ICA、VPA、APA等工作模式并無縫切換,并且每個模式的系統(tǒng)性能都要打磨到最優(yōu)以提升系統(tǒng)處理hard case的能力。
目前行業(yè)里的玩家在落地高階智駕時(shí)通常有兩種類型的技術(shù)策略。
第一種是側(cè)重于功能體驗(yàn)和性能的提升,但是ODD的拓展做得不夠,依然非常狹窄;第二種是側(cè)重于拓展更廣的ODD,但是功能水平卻非常狹窄和有限。
要想二者兼顧,需要開發(fā)者同時(shí)具備很強(qiáng)的軟件與硬件能力,以及極致的工程能力,同時(shí)在兩個維度實(shí)現(xiàn)突破。
事實(shí)上,更高端的計(jì)算方案和傳感器等硬件配置,決定了性能的下限,更先進(jìn)的軟件技術(shù)架構(gòu),則決定了性能的上限,軟硬協(xié)同無疑是當(dāng)下實(shí)現(xiàn)端到端高效量產(chǎn)落地的最佳路徑之一。
而在地平線創(chuàng)始人余凱看來,軟硬協(xié)同是地平線的獨(dú)特優(yōu)勢,依托領(lǐng)先的前沿軟件算法研究,去設(shè)計(jì)最先進(jìn)的硬件計(jì)算架構(gòu),然后支持最先進(jìn)的算法,使芯片架構(gòu)與應(yīng)用軟件配合得嚴(yán)絲合縫,能使計(jì)算方案效率非常高。
而在這次的北京車展上,憑借前沿的端到端軟件算法技術(shù),地平線發(fā)布結(jié)合端到端技術(shù)的量產(chǎn)級高階智能駕駛系統(tǒng)SuperDrive,就試圖提供打造“好用”智駕方案的解法。
一方面,SuperDrive通過三網(wǎng)合一的感知端到端架構(gòu),將智駕系統(tǒng)的遮擋準(zhǔn)召率提升70%,對當(dāng)前行業(yè)感知架構(gòu)時(shí)延高、規(guī)則多、負(fù)載重的問題進(jìn)行了有效解決。
另一方面,SuperDrive通過數(shù)據(jù)驅(qū)動的交互博弈大幅提升了智駕系統(tǒng)在復(fù)雜交通環(huán)境中的感知和交互式博弈能力,做到在擁堵場景下變道成功率提升50%,路口通行效率提升67%。
同時(shí),SuperDrive還具備無高精地圖的感知能力,能做到對高精地圖輕依賴,從而快速上線各城市NOA功能,做到高效拓城。
在計(jì)算方案層面,SuperDrive則與征程6旗艦版協(xié)同,試圖打造出最佳的軟硬結(jié)合高階智駕系統(tǒng),讓好用的城區(qū)NOA方案加速規(guī)模化量產(chǎn)落地,實(shí)現(xiàn)人人可及。
事實(shí)上,除了SuperDrive這套城市NOA方案,在北京車展上,地平線還發(fā)布了業(yè)內(nèi)期待已久的征程6智能駕駛計(jì)算方案。
征程6系列共推出六個版本,包括征程6B、征程6L、征程6E、征程6M、征程6H、征程6P,其中征程6旗艦版——征程6P,算力560 TOPS,面向的就是高階智駕市場,其擁有高集成度、高算力、高效率、高處理能力、高接入能力以及高安全等六大產(chǎn)品特性。
根據(jù)介紹,單顆征程6旗艦即可支持感知、規(guī)劃決策、控制等全棧計(jì)算任務(wù),支持全場景NOA功能。
與此同時(shí),征程6P還在高性能的前提下做到了高性價(jià)比,基于征程6P的硬件系統(tǒng)成本可以做到1萬元以下。
另一方面,Transformer也是實(shí)現(xiàn)端到端自動駕駛的重要技術(shù)。
如果把端到端比作高階智能駕駛要前往的終點(diǎn),BEV+Transformer更像是旅途中的一座橋梁,也可將其視為一種工具,而Occupancy占用網(wǎng)絡(luò)則是一種可疊加使用的輔助“武器”。
而地平線無論在算法上還是計(jì)算方案上,都實(shí)現(xiàn)了對Transformer的最佳支持。
在算法層面,UniAD是行業(yè)首個感知決策一體化端到端模型,在nuScenes所有任務(wù)上都達(dá)到了最佳性能。
地平線的純視覺自動駕駛算法Sparse4D則是其接棒BEV+Transformer的下一代架構(gòu)。在今年1月份,地平線還將Sparse4D系列算法開源,以推動行業(yè)更多開發(fā)者共同參與到端到端自動駕駛、稀疏感知等前沿技術(shù)方向的探索中。
在硬件層面,地平線新一代BPU納什架構(gòu),原生支持大參數(shù)量Transformer模型,并提供業(yè)內(nèi)同級最強(qiáng)的Transformer計(jì)算性能,為先進(jìn)的端到端系統(tǒng)的部署提供有力支持。
而在相關(guān)技術(shù)棧方面,地平線搭建的促進(jìn)軟件開發(fā)和定制的各種工具,諸如算法開發(fā)工具鏈天工開物、嵌入式中間件踏歌、軟件開發(fā)平臺艾迪等等,也體現(xiàn)了其強(qiáng)大的軟硬件綜合能力。
更低成本、更高性能上限、更高效協(xié)同的全棧式軟硬件能力,讓高階智能駕駛系統(tǒng)SuperDrive+征程6旗艦版的協(xié)同指向了一個終極方向——幫助產(chǎn)業(yè)玩家更高效地實(shí)現(xiàn)基于端到端模型的高階智駕大規(guī)模量產(chǎn)落地。
據(jù)地平線透露,在合作車企方面,地平線的SuperDrive方案已經(jīng)與多家車企和頂級Tier 1達(dá)成合作,預(yù)計(jì)到今年第四季度將會有標(biāo)準(zhǔn)量產(chǎn)方案推出,而到明年第三季度,首款搭載SuperDrive方案的車型也將進(jìn)入交付期。
從可用到好用,國內(nèi)的汽車高階智能駕駛之路剛剛走向轉(zhuǎn)折點(diǎn),要想在關(guān)于端到端這場火熱的戰(zhàn)事中勝出,作為國內(nèi)智能駕駛方案的頭部供應(yīng)商,地平線的征程剛剛開始。
雷峰網(wǎng)#雷峰網(wǎng)#雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。