丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
智能駕駛 正文
發(fā)私信給盧潔萍
發(fā)送

0

國(guó)內(nèi)「端到端模型」能圍剿特斯拉FSD嗎?業(yè)內(nèi)人士:我們技術(shù)至少晚了一年

本文作者: 盧潔萍 2024-03-18 14:28
導(dǎo)語(yǔ):端到端模型上車,給高階智駕劃開(kāi)了一條新路徑,哪怕無(wú)法一步到位,但車企與Tier1依然義無(wú)反顧地投身到這場(chǎng)浪潮中。

“我們的原創(chuàng)性技術(shù)創(chuàng)新能力比較弱,一般都會(huì)跟隨國(guó)外頂尖廠商的先進(jìn)技術(shù)路線去探索,比如特斯拉。悲觀地看,我們比全球最Top的技術(shù)進(jìn)展晚了一年左右?!?br/>

智能駕駛算法方案商創(chuàng)始人宋文向新智駕直言。

“不過(guò),端到端這條路線是清晰的,車企與Tier1一定會(huì)把現(xiàn)有的模型往端到端方向去做?!?/p>

2023年5月初,馬斯克在推特上表示,特斯拉將發(fā)布FSDV12版本,該版本將采用端到端的AI技術(shù)。

這是一種新型的AI模型,采用BEV+Transformer技術(shù)架構(gòu)等方式來(lái)實(shí)現(xiàn)感知決策一體化,以達(dá)到輸入原始數(shù)據(jù)后便能輸出最終執(zhí)行指令的效果。這項(xiàng)技術(shù)令該版本比以往減少了數(shù)十萬(wàn)代碼,讓汽車在沒(méi)有數(shù)據(jù)連接的情況下仍可在不熟悉的路段地形上行駛。

如今,國(guó)內(nèi)眾多車企與Tier1,幾乎無(wú)人不談端到端,這也成為車企和Tier1爭(zhēng)相殺出重圍的一條新路徑。

“做端到端,是順應(yīng)趨勢(shì)”

自特斯拉公布FSD V12版本后,一股名為“端到端”熱潮席卷國(guó)內(nèi)智駕圈,與此同時(shí),BEV、Transformer、Occupancy占用網(wǎng)絡(luò)也成為業(yè)內(nèi)熱詞。

如果把端到端比作高階智能駕駛要前往的終點(diǎn),BEV+Transformer更像是旅途中的一座橋梁,也可將其視為一種工具,而Occupancy占用網(wǎng)絡(luò)則是一種可疊加使用的輔助“武器”。

2023年,特斯拉FSD V12展示了端到端模型上車的效果,這是建立在FSD V11所使用的BEV+Transforemer架構(gòu)與占用網(wǎng)絡(luò)的基礎(chǔ)上來(lái)實(shí)現(xiàn)的。

特斯拉快節(jié)奏地發(fā)布新成果,使得國(guó)內(nèi)主流車企與Tier1意識(shí)到這是一個(gè)未來(lái)趨勢(shì),開(kāi)始快馬加鞭地追趕。

在過(guò)去,智能駕駛從業(yè)者大多將整個(gè)自動(dòng)駕駛?cè)蝿?wù)劃分為感知、預(yù)測(cè)、決策、控制等模塊,由于每個(gè)模塊的技術(shù)棧相差很大,且難度高,所以每個(gè)工程師都獨(dú)立負(fù)責(zé)其中一或兩個(gè)模塊。

因此目前已量產(chǎn)的智駕模型,也大多采用傳統(tǒng)模塊化的架構(gòu),即按照感知、預(yù)測(cè)等功能來(lái)劃分成不同的多個(gè)小模型,每個(gè)模型都要單獨(dú)對(duì)其進(jìn)行訓(xùn)練和優(yōu)化,且下游規(guī)控環(huán)節(jié)仍以規(guī)則為主。

與傳統(tǒng)模塊化架構(gòu)不同的是,端到端模型是由多個(gè)小模型(即神經(jīng)網(wǎng)絡(luò))級(jí)聯(lián)而成,并且只需通過(guò)訓(xùn)練這一個(gè)大模型,就能達(dá)到優(yōu)化和提升各個(gè)功能模塊的能力,從而減少傳統(tǒng)架構(gòu)下對(duì)逐一模塊訓(xùn)練所帶來(lái)的研發(fā)成本。

一位算法方案開(kāi)發(fā)工程師說(shuō)到,“將感知與決策融合到同一個(gè)模型中,使得端到端模型能有效避免聯(lián)級(jí)之間的誤差值,無(wú)需任何人工規(guī)則介入,更加接近人類駕駛行為的高階智駕?!?/p>

國(guó)內(nèi)「端到端模型」能圍剿特斯拉FSD嗎?業(yè)內(nèi)人士:我們技術(shù)至少晚了一年

(新智駕整理制圖)

技術(shù)落地大戰(zhàn)爆發(fā)前夕,搶先一步的是學(xué)術(shù)預(yù)研。

2023年6月,上海人工智能實(shí)驗(yàn)室、武漢大學(xué)及商湯科技聯(lián)合提出的《Planning-oriented Autonomous Driving》(以路徑規(guī)劃為導(dǎo)向的自動(dòng)駕駛)獲得CVPR 最佳論文獎(jiǎng)。

論文中, UniAD 框架被首次提出,成為業(yè)界首個(gè)感知決策一體化的自動(dòng)駕駛通用模型。

基于此,研究人員將感知、預(yù)測(cè)和規(guī)劃等三大類主任務(wù)、六小類子任務(wù)(目標(biāo)檢測(cè)、目標(biāo)跟蹤、場(chǎng)景建圖、軌跡預(yù)測(cè)、柵格預(yù)測(cè)和路徑規(guī)劃)整合到統(tǒng)一的基于 Transformer 的端到端網(wǎng)絡(luò)框架下,實(shí)現(xiàn)全棧關(guān)鍵任務(wù)駕駛通用模型。

宋文認(rèn)為,端到端模型上車,是帶領(lǐng)智能駕駛邁向高階的康莊大道。不管是Tier1還是車企,只要手握海量的有效數(shù)據(jù)、具備算法研發(fā)和工程落地能力,就能率先一步,領(lǐng)先同行。

因此,車企和Tier1們也不甘示弱,都在端到端模型這條跑道上發(fā)力沖鋒。

2022年10月,極越汽車開(kāi)始重寫(xiě)智駕系統(tǒng)的算法架構(gòu)。在算法上,極越的BEV+Transformer架構(gòu)是基于此前百度阿波羅的純視覺(jué)方案。

2023年12月,理想汽車完成了OTA5.0更新,從發(fā)布的 AD Max 3.0 來(lái)看,在端到端架構(gòu)的支持下,理想汽車整合了BEV大模型、MPC模型預(yù)測(cè)控制以及時(shí)空聯(lián)合規(guī)劃等能力,還新增了Occupancy占用網(wǎng)絡(luò)算法。同時(shí),理想還利用自研的神經(jīng)先驗(yàn)網(wǎng)絡(luò)NPN(NeuralPriorNet)為BEV打“補(bǔ)丁”。

此外,為了處理復(fù)雜的交通紅綠燈信息,理想汽車曾表示,其采用信號(hào)燈通行意圖網(wǎng)絡(luò)TIN(Traffic Intention Net)來(lái)解決,而TIN正是端到端模型。

2023年10月,毫末在AI Day上推出大模型應(yīng)用,依靠其曾發(fā)布的DriveGPT,毫末可通過(guò)將圖文和文圖的交叉特征做匹配,再將其放到大語(yǔ)言模型中,針對(duì)形成于特征空間的搜索(query)特征。大模型可在不需做太多準(zhǔn)備的情況下,根據(jù)場(chǎng)景需求將存量數(shù)據(jù)進(jìn)行重新標(biāo)注。

另?yè)?jù)知情人士透露,早在2023年8月,元戎啟行就已將端到端模型上車。

正如宋文所透露,“實(shí)力強(qiáng)的企業(yè)將有望在1-2年內(nèi)推出端到端模型,慢慢地,供應(yīng)商與常規(guī)企業(yè)也會(huì)跟進(jìn),這是一個(gè)可以確定的趨勢(shì)?!?/p>

在各家競(jìng)相追逐端到端模型上車之際,業(yè)界被反復(fù)追問(wèn)——端到端模型是否會(huì)成為高階智能駕駛的技術(shù)終局?

云驥智行高級(jí)感知算法工程師兼端到端技術(shù)負(fù)責(zé)人王庭琛向新智駕表示,智能駕駛技術(shù)最終的發(fā)展方向應(yīng)是更貼近人類開(kāi)車的行為模式,至少與人類駕駛行為相似的模塊之間具有更強(qiáng)更緊密的關(guān)聯(lián)。

昇啟科技創(chuàng)始人兼CEO孫琪傳達(dá)出與王庭琛相似的觀點(diǎn)。

孫琪向新智駕指出,高階智能駕駛最終的技術(shù)架構(gòu)應(yīng)是完全端到端的方案,以毫米波雷達(dá)、激光雷達(dá)等多傳感器、多模態(tài)的輸入,作為端到端的輸入端,車輛的控制命令成為輸出端,跳過(guò)了中間的定位、預(yù)測(cè)、規(guī)劃、決策等模塊,只有輸入和輸出這兩端,這是將來(lái)的技術(shù)框架。

商湯絕影智能駕駛高級(jí)總監(jiān)武偉認(rèn)為,如果多模態(tài)的AI Agent能發(fā)展得特別充分,達(dá)到接近AGI程度的AI agent會(huì)是一個(gè)終極方案。然而,在到達(dá)終局狀態(tài)之前,使用專用的多模態(tài)大模型驅(qū)動(dòng)的高階智能駕駛軟件系統(tǒng),將會(huì)是比較理想的狀態(tài)。

武偉補(bǔ)充表示,在這種狀態(tài)里,科研人員可能需要使用海量的多模態(tài)數(shù)據(jù),以從自監(jiān)督和半監(jiān)督中出來(lái)一個(gè)人類駕駛行為的模型。(端到端模型上車能否到達(dá)高階智駕技術(shù)終局,業(yè)界仍存各種觀點(diǎn)爭(zhēng)議,歡迎添加編輯微信lujiepinga交流)

端到端入局者:主機(jī)廠VS Tier1

端到端模型賽道上,正在“狂飆”的陣營(yíng)可分為主機(jī)廠與Tier1兩大派別,他們分別手握算法與數(shù)據(jù)兩大“武器”。

車企最大的優(yōu)勢(shì)在于積累了海量的C端用戶數(shù)據(jù)以及建立超算中心。

以特斯拉為例,特斯拉的“影子模式”隨時(shí)都在準(zhǔn)備數(shù)據(jù)采集,該模式在采集車內(nèi)車外動(dòng)/靜態(tài)數(shù)據(jù)時(shí),效率相對(duì)更高。而國(guó)內(nèi)華為、小鵬、理想汽等車企均具備數(shù)采能力,并聯(lián)手設(shè)立超算中心。

小鵬與阿里云共建了扶搖智算中心,其訓(xùn)練算力為600PFLOPS,理想汽車和火山引擎合作共建了訓(xùn)練中心,算力為1200PFLOPS,蔚來(lái)汽車的”智算中心“算力則高達(dá)1400PFLOPS。

另外,小鵬汽車的XNGP搭載BEV視覺(jué)感知系統(tǒng)XNet和華為的ADS2.0,基本都訓(xùn)練出了可實(shí)裝上車的車載大模型產(chǎn)品。

武偉表示,“車企的優(yōu)勢(shì)在于數(shù)據(jù),有些車企配置高階傳感器的車已經(jīng)在路上行駛,基于這種方式,車企能利用好更多車輛的數(shù)據(jù)。此外,為了落地一些量產(chǎn)項(xiàng)目,車企采購(gòu)了大量高精度地圖,這對(duì)研發(fā)端到端算法真值系統(tǒng)起到較大的促進(jìn)作用?!?/p>

除了數(shù)據(jù),算力也是車企比Tier1更具優(yōu)勢(shì)的方面。

算法方案商工程師葉帆說(shuō)道,在數(shù)據(jù)、算力與算法三大要素里,因?yàn)樗懔εc資金實(shí)力有著緊密聯(lián)系,算力的實(shí)現(xiàn)門檻也許最低?!爸灰凶銐虻那廊ベ?gòu)買足夠多的算力,用錢就能解決。與資金實(shí)力雄厚的車企相比,Tier1的資金實(shí)力較弱,所以在算力方面不占優(yōu)勢(shì)?!?/p>

Tier1的優(yōu)勢(shì)點(diǎn),則或許在算法層面。

昇啟科技創(chuàng)始人孫琪表示:“通常來(lái)說(shuō),主機(jī)廠專注于集成類工作,且手握足夠大的數(shù)據(jù)量,Tier1則算法能力更強(qiáng),因此,未來(lái)兩個(gè)陣營(yíng)聯(lián)手起來(lái),Tier1深度綁定主機(jī)廠,才能把各自的優(yōu)勢(shì)發(fā)揮出來(lái)?!?/p>

事實(shí)上,從本質(zhì)上看,使得兩者能互補(bǔ)的原因在于工作模式的不同,而不在于能力的差異。

車企的智能駕駛團(tuán)隊(duì)通常服務(wù)于自身的量產(chǎn)項(xiàng)目,追求算法的可維護(hù)性與穩(wěn)定性,這種開(kāi)發(fā)模式注重產(chǎn)品的周期性管理和工程化落地,從而使得車企對(duì)于算法層面的更新并不敏感,大部分主機(jī)廠更傾向于謹(jǐn)慎跟隨行業(yè)內(nèi)其他公司的進(jìn)展。

而Tier1智駕廠商往往采取敏捷開(kāi)發(fā)的原則,更擅長(zhǎng)對(duì)新體系新架構(gòu)進(jìn)行嘗試和捕捉,因此在端到端模型上,供應(yīng)商擁有先發(fā)優(yōu)勢(shì)和試錯(cuò)經(jīng)驗(yàn)。

但至于數(shù)據(jù)方面,王庭琛并不認(rèn)為現(xiàn)在數(shù)據(jù)量是拉開(kāi)車企與Tier1廠商差距的因素,他指出,“當(dāng)端到端模型進(jìn)入一個(gè)穩(wěn)定使用的平臺(tái)期時(shí),才會(huì)遇到數(shù)據(jù)量的瓶頸,但當(dāng)?shù)侥莻€(gè)時(shí)期,Tier1的數(shù)據(jù)閉環(huán)和自動(dòng)標(biāo)注的鏈條也將變得更成熟?!?/p>

由于目前端到端模式還處于冷啟動(dòng)階段,因此當(dāng)下數(shù)據(jù)的質(zhì)量比數(shù)量更為重要。在一定程度上,算法迭代速度也會(huì)成為制約企業(yè)競(jìng)爭(zhēng)力的關(guān)鍵。

武偉以UniAD算法舉例表示,他透露道,“在整體冷啟動(dòng)過(guò)程中,把數(shù)據(jù)質(zhì)量以及模型訓(xùn)練做好,并且能擁有較好的訓(xùn)練方式,這些是關(guān)鍵。區(qū)別于BEV+Transformer體系相對(duì)較為收斂,端到端模型還處于快速的進(jìn)化過(guò)程中,所以,算法迭代速度可能也會(huì)決定其競(jìng)爭(zhēng)力的高低?!?/p>

黎明時(shí)刻尚遠(yuǎn),終局前夜該如何探索

如AI創(chuàng)業(yè)一樣,端到端模型走向技術(shù)落地,途中注定要經(jīng)歷寒冬與黑夜。多位業(yè)內(nèi)人士均表示,“ 這還需要很長(zhǎng)一段時(shí)間,短短五到十年內(nèi)很難實(shí)現(xiàn) ”。

從已公布的案例來(lái)看,目前國(guó)內(nèi)針對(duì)高階智駕的端到端模型尚未到達(dá)理想狀態(tài),這體現(xiàn)在其各個(gè)模塊還包含著大量的人工先驗(yàn)。

商湯絕影的交通研發(fā)總監(jiān)武偉對(duì)新智駕表示,“現(xiàn)在的端到端模型中,還包含了用于做檢測(cè)任務(wù)、地圖任務(wù)、做預(yù)測(cè)等不同任務(wù)Transformer,并用Query方式進(jìn)行連接。但人類開(kāi)車時(shí),并不會(huì)先檢測(cè)再跟蹤,繼而做地圖規(guī)劃,最后預(yù)測(cè)這些步驟?!?/p>

這些算法模塊是人為設(shè)計(jì)的,然后被開(kāi)發(fā)者采用串聯(lián)的方式來(lái)實(shí)現(xiàn)端到端。因此,武偉認(rèn)為,也許去除掉人工先驗(yàn)的端到端模型,才是最優(yōu)的方案。

不可否認(rèn)的是,當(dāng)下在感知端,小鵬、理想汽車、蔚來(lái)等車企都采用BEV+Transformer架構(gòu),而在下游規(guī)控環(huán)節(jié)仍使用規(guī)則,這使得國(guó)內(nèi)新勢(shì)力們與特斯拉的端到端方案仍相差不少距離。

這是國(guó)內(nèi)新勢(shì)力車企們要追趕的方向,更是智駕Tier1廠商的機(jī)會(huì)。

有業(yè)者對(duì)新智駕指出,要想更快地突出重圍拿到和車廠合作的機(jī)會(huì),Tier1必須具備數(shù)據(jù)閉環(huán)能力。

這意味著Tier1必須擁有從數(shù)據(jù)采集、挖掘、處理、標(biāo)注、模型訓(xùn)練與優(yōu)化,最終到模型部署這整個(gè)過(guò)程的能力。

這就需要Tier1讓量產(chǎn)車、采集車在路側(cè)實(shí)地采集交通場(chǎng)景,再通過(guò)技術(shù)手段還原成仿真場(chǎng)景,進(jìn)入測(cè)試環(huán)節(jié)用于算法測(cè)試,進(jìn)而更新和升級(jí)量產(chǎn)車。

數(shù)據(jù)閉環(huán)能力對(duì)Tier1來(lái)說(shuō),最直觀的體現(xiàn)是成本端。具體來(lái)看,就是可通過(guò)利用條件觸發(fā)的場(chǎng)景采集、云端自動(dòng)標(biāo)注以及自動(dòng)化仿真測(cè)試等環(huán)節(jié)減少大量人工成本。

云驥智行王庭琛告訴新智駕,端到端模型訓(xùn)練需要的樣本量以及對(duì)于場(chǎng)景豐富度的要求遠(yuǎn)遠(yuǎn)大于模塊化算法系統(tǒng),使用傳統(tǒng)的人工采集標(biāo)注數(shù)據(jù)方式不利于控制成本。

因此,Tier1自研數(shù)據(jù)閉環(huán)系統(tǒng)和云端測(cè)試平臺(tái)能有效降低模型訓(xùn)練支出,更有利于加快對(duì)端到端模型的開(kāi)發(fā)與迭代。

數(shù)據(jù)閉環(huán),只是實(shí)現(xiàn)端到端模型落地的技術(shù)環(huán)節(jié)之一。端到端模型要從demo走向量產(chǎn)落地,那還需要經(jīng)歷不斷的技術(shù)迭代階段。

以UniAD方案為例,端到端走向量產(chǎn),需要在任務(wù)適配和數(shù)據(jù)采集方面下“功夫”。

首先,在任務(wù)適配上,端到端模型需要適配到現(xiàn)有智能駕駛落地的狀態(tài),比如與現(xiàn)在智能駕駛基于行泊一體、城市無(wú)圖、城區(qū)領(lǐng)航輔助等技術(shù)方案適配。

如果端到端模型上車,則整個(gè)setting(設(shè)置)都需要做出改變,如車道保持、定速巡航等功能的實(shí)現(xiàn)都需要以某個(gè)固定速度或者某個(gè)導(dǎo)航目標(biāo)任務(wù)設(shè)為前提,作為條件輸入。

比如原始的UniAD框架就是一個(gè)局部的高階智能駕駛方案,每一步都會(huì)給出一個(gè)行駛路線的信息,如加減速、轉(zhuǎn)向等數(shù)值指令,但由于這是局部的智能駕駛方案,如果人類司機(jī)不給它輸入信號(hào)并規(guī)劃路線,它就會(huì)一直進(jìn)行車道保持的智能駕駛。

“而當(dāng)UniAD方案真正與量產(chǎn)產(chǎn)品適配時(shí),則需增加算法處理模塊,以接收和融合更多人類或車機(jī)系統(tǒng)的條件信息輸入。例如指令變道時(shí)的撥桿指令、導(dǎo)航地圖的路徑規(guī)劃指向等,定速巡航時(shí)的定速目標(biāo)等?!蔽鋫パa(bǔ)充說(shuō)道。

從這個(gè)角度看,當(dāng)下的UniAD和量產(chǎn)落地的方案相比,兩者在問(wèn)題的設(shè)定上存在一定差異,因此,武偉認(rèn)為,在算法方案上,研發(fā)人員需要重新訓(xùn)練該模型。

其次,數(shù)據(jù)采集方面,端到端模型這一環(huán)節(jié)非常復(fù)雜。

以UniAD為例,武偉透露,從感知、規(guī)控再到地圖,這三個(gè)環(huán)節(jié)數(shù)據(jù)采集的結(jié)果,整體都要實(shí)現(xiàn)匹配,這就對(duì)各玩家數(shù)據(jù)采集真值處理的精度、靜態(tài)和動(dòng)態(tài)物體的匹配、時(shí)間戳與位置的對(duì)齊等都提出了很高的要求。

“這整個(gè)過(guò)程中也存在很多‘坑’,研發(fā)人員需要持續(xù)去解決,并建立一個(gè)數(shù)據(jù)壁壘?;诤A康臄?shù)據(jù)積累,中間的網(wǎng)絡(luò)才能適用得更好。”武偉解釋道。

因此,從任務(wù)設(shè)定到數(shù)據(jù)采集,都是端到端模型在研發(fā)過(guò)程中需要不斷提升的。

這是一個(gè)循序漸進(jìn)的過(guò)程。

毫末智行技術(shù)總監(jiān)潘興提出了一個(gè)解決思路,“首先,某些場(chǎng)景條件下,若當(dāng)前使用的方法在算法或應(yīng)用層面已取得較好的效果,我們可繼續(xù)擴(kuò)大場(chǎng)景范圍,或準(zhǔn)備更多數(shù)據(jù)。

盡管在做完這兩步工作后依然會(huì)遇到新的問(wèn)題,但可進(jìn)而再解決問(wèn)題,直到在新的場(chǎng)景范圍內(nèi)取得更理想的效果,這是長(zhǎng)期持續(xù)且相互迭代的過(guò)程。”(端到端模型部署上車還有哪些新的“解題思路”,歡迎添加作者微信lujiepinga交流)

完全端到端上車,尚需時(shí)日

顯然,抵達(dá)完全的端到端上車,需要漫長(zhǎng)的試錯(cuò)時(shí)間。

在這期間,端到端模型的發(fā)展會(huì)經(jīng)歷一些過(guò)渡階段。正如王庭琛向新智駕說(shuō)道,“由于龐大的網(wǎng)絡(luò)架構(gòu)對(duì)于低算力芯片及小規(guī)模數(shù)據(jù)集并不友好,采用部分端到端的方案或許是當(dāng)下折中的架構(gòu)策略?!?/p>

折中的方案,同時(shí)還帶來(lái)了性價(jià)比優(yōu)勢(shì),這體現(xiàn)在算力消耗與部署可實(shí)現(xiàn)程度上。

王庭琛表示,使用同一個(gè)模型來(lái)完成目標(biāo)檢測(cè)跟蹤與軌跡預(yù)測(cè),這種綁定了感知和預(yù)測(cè)模塊的方案,反而不會(huì)增加更多的算力消耗,且能提升目標(biāo)軌跡預(yù)測(cè)精度。

如今不少?gòu)S商都在端到端模型做創(chuàng)新的嘗試。在2024年CES上,Mobileye創(chuàng)始人Amnon Shashua就傳達(dá)了Mobileye對(duì)端到端模型新的理解及相關(guān)方法論。

Amnon Shashua表示,端到端系統(tǒng)可分為兩類版本。

第一種是輸入圖像,輸出的是對(duì)車輛的控制結(jié)果,它僅僅是一個(gè)單體引擎或者一個(gè)深度網(wǎng)絡(luò),它接收?qǐng)D像并輸出轉(zhuǎn)向和制動(dòng)控制指令——這屬于完全端到端系統(tǒng)。

而第二種端到端系統(tǒng)則只負(fù)責(zé)感知。

這兩種版本都存在不同的優(yōu)缺點(diǎn)。

完全端到端系統(tǒng)的問(wèn)題在于缺乏透明度,我們不知道系統(tǒng)在做決策時(shí)到底在做什么。其次,我們沒(méi)有控制能力。第三點(diǎn)是平均故障間隔時(shí)間難以把握。

來(lái)看另一個(gè)端到端系統(tǒng)版本,它只和感知有關(guān)。由于駕駛策略和控制車輛這兩部分是人為可干預(yù)的,因此人類就把握了透明度和控制能力,但依然會(huì)存在一個(gè)問(wèn)題——如何讓感知算法堆棧能達(dá)到很高的 MTBF(平均故障間隔時(shí)間)要求。

針對(duì)這個(gè)問(wèn)題,Mobileye提出達(dá)到高M(jìn)TBF的方法是,將端到端系統(tǒng)作為一個(gè)包含許多組件的系統(tǒng)當(dāng)中的一個(gè)組件,各個(gè)組件互為冗余。

Amnon Shashua還表示,端到端解決方案包括可分解的方案,以及端到端系統(tǒng)方案。

其中可分解方案的優(yōu)勢(shì)在于其特別擅長(zhǎng)處理邊緣場(chǎng)景,而端到端系統(tǒng)方案則有利于提高舒適度,因?yàn)樗鼮閳?chǎng)景內(nèi)所有物體創(chuàng)造了一致性,盡管它不擅長(zhǎng)邊緣場(chǎng)景的處理。

因此,從國(guó)內(nèi)車企與Tier1的現(xiàn)狀出發(fā),在缺乏如特斯拉或Waymo那個(gè)級(jí)別的數(shù)據(jù)驅(qū)動(dòng)的情況下,在主流架構(gòu)下逐漸合并內(nèi)部單元,進(jìn)行部分端到端模型的部署,或許是更具有性價(jià)比的一種嘗試。

與此相似的路線,是使用各種各樣小的、級(jí)聯(lián)的端到端模型去替換已有的功能模塊。通過(guò)這種途徑,Tier1和車企推動(dòng)級(jí)聯(lián)的端到端方案逐步進(jìn)化到完整端到端模型,并實(shí)現(xiàn)上車,這成為一種必然趨勢(shì)。

孫琪向新智駕舉了一個(gè)例子,“感知、定位、預(yù)測(cè)、規(guī)劃、決策、控制等模塊都會(huì)被拆分為很多小的模塊,并把這些小模塊變得神經(jīng)網(wǎng)絡(luò)化。盡管早期是級(jí)聯(lián)的端到端的神經(jīng)網(wǎng)絡(luò),但能慢慢過(guò)渡到最終一體化的端到端網(wǎng)絡(luò),以逐步實(shí)現(xiàn)端到端模型落地?!?/p>

獲得解題思路之后,那么,“我們應(yīng)該如何去評(píng)估一套好的端到端模型?”這是目前整個(gè)智能駕駛行業(yè)內(nèi),不管是車企還是Tier1都在試圖探索的問(wèn)題。

王庭琛向新智駕表示,他認(rèn)為,端到端模型上車最終的評(píng)估指標(biāo),還是要以閉環(huán)仿真為主。

閉環(huán)仿真,簡(jiǎn)單而言,就是在planning規(guī)劃環(huán)節(jié)中,端到端模型能規(guī)劃出一條車行駛軌跡,而這條軌跡會(huì)對(duì)同個(gè)場(chǎng)景里其他車輛的行駛造成影響,該規(guī)劃結(jié)果的好壞,最終會(huì)直接影響整個(gè)場(chǎng)景里的行駛體驗(yàn)。

結(jié)語(yǔ)

縱觀智能駕駛行業(yè),降低成本與提升用戶體驗(yàn),成為車企與Tier1追求的長(zhǎng)期目標(biāo)。

端到端模型上車能否降低智駕成本以及上車后的潛力有多大,其核心是未來(lái)客戶對(duì)智駕體驗(yàn)的預(yù)期。

不妨從不同場(chǎng)景出發(fā)來(lái)討論。

若客戶只追求在高速公路上一路向前駕駛,端到端模型上車與如今的智駕方案并不會(huì)產(chǎn)生本質(zhì)的區(qū)別。如果客戶的預(yù)期是在城市復(fù)雜路況下駕駛,端到端模型上車能帶來(lái)安全、更接近人類駕駛的智駕體驗(yàn),那面向更高階的智駕功能,未來(lái)端到端模型上車所發(fā)揮的潛力會(huì)更大。

目前,端到端模型訓(xùn)練需要高價(jià)的研發(fā)成本,包括大量的GPU設(shè)備、大規(guī)模多層次的數(shù)據(jù)標(biāo)注、大算力端側(cè)計(jì)算平臺(tái)等,都給企業(yè)帶來(lái)巨額成本。

端到端模型的優(yōu)勢(shì),則在于其能夠?yàn)橹邱{方案帶來(lái)系統(tǒng)架構(gòu)層面的提升。

因此,當(dāng)未來(lái)端到端模型在業(yè)內(nèi)實(shí)現(xiàn)量產(chǎn)并被廣泛使用時(shí),其配套訓(xùn)練和部署的成本也將有望被控制在車企與消費(fèi)者可接受的范圍,從而在提升智駕體驗(yàn)的同時(shí),把降本落到實(shí)處。

此時(shí)此刻,對(duì)于高階智駕,車企與Tier1都踏上了追求安全、更接近人類駕駛體驗(yàn)的征途。

而如今涌現(xiàn)的端到端模型,更像一條黑夜中新的路線,一種新的解題思路,端到端模型上車有望給用戶帶來(lái)的安全、高階智駕體驗(yàn),或成為車企爭(zhēng)先抵達(dá)的彼岸。

(應(yīng)受訪者要求,宋文為化名。)

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))#雷峰網(wǎng)#雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

vx: lujiepinga,歡迎多多交流
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)