丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
智能駕駛 正文
發(fā)私信給虞超
發(fā)送

0

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

本文作者: 虞超 2024-03-27 11:25
導(dǎo)語(yǔ):面對(duì)FSD V12的來(lái)勢(shì)洶洶,國(guó)內(nèi)端到端模型也將在今年“亮劍”。

2024年伊始,特斯拉FSD V12正式開(kāi)始推送。對(duì)于廣大國(guó)內(nèi)智駕企業(yè)來(lái)說(shuō),這或許意味著一次“暴擊”。

自特斯拉的FSD V12問(wèn)世以來(lái),有許多的業(yè)者和投資人對(duì)其贊譽(yù)有加。一位來(lái)自某國(guó)際金融機(jī)構(gòu)的工作人員甚至對(duì)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))《新智駕》表示,如若FSD能夠入華,對(duì)于國(guó)內(nèi)智駕企業(yè)而言,不是簡(jiǎn)單的“掀起新一輪智能化浪潮”,而是對(duì)國(guó)內(nèi)高新技術(shù)企業(yè)投下了一枚大殺器,將造成后果難以估量的毀滅性打擊。

在他看來(lái),特斯拉是以國(guó)別來(lái)開(kāi)啟智駕的使用范圍,不像國(guó)內(nèi)是以城市或者里程數(shù)來(lái)“開(kāi)城”。他表示,特斯拉FSD的開(kāi)放范圍,如果換算成實(shí)際的里程數(shù)和覆蓋面積,各方面都是遠(yuǎn)高于國(guó)內(nèi),但很多國(guó)內(nèi)同行對(duì)此還沒(méi)有引起足夠的重視。

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

就上述觀點(diǎn),雷峰網(wǎng)《新智駕》與國(guó)內(nèi)某智駕公司的技術(shù)人員進(jìn)行了交流。該工作人員表示,F(xiàn)SD的性能相當(dāng)強(qiáng)悍,現(xiàn)階段國(guó)內(nèi)消費(fèi)市場(chǎng)能與之PK的,只有“那家”通訊技術(shù)出身的大廠。

他認(rèn)為,基于目前公開(kāi)的資料來(lái)看,F(xiàn)SD V12強(qiáng)大的關(guān)鍵,在于使用了端到端技術(shù)。

更接近人類的駕駛方式

眾所周知,傳統(tǒng)自動(dòng)駕駛方案通常采用模塊化的方法,分為感知、預(yù)測(cè)、規(guī)劃和控制等不同的子系統(tǒng)。每個(gè)子系統(tǒng)完成特定的任務(wù),然后將結(jié)果傳遞給下一個(gè)模塊,最終形成駕駛操作方案。

而端到端自動(dòng)駕駛方案則采用一種統(tǒng)一的架構(gòu),直接將傳感器輸入數(shù)據(jù)映射到駕駛控制信號(hào)上。這種方法不需要單獨(dú)的感知、預(yù)測(cè)和規(guī)劃模塊,而是通過(guò)一個(gè)單一的神經(jīng)網(wǎng)絡(luò)來(lái)處理所有的任務(wù),其優(yōu)勢(shì)在于能夠進(jìn)行聯(lián)合特征優(yōu)化,提高計(jì)算效率,并且有潛力通過(guò)擴(kuò)展訓(xùn)練資源來(lái)改進(jìn)系統(tǒng)的性能。

簡(jiǎn)而言之,傳統(tǒng)方案強(qiáng)調(diào)模塊間的明確分工和順序處理,端到端方案則側(cè)重于通過(guò)深度學(xué)習(xí)方法,實(shí)現(xiàn)直接從感知到控制的轉(zhuǎn)換。由于它模仿了人類如何直接從視覺(jué)輸入中做出駕駛決策這一過(guò)程,也被認(rèn)為是更接近人類的駕駛方式。

一位高級(jí)感知算法工程師告訴新智駕,目前的端到端模型,從技術(shù)層面上大致有三種分類:

第一種是輕模塊化級(jí)聯(lián)方案,將原本利用規(guī)則和經(jīng)驗(yàn)構(gòu)造的算法代碼用設(shè)計(jì)好的神經(jīng)網(wǎng)絡(luò)來(lái)代替,保證下游網(wǎng)絡(luò)結(jié)構(gòu)也能提取到原始信息。

第二種方案則是借助近期快速爆發(fā)的大語(yǔ)言模型,利用大語(yǔ)言模型出色的涌現(xiàn)能力和推理能力,將網(wǎng)絡(luò)級(jí)別的知識(shí)遷移到自動(dòng)駕駛系統(tǒng)中,使其同時(shí)具備場(chǎng)景理解和解決實(shí)時(shí)駕駛問(wèn)題的能力,例如商湯。

第三種,則較為激進(jìn),類似特斯拉這樣,利用海量傳感器和用戶行車(chē)數(shù)據(jù),忽略中間過(guò)程,直接監(jiān)督最終控制信號(hào)的真正的端到端大模型。

FSD V12的跑火,讓“端到端”成為智駕圈的熱詞。同時(shí),也為國(guó)內(nèi)智駕行業(yè)染上了一絲悲觀情緒:

有業(yè)者向新智駕表示,國(guó)內(nèi)智駕行業(yè)的發(fā)展速度,相比全球最頂尖的技術(shù),滯后了一年左右。他表示,很多國(guó)內(nèi)公司對(duì)于國(guó)外的頂尖技術(shù)亦步亦趨,原創(chuàng)性不足,因此有一定的滯后性,而這一特性在端到端技術(shù)出現(xiàn)時(shí)較為明顯。

用端到端扳回一城

對(duì)于端到端技術(shù),國(guó)內(nèi)依舊有具備敏銳技術(shù)嗅覺(jué)的企業(yè),例如元戎啟行。

據(jù)新智駕了解,早在23年初,元戎啟行就和英偉達(dá)高層交流并展示了自己的端到端計(jì)劃。并且,元戎的端到端模型今年就會(huì)在消費(fèi)市場(chǎng)落地。

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

在元戎啟行CEO周光看來(lái),端到端能夠以一種很好的、AI Driven的方式,去打造更具智慧、可靠的智能駕駛汽車(chē)。只不過(guò)有AI背景的他,更早察覺(jué)到了這一點(diǎn)。

他說(shuō),傳統(tǒng)的模塊化模型是基于規(guī)則的,本質(zhì)上是由人通過(guò)不斷敲代碼制定規(guī)則的方式,讓智駕系統(tǒng)來(lái)駕駛,因此駕駛動(dòng)作的“機(jī)械感"很強(qiáng),但實(shí)際的道路狀況千變?nèi)f化,規(guī)則無(wú)法全部解決。

端到端模型則不一樣,它鍛煉的是系統(tǒng)的自主學(xué)習(xí)、變通的能力,對(duì)駕駛環(huán)境全場(chǎng)景的理解能力更強(qiáng)。

周光舉了兩個(gè)例子:

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

比如,搭載端到端模型的車(chē)會(huì)顧慮后車(chē)需求,在停車(chē)的狀態(tài)下,可以“看到”后車(chē)打轉(zhuǎn)向燈,主動(dòng)禮讓后車(chē)右轉(zhuǎn),而傳統(tǒng)的模塊化模型沒(méi)有辦法這么”人性化”。

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

再比如,壓實(shí)線的規(guī)則在不同城市的執(zhí)行方式是不一樣的,有一些城市或一些路段非常嚴(yán)格,必須嚴(yán)格遵守。但有一些城市的路邊會(huì)有很多違停車(chē)輛,或者道路施工,所以車(chē)輛不得不壓點(diǎn)實(shí)線,借個(gè)道才能通過(guò)。如果單純基于規(guī)則,那車(chē)輛到底該不該壓實(shí)線?這很難回答。

遇到這樣的情形,端到端模型則更能體現(xiàn)優(yōu)勢(shì):它的全場(chǎng)景理解能力更強(qiáng),會(huì)根據(jù)當(dāng)?shù)厝说鸟{駛風(fēng)格以及實(shí)時(shí)路況來(lái)做決策。

而且在效率方面,模塊化模型也存在一定的劣勢(shì)。

周光表示,傳統(tǒng)模塊化模型的信息傳遞,需要經(jīng)過(guò)不同模塊,而模塊間存在gap,造成信息減損,帶來(lái)安全隱患。

出現(xiàn)問(wèn)題時(shí),模塊化模型也需要工程師手動(dòng)處理case。一位熟練工程師一天只能處理10多個(gè)case,而技術(shù)水平略低的工程師,能夠處理的case則更少。這意味著數(shù)據(jù)越多,處理起來(lái)越棘手,效率也更低,只能不斷增添人手。

假如這種情況發(fā)生在某款已經(jīng)量產(chǎn)的車(chē)型上,那么后果會(huì)很?chē)?yán)重。

與之相反,端到端模型則是數(shù)據(jù)越多越聰明。

依據(jù)OpenAI已經(jīng)驗(yàn)證過(guò)的Scaling Law(比例定律),在數(shù)據(jù)集規(guī)模以及計(jì)算資源不斷增長(zhǎng)的情況下,模型的性能將會(huì)單調(diào)提升。因此只需要給滿足Scaling Law的端到端模型,“投喂”大量人類老司機(jī)的駕駛數(shù)據(jù),它就能學(xué)習(xí)到駕駛方法。

“Tech Vision”,AI公司的命脈

周光認(rèn)為,之所以準(zhǔn)確判斷出端到端技術(shù)的重要性,源于自己的Tech Vision。

他說(shuō),Tech Vision是AI公司的命脈,其核心是要對(duì)技術(shù)有準(zhǔn)確的預(yù)判,以及具備終局思維。一家公司不應(yīng)該耗費(fèi)精力去做一些過(guò)分雕花的事情,卻沒(méi)能解決用戶真正的痛點(diǎn)。

憑借這種敏銳的技術(shù)嗅覺(jué),早在2017年,周光就意識(shí)到了前融合的重要性,雖然當(dāng)時(shí)很多企業(yè)還在做后融合,但周光堅(jiān)持進(jìn)行了前融合的技術(shù)規(guī)劃。如今看來(lái),這一舉措讓元戎啟行在all in端到端時(shí),避免了“大象轉(zhuǎn)身”般的窘迫。

但在真正打造端到端模型的時(shí)候,周光還是選擇了循序漸進(jìn)的方式。他將這一過(guò)程,總結(jié)為“三步走”:

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

第一步,將后融合感知技術(shù),變成了多傳感器前融合感知技術(shù),把多個(gè)傳感器感知的數(shù)據(jù)放到一個(gè)神經(jīng)網(wǎng)絡(luò)里。

在物體檢測(cè)層面,元戎用 AI 的能力把全場(chǎng)景感知的能力建立起來(lái),讓感知的準(zhǔn)確率、魯棒性大大提升。

第二步,讓系統(tǒng)擺脫了對(duì)高精度地圖的依賴,讓模型可以進(jìn)一步感知道路拓?fù)浣Y(jié)構(gòu),讓預(yù)測(cè)和規(guī)劃由規(guī)則驅(qū)動(dòng)變成了數(shù)據(jù)驅(qū)動(dòng)。

第三步,是推出端到端模型,將感知、預(yù)測(cè)、規(guī)劃三個(gè)模型一體化。

周光稱,可以將這一模型理解為,原本三個(gè)獨(dú)立模塊,現(xiàn)在被直接相連,看到不同的路況都能做出相應(yīng)的駕駛反應(yīng),“所見(jiàn)即所得”。

他表示,這其中跨出的每一步,都是一次重要的技術(shù)突破。由于堅(jiān)持技術(shù)原創(chuàng),所以在研發(fā)時(shí)面臨很多不確定性,也被質(zhì)疑過(guò)。但他強(qiáng)調(diào),AI 2.0 的時(shí)代已然來(lái)臨,競(jìng)爭(zhēng)只會(huì)更加激烈,走在行業(yè)前列的公司幾乎都會(huì)選擇閉源,這是必須認(rèn)清的現(xiàn)實(shí)。


上車(chē),新一輪的挑戰(zhàn)

元戎啟行對(duì)技術(shù)的執(zhí)念,使其成為國(guó)內(nèi)最早能夠?qū)⒍说蕉四P蛻?yīng)用到車(chē)端的企業(yè)。

此時(shí),行業(yè)內(nèi)同樣有質(zhì)疑的聲音,認(rèn)為國(guó)內(nèi)公司現(xiàn)階段談端到端上車(chē)還不太成熟,尤其是基礎(chǔ)建設(shè)和數(shù)據(jù)方面的儲(chǔ)備都不夠。

對(duì)此,周光表示,打造端到端模型的核心因素有三個(gè):模型、算力和數(shù)據(jù)。

進(jìn)擊的“端到端”,與迎頭趕上的中國(guó)企業(yè)

端到端模型,元戎已經(jīng)打造好了;算力方面,元戎和英偉達(dá)有深度技術(shù)合作,元戎的大股東阿里也會(huì)提供支持;數(shù)據(jù)層面,元戎和多家車(chē)企有了量產(chǎn)合作,客戶為元戎提供了很多真實(shí)的、脫敏后的行車(chē)數(shù)據(jù),而且涵蓋的場(chǎng)景很全面,足夠訓(xùn)練模型,可謂是萬(wàn)事俱備。

同時(shí),各家主機(jī)廠對(duì)于端到端方案的上車(chē),態(tài)度也非常積極。

周光稱,當(dāng)下高速路段的智能駕駛,各家已經(jīng)做得比較成熟。相反,城區(qū)才是真正的戰(zhàn)場(chǎng),可以說(shuō)得城區(qū)者得“天下”。但城區(qū)的路況非常復(fù)雜,也存在很多長(zhǎng)尾場(chǎng)景。

所以,周光認(rèn)為城區(qū)的智能駕駛還沒(méi)有跨越早期市場(chǎng)與成熟市場(chǎng)的鴻溝,消費(fèi)者對(duì)城區(qū)NOA沒(méi)有產(chǎn)生依賴。鑒于此,主機(jī)廠非常期望能找到一個(gè)厲害的技術(shù)伙伴,幫他們做好城區(qū)NOA體驗(yàn),而元戎提供的端到端模型正好符合他們的需求。

據(jù)周光介紹,目前主機(jī)廠對(duì)于端到端方案,有以下幾個(gè)關(guān)注點(diǎn):

第一,系統(tǒng)是否能夠在復(fù)雜路段流暢行駛,保證舒適的體感。

第二,全場(chǎng)景的理解能力強(qiáng)不強(qiáng),能否有一些類人的決策。譬如,會(huì)顧慮后車(chē)需求,在停車(chē)的狀態(tài)下,“看到”后車(chē)打轉(zhuǎn)向燈,主動(dòng)禮讓后車(chē)右轉(zhuǎn)。

第三,安全層面的兜底策略是否可靠。

第四,后期OTA的天花板高不高,是否能新增一些讓人驚艷的功能。例如,雨天車(chē)輛在靠近人行道的車(chē)道行駛時(shí),遇到積水會(huì)主動(dòng)減速,避免把水濺到行人身上。

周光說(shuō),以上所述的幾點(diǎn)核心需求,元戎都能滿足。

然而,順利上車(chē)只是第一步。有多位行業(yè)人士向新智駕表示,更大的挑戰(zhàn)其實(shí)在于工程化。

周光也承認(rèn),工程化能力是一項(xiàng)很大的挑戰(zhàn),需要去遵循汽車(chē)工業(yè)的整套車(chē)規(guī)標(biāo)準(zhǔn),精細(xì)地拆解、解讀標(biāo)準(zhǔn),再把這些標(biāo)準(zhǔn)融合到整個(gè)研發(fā)流程中,實(shí)現(xiàn)工程化的轉(zhuǎn)變。

不過(guò)同時(shí)他也表示,元戎的研發(fā)同事都期望能夠推動(dòng)產(chǎn)品更好更快地落地,促進(jìn)形成技術(shù)閉環(huán),所以大家都有很大的決心去迅速補(bǔ)齊工程化能力,讓搭載元戎方案的量產(chǎn)車(chē)在今年順利落地。

結(jié)語(yǔ):

對(duì)于很多科技企業(yè)而言,搭載了端到端模型的特斯拉,屬實(shí)是個(gè)實(shí)力強(qiáng)勁的對(duì)手。但換個(gè)角度來(lái)看,F(xiàn)SD雖然在美國(guó)和加拿大都已經(jīng)開(kāi)通,可眾所周知,兩國(guó)的人口密度都相對(duì)較低,城市規(guī)劃也和許多國(guó)家或地區(qū)不同。如果換成中國(guó)的北上廣深、日本的東京、韓國(guó)的首爾這種人口更為密集,路況更為復(fù)雜的城市,F(xiàn)SD又會(huì)有怎樣的表現(xiàn)呢?鹿死誰(shuí)手,或許猶未可知。

同時(shí),端到端模型實(shí)際上也具備著相當(dāng)強(qiáng)的技術(shù)復(fù)用能力,智能駕駛是重要的應(yīng)用場(chǎng)景之一,但同時(shí)也是最能擊穿“次元壁”的應(yīng)用場(chǎng)景,它就像阿基米德口中的那個(gè)支點(diǎn),能夠撬動(dòng)一個(gè)全新的世界,一如借助于手機(jī)這個(gè)“支點(diǎn)”而被撬動(dòng)的物聯(lián)網(wǎng)世界。假以時(shí)日,通過(guò)智能駕駛而不斷完善的端到端模型,將會(huì)賦能于更多的場(chǎng)景。

比如,包括周光在內(nèi),許多人心心念念的人形機(jī)器人。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)