0
自動(dòng)駕駛?cè)φ弧叭ジ呔貓D”風(fēng)暴席卷。
今年6月中旬,一年一度的AI頂會(huì) CVPR 2023 在加拿大舉行,同期還有場(chǎng)自動(dòng)駕駛國(guó)際挑戰(zhàn)賽,這場(chǎng)挑戰(zhàn)賽吸引了來(lái)自15個(gè)國(guó)家的270多支隊(duì)伍參賽,有2300多件作品投稿,賽況激烈。
出人意料地,打敗眾競(jìng)爭(zhēng)對(duì)手,摘下桂冠的,是一家此前從未向外公布過(guò)有自動(dòng)駕駛業(yè)務(wù)的中國(guó)AI公司——曠視科技。
曠視在這屆自動(dòng)駕駛國(guó)際挑戰(zhàn)賽的表現(xiàn)相當(dāng)亮眼。
CVPR 2023自動(dòng)駕駛國(guó)際挑戰(zhàn)賽分為四個(gè)賽道,包括OpenLane拓?fù)潢P(guān)系賽道、Online HD Map Construction(在線高精地圖構(gòu)建)等賽道,其中拓?fù)潢P(guān)系賽道的第一名為曠視。
“OpenLane拓?fù)潢P(guān)系挑戰(zhàn)賽,本質(zhì)上是一個(gè)通過(guò)實(shí)時(shí)感知來(lái)生成地圖的比賽。目前大家對(duì)道路拓?fù)浣Y(jié)構(gòu)(如車道線、車速標(biāo)識(shí)等)的感知,主要是靠高精地圖來(lái)提供,而要去高精地圖的話,那就只能把這些東西感知之后,再構(gòu)建自己的道路拓?fù)浣Y(jié)構(gòu)?!?/p>
曠視科技智駕業(yè)務(wù)總裁劉偉對(duì)雷峰網(wǎng)解釋說(shuō),“這個(gè)比賽的現(xiàn)實(shí)意義在于,可以讓曠視在‘去高精地圖’這條路上越走越扎實(shí),最終在城區(qū)也能實(shí)現(xiàn)‘去高精地圖’?!?/p>
憑借在這一賽事上的出色表現(xiàn),一向“神秘”的曠視自動(dòng)駕駛業(yè)務(wù)逐漸浮出水面。
從學(xué)術(shù)圈到產(chǎn)業(yè)界,曠視下場(chǎng)參與自動(dòng)駕駛賽道競(jìng)賽并不讓人意外,反倒是時(shí)至今日才宣布入局更令人疑惑。
曠視為什么選擇在此時(shí)進(jìn)軍自動(dòng)駕駛市場(chǎng)?曠視做自動(dòng)駕駛業(yè)務(wù)的底層邏輯是什么?其方案有哪些獨(dú)特性?競(jìng)爭(zhēng)優(yōu)勢(shì)體現(xiàn)在哪里?
雷峰網(wǎng)和曠視科技智駕業(yè)務(wù)總裁劉偉聊了聊。
從2021年初大力研發(fā)智駕方案到宣布推出量產(chǎn)方案,曠視用時(shí)不到三年。
廢話不多說(shuō),我們直接看看產(chǎn)品。簡(jiǎn)單來(lái)說(shuō),曠視的產(chǎn)品分為三個(gè)配置:標(biāo)準(zhǔn)版、專業(yè)版、旗艦版,分別對(duì)應(yīng)10-15萬(wàn)元車型、15-30萬(wàn)元車型和30萬(wàn)元車型。
其中標(biāo)準(zhǔn)版方案具備高速NOP功能,專業(yè)版方案具有城市NOP功能,最高配置的旗艦版方案則具備增強(qiáng)的城市NOP功能以及更強(qiáng)的安全冗余。
當(dāng)下曠視智駕業(yè)務(wù)的發(fā)力點(diǎn)則主要在標(biāo)準(zhǔn)版和專業(yè)版方案。
“我們瞄準(zhǔn)的是量產(chǎn)市場(chǎng),曠視希望做到在中低價(jià)位車型中達(dá)到一年幾百萬(wàn)輛的銷量,這兩個(gè)版本的方案都是不帶激光雷達(dá)的,成本相對(duì)較低,可以服務(wù)于10萬(wàn)-30萬(wàn)元的車型。”劉偉表示。
在車端,15萬(wàn)元-30萬(wàn)元價(jià)位是主戰(zhàn)場(chǎng),近一兩年這一市場(chǎng)正瘋狂進(jìn)入激進(jìn)價(jià)格內(nèi)卷戰(zhàn),”活下去“——成為眾多車企的第一要義。
小鵬汽車就曾在今年年初的年報(bào)業(yè)績(jī)會(huì)上預(yù)測(cè),國(guó)內(nèi)市場(chǎng)到2023年大概只有50家乘用車品牌能走完,5年后可能只有25家,10 年后可能只有數(shù)家,“接下來(lái)的5 -10 年里,控制好成本以及創(chuàng)新做到第一的位置才能存活”。
定位為智駕方案供應(yīng)商的曠視,降本、降本、再降本,也自然而然成為其自研方案時(shí)的重中之重。
劉偉透露,通過(guò)優(yōu)化“BEV(鳥瞰圖)+前融合”算法、降低算力、去高精地圖、去RTK、去激光雷達(dá)、統(tǒng)一算法框架、自動(dòng)標(biāo)注等一系列措施,相比于同行,曠視的智駕方案成本可以下降20%-30%。
提到“BEV”算法,目前業(yè)內(nèi)的智駕方案大多需配置Orin大算力芯片,但這在實(shí)際上車量產(chǎn)落地時(shí)并不容易。
比如原先一些走L4自動(dòng)駕駛技術(shù)路線的企業(yè)嘗試推出L2+量產(chǎn)方案時(shí),由于以往的路線是多傳感器疊加配置大算力芯片,因此他們普遍面臨的一大挑戰(zhàn),就是很難滿足車廠的低算力要求。
而曠視對(duì)于BEV的實(shí)現(xiàn),則已經(jīng)可以做到在只有Orin芯片五分之一甚至六分之一算力的嵌入式芯片上跑通,不僅性能表現(xiàn)非常好,而且目前已經(jīng)進(jìn)入到客戶實(shí)車Demo階段。
劉偉認(rèn)為,從本質(zhì)上看,這是由于曠視的算法本身足夠先進(jìn)。
曠視對(duì)BEV有兩個(gè)實(shí)現(xiàn)的算法模型,一個(gè)是BEVDepth系列,一個(gè)是PETR系列,BEVDepth系列是對(duì)“BEV+LSS”的實(shí)現(xiàn),PETR系列則是非常典型對(duì)“BEV+Transformer”的實(shí)現(xiàn)。
BEV+Transformer架構(gòu)最早由特斯拉在2020年引入自動(dòng)駕駛產(chǎn)業(yè)界。
不過(guò)不同于特斯拉占用網(wǎng)絡(luò)采用的稠密算法,曠視的PETR系列在輸出對(duì)周圍環(huán)境的各種感知表征時(shí),采用的是稀疏算法。
“曠視用稀疏的方式來(lái)做Transformer,也能非常好地檢測(cè)到長(zhǎng)尾場(chǎng)景中的障礙物,同時(shí)對(duì)算力要求更低,這最核心的意義就是把計(jì)算平臺(tái)的成本給降下來(lái)了?!眲ケ硎?。
另一方面,為了降本,曠視還對(duì)“統(tǒng)一算法框架”這件事非常重視,整個(gè)研發(fā)均圍繞這個(gè)目標(biāo)展開(kāi)。
一般而言,從旗艦車型到入門級(jí)車型,一家主機(jī)廠每種車型采用的配置方案都各不相同,供應(yīng)商方案矩陣相當(dāng)復(fù)雜,這導(dǎo)致車輛在推出量產(chǎn)時(shí),無(wú)論是把握節(jié)奏、質(zhì)量、成本,還是管理和維護(hù)不同供應(yīng)商,都很難控制。
而曠視在做的,則是希望在高中低定位的車型,都采用統(tǒng)一的BEV算法框架,做到算法平臺(tái)化、硬件平臺(tái)化。
比如在適配高中低不同算力的芯片時(shí),曠視采用Pin-to-Pin的系列芯片,即同一套域控可以直接適配不同芯片硬件,如果域控需要適配高算力芯片,就換高算力芯片,如果要適配低算力芯片,就換一個(gè)低算力的芯片。
做到這一點(diǎn)后,主機(jī)廠各個(gè)車型的量產(chǎn)速度將大大加快,質(zhì)量更好的同時(shí),成本也將大幅降低。
在硬件配置方面,曠視則堅(jiān)持走以視覺(jué)為主的感知路徑,支持采用實(shí)時(shí)建圖的感知方式,只用導(dǎo)航地圖,不用高精地圖,除此之外,曠視還能做到直接去掉RTK。
“'去高精地圖’、‘去RTK’,這兩個(gè)選擇結(jié)合在一起,每年又能節(jié)省幾百元的成本費(fèi)用?!眲フf(shuō)。
智駕方案上車,降本是一方面,性能是否能做到讓車廠、讓消費(fèi)者買單又是另一方面。
當(dāng)下的智能汽車行業(yè),諸如AEB等L2級(jí)以下智駕功能已基本標(biāo)配,現(xiàn)在各頭部車廠、供應(yīng)商們爭(zhēng)相落地的重點(diǎn)功能,是介于L2與L3級(jí)自動(dòng)駕駛之間的NOP功能。
所謂NOP功能,即車輛可基于用戶設(shè)定的導(dǎo)航路線,實(shí)現(xiàn)從A點(diǎn)到B點(diǎn)的智能導(dǎo)航輔助駕駛,主要覆蓋部分高速公路和部分復(fù)雜的城市路況。
在曠視看來(lái),在接下來(lái)兩三年的時(shí)間,高速NOP場(chǎng)景將會(huì)快速滲透,大多數(shù)主流車型,都將采用高速NOP方案,同時(shí)城市NOP場(chǎng)景將在這一時(shí)期快速成熟。
而阻礙NOP高階智駕方案大規(guī)模量產(chǎn)落地的核心因素,就在于目前尚不夠強(qiáng)大的智駕性能,第二重要因素則是居高不下的成本。
“目前的高階智駕方案還沒(méi)有足夠好到、安全到能讓用戶完全放心地使用,為了追求更好的性能,大家的方案都是配置多顆Orin X、多個(gè)激光雷達(dá),這導(dǎo)致方案成本會(huì)非常高,往往高達(dá)幾萬(wàn)元,只能在非常高端的車型上使用?!眲ブ赋?。
那如何兼顧高階智駕量產(chǎn)方案的高性能和低成本需求?
事實(shí)上,所有自動(dòng)駕駛方案最終的性能、體驗(yàn)表現(xiàn)等都是由感知上限決定,而自動(dòng)駕駛作為一個(gè)超強(qiáng)AI屬性的產(chǎn)品,其感知的上限則需要靠不斷地優(yōu)化算法來(lái)提升。
曠視判斷,體驗(yàn)好、成本低的高階智能駕駛產(chǎn)品,必須要有非常強(qiáng)的AI能力支撐,而只有在AI能力上有強(qiáng)大實(shí)力儲(chǔ)備的玩家,未來(lái)才有可能繼續(xù)走下去。
其實(shí)曠視早在2018年就曾關(guān)注過(guò)智駕行業(yè)。
在當(dāng)時(shí),業(yè)內(nèi)主流的感知技術(shù)路線是“2D圖像+傳統(tǒng)神經(jīng)網(wǎng)絡(luò)CNN”,采用容易導(dǎo)致信息失真的后融合策略,用人工進(jìn)行數(shù)據(jù)標(biāo)注。
“這種基于傳統(tǒng)雷達(dá)、攝像頭的感知方式,是不能解決高階智能駕駛方案所面臨的問(wèn)題的?!眲フJ(rèn)為,也因此曠視一直沒(méi)有踏足這一產(chǎn)業(yè)。
直到2020年,特斯拉將以視覺(jué)為主的“BEV+Transformer”架構(gòu)引入自動(dòng)駕駛領(lǐng)域,2021年初,特斯拉又在北美推出了升級(jí)版Autopilot的FSD,一舉舍棄毫米波雷達(dá),由此智能駕駛路線進(jìn)入了“分水嶺”階段,關(guān)于走純視覺(jué)路線還是多傳感器融合路線,各方爭(zhēng)論不休。
而曠視作為起家于計(jì)算機(jī)視覺(jué)研究的AI解決方案廠商,也決定在此時(shí)向智能駕駛產(chǎn)業(yè)界進(jìn)軍。
這是因?yàn)闀缫曊J(rèn)為,未來(lái)高階智駕方案大概率將會(huì)走以視覺(jué)為主的感知方式,至于要不要進(jìn)一步融合毫米波雷達(dá)、激光雷達(dá)等傳感器,則與各廠家的需求、安全冗余考量息息相關(guān)。
也因此,曠視設(shè)計(jì)的這一套統(tǒng)一算法框架,除了支持?jǐn)z像頭,也支持對(duì)激光雷達(dá)、毫米波雷達(dá)等傳感器進(jìn)行前融合。
甚至在行駛過(guò)程中,如果某個(gè)雷達(dá)或者攝像頭突然無(wú)法正常工作,曠視的智駕算法還能確保其它傳感器維持在正常水平,并基于此來(lái)判斷要不要進(jìn)行功能降級(jí),或者降級(jí)到何種程度。
曠視向來(lái)有相當(dāng)強(qiáng)悍的原創(chuàng)算法能力,更關(guān)鍵的是,曠視的算法并不是空中樓閣,而是真正基于產(chǎn)業(yè)界實(shí)際需求在研發(fā)。
截至目前,曠視智能駕駛業(yè)務(wù)團(tuán)隊(duì)已達(dá)數(shù)百人,其中近三分之二是算法研發(fā)團(tuán)隊(duì),剩下三分之一左右則是工程交付團(tuán)隊(duì)。
以PETR系列為例,這是曠視基于BEV實(shí)現(xiàn)的純視覺(jué)3D感知框架,目前已迭代至PETR V4版本。
通俗來(lái)講,這一版本在做的事,就是讓一個(gè)多幀長(zhǎng)視頻在模型里跑,本質(zhì)上是希望模型記住更多的東西,從而做到更好地感知態(tài)勢(shì),實(shí)現(xiàn)更好的物體跟蹤和預(yù)測(cè),由此在Orin平臺(tái)上實(shí)現(xiàn)“感知、建圖、跟蹤、預(yù)測(cè)”四合一的端到端模型,同時(shí)也能在未來(lái)進(jìn)一步降低方案成本。
而前文提及的對(duì)多模傳感器的前融合的實(shí)現(xiàn),則是曠視早已在PETR V3就已完成的事。
基于此,在智駕視覺(jué)方案領(lǐng)域,曠視除了是業(yè)內(nèi)唯一一家把Transformer跑在較低算力計(jì)算平臺(tái)的解決方案供應(yīng)商,還是業(yè)內(nèi)第一個(gè)實(shí)現(xiàn)300米距離視覺(jué)感知(現(xiàn)在很多激光雷達(dá)廠商的感知距離都達(dá)不到300米)的廠商。
另外,曠視還在2022年首創(chuàng)了魚眼BEV模型,使得車輛的感知范圍擴(kuò)大三倍,這讓車輛在泊車場(chǎng)景下,可以很早就感知到周圍的停車位,大大提升泊車體驗(yàn),從而支持自動(dòng)泊車方案去激光雷達(dá),進(jìn)一步降低方案成本。
“在行業(yè)內(nèi),真正具備原創(chuàng)算法能力的團(tuán)隊(duì)是鳳毛麟角的,在這方面,我們還是比較自信的,且這個(gè)優(yōu)勢(shì)會(huì)持續(xù)擴(kuò)大?!眲ト绱苏J(rèn)為。
技術(shù)領(lǐng)先并不意味著成功的商業(yè)化落地,產(chǎn)品+服務(wù)才是核心,這背后考驗(yàn)的是工程化落地能力。
工程化能力意味著解決方案的可復(fù)制性、可靠性強(qiáng)、產(chǎn)品架構(gòu)的統(tǒng)一性高,也意味著供應(yīng)商可以實(shí)現(xiàn)客戶個(gè)性化定制的解決方案,同時(shí)兼顧不同場(chǎng)景、不同使用者的多樣化需求。
嵌入式的工程化能力、客戶理解能力——這也正是曠視做智能駕駛解決方案,除強(qiáng)悍的算法能力外的兩大核心競(jìng)爭(zhēng)力。
“比如曾經(jīng)曠視在做一款芯片時(shí),芯片廠商提供了算子,但這一算子跑起來(lái)非常慢,后來(lái)曠視自己上,就把算子的性能提升了100倍,直接讓BEV在這個(gè)芯片上的實(shí)現(xiàn),從‘不可能的任務(wù)’變成性價(jià)比相當(dāng)好的方案?!眲ケ硎?。
從在工控機(jī)上實(shí)現(xiàn)demo,到切換至嵌入式系統(tǒng),有些廠商走了許多彎路,花了兩三年才艱難轉(zhuǎn)換完成,而劉偉指出,曠視則是非常平滑無(wú)縫地就完成了切換,“這是大部分友商都不具備的能力”。
另一方面,曠視作為供應(yīng)商,已在AI產(chǎn)業(yè)化的路子上已摸索得足夠久,對(duì)市場(chǎng)和客戶需求也有足夠豐富的理解經(jīng)驗(yàn)和能力。
從商業(yè)邏輯上看,不難看出,曠視切入智能駕駛行業(yè)的角度,總體還是“大客戶”邏輯,即以車廠為核心,重點(diǎn)與頭部車廠形成戰(zhàn)略性合作關(guān)系。
作為供應(yīng)商,如何在幫助客戶提高產(chǎn)品競(jìng)爭(zhēng)力的同時(shí),還能持續(xù)降本,曠視重視打造自身的軟硬一體能力,強(qiáng)調(diào)做到傳感器、芯片和算法之間的協(xié)同。
在軟件層面,曠視視覺(jué)算法感知的精度逼近于激光雷達(dá),領(lǐng)先的定位建圖算法也能大幅降低其對(duì)于高精地圖的依賴,具備更好的性價(jià)比和更好的體驗(yàn)。
在硬件領(lǐng)域,曠視則自研了AI傳感器、AI計(jì)算平臺(tái),具備完整的硬件生產(chǎn)經(jīng)驗(yàn),并已規(guī)?;鲐?。
在數(shù)據(jù)方面,曠視除了會(huì)選擇與主機(jī)廠合作,還自建車隊(duì)收集數(shù)據(jù)、訓(xùn)練模型,并利用大模型進(jìn)一步打磨自動(dòng)標(biāo)注工具鏈和能力。
域控方面,曠視則選擇與主機(jī)廠和Tier 1合作。
一般來(lái)說(shuō),對(duì)于智駕解決方案供應(yīng)商而言,一個(gè)方案有兩種收費(fèi)邏輯,一個(gè)是系統(tǒng)的開(kāi)發(fā)費(fèi),另一個(gè)則是在系統(tǒng)開(kāi)發(fā)的基礎(chǔ)上,在方案量產(chǎn)上車后收取的出貨費(fèi)用以及后續(xù)的OTA服務(wù)費(fèi)等。
而一套智駕方案想要適配到不同的車型,涉及到軟件、硬件、接插件,也涉及到與整車協(xié)議的匹配、算法的調(diào)整,還有跟車配合的執(zhí)行機(jī)構(gòu)都要進(jìn)行重新的標(biāo)定,這些都指向供應(yīng)商必須要具備一定的軟硬件協(xié)同能力、靈活的合作思維。
一業(yè)內(nèi)人士認(rèn)為,全棧自研是一個(gè)能力,而不是一個(gè)商業(yè)模式。
對(duì)車廠來(lái)說(shuō),如果車廠只希望跟一家公司合作方案的其中一個(gè)模塊,車廠也希望這家公司的產(chǎn)品思路跟得上自己。
供應(yīng)商怎么能保證和車廠的思路一致?其實(shí)主要還是落地、量產(chǎn)的思路。
“方案上車,車廠要考慮軟硬件之間的配合、感知與規(guī)劃之間的配合,這其中有很多經(jīng)驗(yàn)和know-how,如果你只做過(guò)其中一個(gè)功能模塊,會(huì)不知道怎么跟車廠配合。”該業(yè)內(nèi)人士指出。
值得注意的是,雷峰網(wǎng)近期在和主機(jī)廠溝通的過(guò)程中,由于此前低估了自研自動(dòng)駕駛的難度,再加上智駕功能落地后的市場(chǎng)反饋情況不盡如人意、越來(lái)越快的車型推出節(jié)奏等原因,我們很明顯地感受到,主機(jī)廠們對(duì)全棧自研的認(rèn)知和思路正在發(fā)生變化。
從主機(jī)廠的角度,如今他們對(duì)智能駕駛方案的核心訴求正從全棧自研轉(zhuǎn)向全棧可控,變得更為理性。
這也給予了曠視在內(nèi)的供應(yīng)商們與主機(jī)廠們更大和更靈活的合作空間。
“曠視作為供應(yīng)商,打造軟硬一體能力時(shí),主要是從產(chǎn)品性價(jià)比的角度出發(fā),看硬件和軟件如何能更好地整合、性能怎樣才會(huì)更好、落地成本怎樣才會(huì)更低?!眲フf(shuō)道。
在商業(yè)化進(jìn)展方面,曠視智駕解決方案均已進(jìn)入準(zhǔn)量產(chǎn)狀態(tài),比如目前曠視就正在對(duì)客戶量產(chǎn)交付專業(yè)版方案。
從產(chǎn)業(yè)格局來(lái)看,雖然智能駕駛領(lǐng)域一直熱度很高,但其實(shí)始終并未定型,對(duì)于能兼顧強(qiáng)大性能和高性價(jià)比需求的智駕方案供應(yīng)商,市場(chǎng)需求依然很大,行業(yè)充滿競(jìng)爭(zhēng)活力,也變數(shù)十足。
“我們現(xiàn)在重點(diǎn)聚焦在量產(chǎn)交付環(huán)節(jié),曠視有一個(gè)中期目標(biāo),就是希望在2025年,做到行業(yè)前三。”劉偉如此表示。
雷峰網(wǎng)#雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))#雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。