0
今年,從決策到量產交付搭載自研智駕方案的新款極氪001,極氪只用了4個月時間。
脫離之前的Mobileye方案,極氪自研的浩瀚智駕方案采用了全新的傳感器和計算平臺。老款車型換代時,把這套軟硬件裝上車,要做的改動并不少。
“在全國做高階智駕的廠商里,還沒有看到哪家用4個月把高階智駕從頭做到量產?!?/p>
極氪副總裁、智能駕駛負責人陳奇已經習慣打這種高強度的攻堅戰(zhàn),極氪的智駕自研起步較晚,途中還有很大一部分精力投入到原來的Mobileye方案,跑步追趕是他和團隊的日常。
陳奇曾被稱為“華為自動駕駛”的第一人,2021年下半年加入極氪,這個時間點不算有利。因為在2021年初,小鵬已經推出了覆蓋全國范圍的高速NOA。在爭分奪秒的智駕卡位期,留給他做出自研成果的時間并不多。
入職的前兩年,陳奇先用大半年時間搭建團隊和開發(fā)體系,再用一年多的時間做研發(fā),完成量產框架的從0到1。而跑通第一次量產,又花了近半年時間。
去年末,007正式上市,極氪有了第一批搭載自研智駕方案的車型。當時,極氪交付的智駕功能還僅限于高速NOA,在城市里只有LCC和泊車功能。
今年8月,極氪推送了面向全國的城市通勤功能;10月末,極氪開啟采用端到端架構的無圖城市NZP的全國公測。從第一款自研車型上市,再到今天量產無圖端到端大模型,極氪只用了10個月時間。
極氪的無圖端到端架構吸納了行業(yè)流行的框架,即端到端+多模態(tài)大語言模型的快慢系統(tǒng)組合。極氪的端到端大模型現階段為兩段式,感知模型與規(guī)控模型通過顯示和隱式連接,實現反向傳播、連續(xù)可導;其多模態(tài)大語言模型則命名為MLM。
這個架構以外,極氪還提出了匯集人駕經驗、人駕軌跡以及時空環(huán)境等先驗信息的數字先覺網絡。
極氪認為,如果把端到端大模型比作人的大腦,多模態(tài)大語言模型比作人的小腦,大腦+小腦的組合還不足以還原完整的人腦,所缺失的部分是海馬體,也就是將重要信息轉化成長期記憶的功能區(qū)。
數字先覺網絡承擔著海馬體的角色,原理與記憶行車功能相似,車輛在行駛中不斷采集、沉淀自車數據與環(huán)境信息,形成經驗信息,為端到端大模型與多模態(tài)大語言模型的決策提供參考與指導,實現從新手司機向經驗豐富的本地老司機進化。
在極氪看來,端到端+多模態(tài)大語言模型+數字先覺網絡的組合,才是面向未來3到5年的完整算法架構,預計行業(yè)的技術路線會逐漸向這個方向靠攏。
陳奇的團隊成員中,有不少智駕經驗豐富的專家。
他們自稱是“國內最先做城區(qū)智駕的一批人”,其中一些人從12年前就開始接觸智駕,清楚智駕在城區(qū)里面臨的問題和挑戰(zhàn)。
極氪成立至今,受到的最大質疑都來自于智能化,對于陳奇的團隊而言,追趕也是為了“爭一口氣”。
一位極氪智駕自研團隊的早期成員告訴雷峰網《新智駕》,團隊的工作強度大、節(jié)點激進,但是極氪也有“佛系”的一面,“佛系”體現在沒有盲目跟從友商的節(jié)奏,之前都是埋頭在干,宣傳很少,“不跟大家爭,不跟大家搶,全按自己的計劃和節(jié)奏來”。
三年時間,極氪打造了一個從硬件、底軟、中間件、算法、應用到數據平臺、工具鏈均為全棧自研的智駕體系。
在吉利集團走向整合、協(xié)同的趨勢下,極氪的高階智駕將面向整個集團進行輸出,已有品牌正在協(xié)商使用極氪的智駕方案。
雷峰網(公眾號:雷峰網)《新智駕》近日參與了極氪舉辦的兩場溝通會,與陳奇、極氪自動駕駛運營部部長顧志強進行了一次對話,《新智駕》對此進行了不改變原意的編輯和整理。
Q:極氪從什么時候開始做端到端?
陳奇:有幾個博士很早就開始研究,最近重點發(fā)力,追得快不是因為技術簡單,而是我們原來的架構設計已經有往這個方向做考慮。
Q:極氪推出的無圖NZP直接就采用端到端架構,中間是不是跳過了一些步驟?此前小鵬、理想都曾表示,智駕的迭代可以加速,但是不能跳過。
陳奇:自動駕駛沒有銀彈,無法用一種方法解決所有問題,要有很多工程上的積累與沉淀。到現在為止,如果連基于BEV+Transformer的高速(NOA)都沒做成,直接跳到端到端大模型,很難跳得過去。
行業(yè)經歷了很多次技術路線變更,從機器視覺到深度學習,后來是BEV+Transformer架構,開進城市里,先依靠高精地圖,再步入輕圖,現在經歷到無圖跟端到端。
我們比他們少經歷的是重圖跟輕圖兩個步驟,我們直接做了城市通勤模式,以及現在的無圖端到端,將來會把通勤模式跟無圖端到端結合到一起。
Q:怎么理解通勤模式跟無圖端到端的結合?
陳奇:通勤模式包含了一部分數字先覺網絡的信息,比如在通勤模式下走一圈,記錄時空環(huán)境信息,包括道路的豁口,或者是商場和醫(yī)院門口那些比較繁忙的路口。早期,可以通過這些時空環(huán)境信息為端到端賦能,在這些地方做更優(yōu)化的處理。最后,這些智駕經驗融合成一個模型,逐步通過模型輸出(指令),解決道路情況等線性信息。
我們會先把通勤和無圖端到端都做到極致后,再做這兩種模式的結合。如果先把輕圖和先覺網絡放進算法里,會過度依賴于先覺網絡,那無圖的泛化能力可能做得沒那么好。
數字先覺網絡與端到端結合,輸出端的軌跡數量增多,要在這些軌跡里選出最優(yōu)的解,目前對規(guī)控人員其實是一個很大的挑戰(zhàn)。很多人提到,端到端以后做規(guī)控的人是不是不需要了?端到端大模型是不可解釋的,原來做規(guī)則的人最知道端到端出來的哪些數據是正確的,還是要由這些人對出來的軌跡和控制信息做評價。
評價的維度包括效率、安全性和舒適性,要在這些維度里確定哪一條才是最優(yōu)的軌跡,這對于規(guī)控工程師的要求更高了。怎么評價這些軌跡是個很關鍵的話題,但現在大家都沒提。
Q:數字先覺網絡對規(guī)避端到端“下限低”,有多大作用?
陳奇:可以打個比方,例如前面有個坑,不管是深坑、淺坑還是人為畫的坑,立馬做出反應的是端到端網絡。
會去思考并根據坑的深淺來做反應,是MLM大模型。
數字先覺網絡是發(fā)現大家都在這個地方繞路,或者用戶以前已經開過這條路,知道這個地方有個坑,提前預判和變道。
就像扁鵲三兄弟治病,扁鵲大哥治未病,扁鵲二哥治小病,扁鵲治大病,數字先覺網絡類似扁鵲大哥,在事情沒發(fā)生前,就做了預防性的動作,讓智駕更安全、省心。
Q:數字先覺網絡把不同車主收集到的數據都上傳到云端,再共享給其他車主,是這種形式嗎?
陳奇:初步是這種形式,后面也可以做到千人千面。城市通勤模式是根據個人來的,現在要把數字先覺網絡覆蓋得比較廣,會先做一版通用的,就像端到端一樣,現在先做通用,再根據地域做個性化的東西。
顧志強:數字先覺網絡里面有兩部分,一部分是先覺信息,還有一部分是把人的開車經驗放到模型訓練之后沉淀成肌肉記憶。
放武漢的駕駛數據進去,開起來就和北京、上海的不一樣,因為每個地域的開車風格不一樣。模型綜合訓練后,會包含各地的駕駛風格。
將來的終極形態(tài),可能是在武漢的時候,就把武漢的駕駛風格調出來,達到入鄉(xiāng)隨俗,開車風格不突兀。當然這可能還要走一些路才能實現,但會往這個方向去發(fā)展。
更終極的就像大白(陳奇)說的,能做到千人千面,相當于把自己學的經驗直接在本地應用了。
Q:總體來說,極氪做端到端有什么優(yōu)勢?極氪本來數據積累并不多,今年能把端到端做上車,靠的是什么?
陳奇:數據上面也不算少,已經有大幾萬臺車在全國各地跑,今年8月以后,極氪每月的交付量都在2萬臺以上。
端到端一方面靠數據量,另一方面得靠有效數據量,關鍵是怎么把有效數據選出來,這很考驗技術。2015、2016年,很多車企都說數據量很多,但實際上數據的重復度非常高,有效數據量不夠。
另外除了有效的數據,端到端還需要好的數據配比。如果這方面做得好,速度就能快很多。有好多智駕團隊號稱請了國賓司機,按照他們的開車習慣做數據訓練,但實際上可以從量產的數據里,把類似于國賓司機的駕駛風格篩選出來,這是要花精力、花代價的,但數據量可以做得很大。
端到端后,智駕系統(tǒng)也會出現不穩(wěn)定的情況,有時進步,有時退化,只有把整套智能駕駛的數據閉環(huán)了,數據篩選、清洗和后端評測體系構建完全,才能真正發(fā)揮作用。
Q:極氪切換到端到端架構,做了哪些組織架構上的調整?
陳奇:組織架構上,端到端從感知、預測到規(guī)控都是一個團隊,效率最高,無論是物理的實體組織,還是虛擬組織,只要能把這個團隊高效運作起來就行。
第一時間,我們把感知、規(guī)控全拉通了,整合成一個虛擬化的團隊,有專門的人設計方案、盯方案,數據和訓練整個團隊都在一起。
剛開始的磨合期,團隊所有人都聚到一個辦公地點進行封閉開發(fā),一起辦公、一起吃飯,等到能分解各個模塊,或者成員弄清楚自己的任務后,再回到原位。
Q:現在我們的預研團隊會研究什么方向?
陳奇:都會看,我們的多模態(tài)大語言模型還比較初級,需要繼續(xù)研究;現在行業(yè)里已經開始用ChatGPT做智駕模型,我們也在探索這個方向。另外,數字先覺網絡也還有很多可以挖掘的地方,我們同步在研究。
Q:端到端以后,我們會有一個預想的團隊規(guī)模嗎?
陳奇:團隊跟平臺、車型有關系。每個車型都需要調試后再上車,比如001跟007的轉向就有很大不同,所以每個車型都需要一部分調試、測試的人。
我們現在還是往前趕的階段,今年我們上了新款001、007,還有7X和MIX,后面也還有很多款在研的車型,要承接的車型很多,壓力不小。集團協(xié)同以后,車型也會更多,所以現在還無法給出精確的預測。
不過,我們團隊的戰(zhàn)斗力很強。以2025款極氪001為例,前后也就花了四個月時間,這還是在更換了智駕硬件、工作量特別大的情況下實現的。在全國做高階智駕的廠商里,還沒有看到哪家用四個月把高階智駕從頭做到量產。
Q:現在無圖NZP的公測時間提前了兩個月,年底要全量推送,25年初又要推door to door,實現這樣一個目標會有壓力嗎?
陳奇:壓力肯定很大,很多時候都是沒日沒夜地做,我們每次都會選一個城市,駐扎在那里解決問題。今年推城市通勤,就選擇在武漢、廣州攻堅。
為什么選擇這兩座城市?去年底要量產007的時候,正好是廣州車展,想著要量產了就先做個試驗,從上海開到了廣州,另外還有一幫兄弟往西部開,經過武漢。高速上一路的表現還行,只有一點小問題。當時在城區(qū)里,LCC還是主打功能,比拼十字路口能不能過、十字路口能過多長這些指標。
我們發(fā)現,廣州和武漢的城區(qū)表現得一塌糊涂,所以在廣州、武漢攻堅了大概一、兩個月。
這樣下來,我們的LCC絕對是行業(yè)頂流,只不過是NZP起來之后LCC就不太有人用了。
2025款001的交付時間比較短,也有一段攻堅戰(zhàn)。去年007上市之后,第一代產品有問題要修復,后來我們要攻克“指尖車位(指尖泊車、立體車位)”,做城市通勤,這些都占用了我們很多資源。
雖然通勤和無圖對比行業(yè)來講要稍微晚一點,但是效率很高,我們的推送也一再往前提。
能做到這點,是因為我們整個架構搭得不錯。在剛設計的時候,我們考慮了架構的可擴展性和演進性,所以能很快切換到無圖端到端,這是我們的優(yōu)勢之一。
另一方面是,兄弟們也比較愿意付出,帶有一些夢想,很希望能做到行業(yè)里面的No.1, 所以也都憋著一口氣在拼。
如果能只做一款車那就太爽了,我很羨慕以前的蔚小理能有很長時間的技術積累期,前期可以用一兩款車來打磨團隊和產品,我們基本一路都在跑步追趕。
團隊里還有Mobileye的方案,我現在還有很多精力都在那頭。極氪和安總對用戶都非常負責,不管怎么樣,安總都要求我一定要把每套方案都做好。
Q:回顧加入極氪的三年時間,你會怎么劃分極氪智駕自研的不同階段?
陳奇:前面一年都在搭團隊和構建基礎的研發(fā)能力。
主機廠的軟件研發(fā)能力比起原來互聯網或者高科技行業(yè)還是相對薄弱一點,團隊和軟硬件開發(fā)體系的搭建花了半年多時間,到了2022年3月左右,團隊的核心骨架已經搭成,也有了智駕最小的原型。
第二階段是正常研發(fā)的階段,花費了一年多一點的時間,到2023年6、7月份,整套量產的框架基本成型,數據平臺、工具鏈也都有雛形了。
我們真的是從零開始,我們原來搭載Mobileye方案的車型數據,因為傳感器的格式不同,沒辦法通用。
從2023年下半年開始,就是各種量產的攻堅。
所以從2021年到2022年3月份,完成了團隊的從0到1;到2023年年中,完成了量產框架的從0到1;到2023年底007上市,完成了量產從0到1的過程;這之后開始多車型適配、量產車型維護和新功能迭代。
今年8月推送城市通勤,也算是有個初步成果。緊接著10月份公測無圖城市NZP,開始了進階城區(qū)的階段。
Q:你覺得自研步入正軌是什么時候?
陳奇:2022年5、6月已經步入正軌。
我們團隊里有很大一部分人已經做了很長時間的智駕,有些從2011年、2012年就開始接觸了。我和我們團隊里很多人也都經歷過大的產品洗禮,都做過上千人甚至是幾千人合作開發(fā)、代碼行數達到千萬量級的產品。
如果沒有這些經歷,很多體系搭不起來。我們現在的研發(fā)體系比較健全。
我經常跟安總說,我們幫公司做好一個產品不算牛逼。行業(yè)里面有這樣的例子,雖然已經做出了產品,但主力離職以后,沒人能接起來,對公司造成很大損失。
關鍵是要把技術、知識沉淀到組織里,這一塊我們做得相當好,我們從需求到設計到開發(fā)到測試到售后,甚至到用戶運營,整套鏈路都在同一個平臺里,雙向可追溯。
Q:極氪做智駕的風格是怎樣的?
陳奇:我們起步較晚,人數不多,方向不能走錯。極氪智駕的執(zhí)行力很強,團隊敢想敢拼敢干,另外在技術上我們也會同時探索多個方向。
顧志強:我們一開始就花了比較多時間去思考架構,現在的架構想的比較清楚,保證每一份研發(fā)投入都不會繞彎路。
我們通勤也發(fā),無圖也發(fā),業(yè)界做這兩個模式的除了極氪,還有另一家頭部車企,但他們家不是像我們這么思考的,我們將來要將這兩個產品形態(tài)進行融合。
Q:極氪一邊做城市通勤,一邊做端到端,一邊還在做車型適配,分散了不少精力,對研發(fā)體系的考驗有多大?
陳奇:整個架構我們做過設計。端到端跟無圖,如果當成兩件事情來做,人力吃緊。端到端跟無圖可以作為一件事情來考慮,端到端只是無圖的一種技術而已,也不一定要一下就過渡到One Model,可以先用兩個模型把端到端做起來。
像通勤、規(guī)則那部分,完全可以用來做我的兜底,做我的評價,跟無圖結合。你把這些做成一件事情,人力消耗上就會小很多,不會因為同時開展幾件事情導致人力翻倍。
Q:極氪的智駕會把誰當做借鑒對象?
陳奇:我們覺得好的,都學。每家都有比較好的地方,也有不好的地方,有些場景,我們做得更好。
現在無圖城區(qū)智駕,每家都還有很多問題,誰排老大、誰排老二沒有明晰標準,激進的版本會讓用戶不夠安心,慢慢開,反而安心感更足。
所以,第一個無圖城市NZP版本,我們考慮得就稍微保守一點。
Q:今年端到端的上車速度整體超過預期,你會覺得這里面有被激烈競爭所裹挾的成分嗎?
陳奇:整體速度的確超預期,能有這么快的速度,也是因為大家敢想敢拼,公司對智駕這邊的資源相當傾斜。
行業(yè)卷起來,或多或少都有被裹挾的成分存在,沒有哪家不被這個大趨勢推著走。
但在浪潮之巔搏一把,也是對人生最好的回報。連被裹挾的機會都沒有,才叫行業(yè)的悲哀。
往回推兩年,對現在的城區(qū)智駕都不敢想象,原來花兩年時間也做不到這個程度。智駕一向是最難的難題,還是需要大家一起熱火朝天往前推。
Q:現在市場有不同智駕技術路徑,極氪保留了激光雷達,但也有廠商推崇純視覺,你們對不同路徑的安全性、成本有哪些看法?哪一條技術路徑最終會勝出?
陳奇:無圖技術和是不是純視覺不矛盾,極氪如果把激光雷達去掉,表現也會很好。有圖無圖、帶不帶激光雷達,不是技術路線之爭,關鍵是如何考慮用戶安全。
在沒有大數據訓練過的場景下,如夜晚或極端天氣,激光雷達的表現優(yōu)于所有傳感器,一束光發(fā)出去直接回波,甚至可以感知到異形石頭。有了激光雷達,很多極端場景會處理得更好。
林金文(極氪副總裁):在極端場景里,沒有激光雷達,對高階智駕的安全性保證是不足的。絕大部分廠家,包括華為這種智駕Top級廠家的高階車型都是帶激光雷達版本,無論是頭部、尾部汽車企業(yè),都支持高階車型搭載激光雷達。
激光雷達很昂貴,但實現的功能和安全性同樣不可替代。極氪堅持搭激光雷達,基本絕大部分車型都是標配。
很多降價降到20萬及20萬以下的品牌,BOM成本沒有能力承載激光雷達這樣的高階硬件,來實現更高階的智駕。極氪面對高端豪華市場,不會把價格打得很低,同樣不參與價格戰(zhàn),像001,三年前價格是26萬多,今天基礎版也是26萬多,不像一些品牌價格降得非常厲害,幾乎降50%以上,極氪還是堅守價格底線。
Q:極氪后面所有的車型都要上浩瀚智駕嗎?會延續(xù)全系標配的方式嗎?
陳奇:至少現階段所有的產品是這樣,但是后面還是要根據產品的定位和節(jié)奏來。
Q:那極氪現在全系標配的考慮是什么?
陳奇:作為一個高端豪華電動品牌,用料肯定要足。智駕是一個智能化部件,也要為三、五年以后的更新和迭代、功能演進考慮,至少那時候不會那么捉襟見肘,讓很好的功能用不起來。
Q:全系標配,其實很大程度是把智駕也免費送給了用戶,涉及到智駕商業(yè)模式的問題。了解到極氪內部正在探討一些智駕服務,用運營來收費,你們對此的思考是什么?
陳奇:運營模式收不收費,還是要看市場來定。我們的確有這方面的思考。如果智駕體驗達到一定程度,將來就要做各種各樣的服務,包括推薦或者引導服務。
比如到服務區(qū)里,直接引導車輛到充電樁里充電,甚至車主可以提前下車,又或者是推薦餐廳,車主直接點一點,就能直接送到餐廳車位。如果將來粘性做好了,有可能會是一種可以收費的模式。
我們盡量把這種服務做好,會形成車主的習慣,極氪車用慣了,用其他車就不習慣,很多為個人量身打造的服務在其他車上找不著,那么下一輛車還會優(yōu)先買極氪。
Q:安總這三年來對智駕的態(tài)度有過變化嗎?
陳奇:安總一直對我們很支持、很信任,我們自己本身也比較拼,很希望把體驗打磨好。安總很多時候為我們考慮,盡量創(chuàng)造環(huán)境讓我們專注工作,他的評判標準很簡單,就看用戶體驗好不好。
Q:安總今年給你定的目標完成了嗎?
陳奇:根據產品線節(jié)奏,基本上我們都守住了。
老款001由于還沒有走到無圖的方向,后面開城還需要一定時間?,F在我們也想快一點,前段時間我們研發(fā)的工程師和總監(jiān)都想去以色列一起調,但是現在戰(zhàn)火紛飛,整個進度還是會受到局勢的影響。
我們肯定還是會持續(xù)不斷地優(yōu)化,包括泊車、城市都在趕,加緊驗證,希望能早點給大家推出來。
Q:極氪和領克進行整合,極氪智駕如何反哺其他品牌?
陳奇:現階段我們整個團隊還是聚焦于極氪自身,希望把最好的技術還有功能都應用到極氪的車型上。
對外方面,要根據集團的協(xié)同、資源的整合。合適的時候,極氪智駕肯定也會考慮開放給兄弟品牌,有一定的發(fā)展動態(tài),我們會第一時間告訴大家。
Q:極氪的智駕方案分享給兄弟品牌,會不會區(qū)別對待,比如降低硬件配置?
陳奇:我們儲備的方案肯定不只有一個高階的,有一些其他的方案,會根據產品定位和品牌定位進行選擇。
現在有一個趨勢,越來越多十多萬的產品也用上了高階智駕,比如雙OrinX芯片或OrinX芯片+4D毫米波+激光的情況,還是要根據市場的情況以及車型的定位來決定。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。