「理想同學(xué)」的進化史：從AI助手到智能體的自研之路

本文作者：李雨晨

2025-09-30 09:58

導(dǎo)語：從傳統(tǒng)的AI助手到大模型時代下的智能體，理想同學(xué)如何讓座艙實現(xiàn)自我革命？

如果要選出最早憑借座艙功能占領(lǐng)用戶心智的一家造車新勢力，答案或許是理想。

“冰箱彩電大沙發(fā)”是理想最被人所知的賣點。但拋開這些精準(zhǔn)的硬件定義，作為未來用戶智駕空間與娛樂的第三空間，座艙里只有這些是遠遠不夠的。智能化尤其是座艙空間的智能化，已經(jīng)成為車企的核心賣點。

2023年5月，理想汽車智能空間副總裁勾曉菲曾在美國硅谷的一次半公開宣講會上說，“觸控不是座艙最主要的交互方式，把觸控做得再好，生態(tài)做得再好，它不適合在這個終端里?；谟|控生態(tài)的車機系統(tǒng)，就是在用正確的方式回答了一個錯誤的問題?！?/p>

勾曉菲這句話說完后的一個月，理想汽車推出了自研認知大模型“Mind GPT”，并將其以“理想同學(xué)”App的形式嵌入車機系統(tǒng)中，成為座艙里眾多用戶與數(shù)字內(nèi)容交互的“新按鈕”。

大模型加速上車后，智能座艙的競爭更顯白熱化。作為全公司最大的產(chǎn)品經(jīng)理，李想對于AI的投入非常堅決，每個月都會參加數(shù)場AI的主題會。

他經(jīng)常說的一句話是：“我們是一個AI公司，我們必須把大模型做出來，沒有大模型就不配稱為AI公司?！?/p>

李想不是技術(shù)科班出身，但在2024年6月，他做了一件非常具有“預(yù)言性”的事情：大模型的研究重心，要從預(yù)訓(xùn)練向后訓(xùn)練遷移。三個月后，OpenAI o1驚艷世人，后訓(xùn)練（Post-Training) 在大模型端到端訓(xùn)練中的話題度不斷提升。而在李想此前的授意下，理想已經(jīng)提前進行了內(nèi)部共識和組織的切換。

效率，是理想智能化超車的重要保障。

回顧歷史，在2021年2月全面自研之前，理想的語音助手還需要依賴思必馳、地平線、大象聲科等供應(yīng)商來支撐，甚至“用戶數(shù)據(jù)”都還握在別人手中。從傳統(tǒng)的AI助手到大模型時代下的智能體，理想通過“理想同學(xué)”，實現(xiàn)了一次座艙“自我革命”的重建。

擺脫供應(yīng)商，組建初始團隊

2020年，在交付一萬輛車一個月后，理想汽車在美股上市。理想希望通過建立和完善自研能力，盡快追趕上競爭對手小鵬。然而，理想汽車內(nèi)部算法團隊和供應(yīng)商的博弈中處于劣勢。這讓李想敏感地意識到，如果沒有自研能力，就會一直被牽制。

全面啟動自研之前，理想的座艙技術(shù)“一窮二白”，更多依賴供應(yīng)商，例如思必馳的語音識別、大象聲科的聽覺算法、虹軟的視覺能力等等。座艙方面還沒有明確的路線圖，團隊如何建設(shè)、產(chǎn)品如何定義、技術(shù)路線怎么走，沒有一個清晰的結(jié)論。

語音助手自研的任務(wù)，落在了座艙部門的空間AI團隊身上。

2021年底，李想在智能空間大部門的戰(zhàn)略會上，明確智能空間與AI相關(guān)的全部算法都要自研，之前底層算法依賴于供應(yīng)商的局面必須被打破。與此同時，理想內(nèi)部正在力推兩件事情：一個是IPD流程，將所有人的工作綁定在流程上；二是推動研發(fā)平臺的建設(shè)。

理想的座艙平臺化策略是通過SS1、SS2、SS3、SS4等不同平臺來實現(xiàn)，每個平臺基本上對應(yīng)一款車型。由于理想的車型設(shè)計相似，結(jié)構(gòu)上也相對可控。對于研發(fā)團隊而言，最具挑戰(zhàn)性的是麥克風(fēng)和攝像頭傳感器的布局，這些布局直接影響算法的開發(fā)。因此，標(biāo)準(zhǔn)化的配置單，只會有“一份菜單”，避免了定制化的資源消耗。

原本，勾曉菲規(guī)劃用兩年時間完成自研，但這將會落后于理想新車的發(fā)布節(jié)奏。

「理想同學(xué)」的進化史：從AI助手到智能體的自研之路

（勾曉菲）

2022年，理想汽車計劃只發(fā)布一款L9，到2023年L9、L8、L7系列車型同時上市。如果兩年后才切回自研，理想可能會錯失市場機會。在無法預(yù)知蔚來、小鵬、華為等對手迭代速度的情況下，切換供應(yīng)商的進程被縮短到了一年。

2022年的前半年內(nèi)，從搜狗加入的陳偉負責(zé)組建空間AI團隊，成員既有來自搜狗的老同事，也有百度、快手、字節(jié)、阿里達摩院等互聯(lián)網(wǎng)大廠成員。

與搜狗等互聯(lián)網(wǎng)公司相比，理想仍沒脫離車企的“草莽”氣質(zhì)——沒有架設(shè)云端服務(wù)器，甚至連基本的工作站也沒有，用戶的數(shù)據(jù)全在語音技術(shù)供應(yīng)商思必馳手中。

團隊要做的第一件事，就是將數(shù)據(jù)所有權(quán)拿回，并在公司內(nèi)部架設(shè)服務(wù)器，開始自己存儲數(shù)據(jù)。

與此同時，由于成員背景多元，團隊需要明確未來的發(fā)展方向，迅速提升這支團隊的戰(zhàn)斗力，只能專注于主線任務(wù)。有座艙AI同事張江回憶：“我們得到的目標(biāo)是全力專注于自研，效果要比供應(yīng)商好30%?！?/p>

其次，在團隊沒有成型時，空間AI團隊全部實行扁平化管理，確保信息溝通足夠迅速。要打破從大廠可能帶來的部門墻思維，通過流程和制度的變化來解決協(xié)作問題，讓更多人快速融入團隊。

理想所有的高層，都對座艙的推進保持了高度關(guān)注。座艙自研之初，空間AI團隊設(shè)想的一種發(fā)展路徑是，未來一到兩年內(nèi)，讓理想同學(xué)的AI能力可以覆蓋車、門店、客服等等場景。

但據(jù)另一位理想座艙員工孫浩回憶，有一次李想?yún)⒓恿俗搱F隊的LSA戰(zhàn)略分析會。會后，李想給了一個結(jié)論：不要把目前已經(jīng)成熟的方案重做一遍。

“智能客服這種事，值不值得做，如果你能花錢買過來，你就去買，你不要再讓團隊再去支撐這樣業(yè)務(wù)。我們這個團隊是把理想同學(xué)的產(chǎn)品力度做好，解決車內(nèi)交互的問題?！?/p>

空間AI團隊的任務(wù)變得更加聚焦——做好“理想同學(xué)”。

完成資源切換后，成果很快顯現(xiàn)。與供應(yīng)商方案相比，自研技術(shù)的車內(nèi)表現(xiàn)有了實質(zhì)性的突破，用戶能感受到語音控制的便捷性得到了顯著提升，交互體驗變得更流暢自然。

2022年11月，空間AI團隊首次在理想ONE車型上完成了自研語音的落地。

等到理想L7首發(fā)的時候，搭載其上的語音和視覺功能已經(jīng)全部是自研技術(shù)。2023年上半年，理想基本完成了座艙自研技術(shù)的切換，徹底擺脫對外部供應(yīng)商的依賴。

ChatGPT來了

2022年底，科技圈最大的一件事是，ChatGPT來了。

理想座艙團隊此前進行了一些預(yù)訓(xùn)練工作，對大模型的到來有預(yù)判，但沒想到模型能發(fā)展到如此大的規(guī)模。當(dāng)時，座艙的自研技術(shù)切換還沒有完成，OpenAI還是實行閉源，沒有人知道大模型應(yīng)該怎么做。

在大模型出現(xiàn)前，語音交互主要是命令式或任務(wù)型的，行業(yè)競爭更多集中在語音識別的速度、執(zhí)行的準(zhǔn)確性和響應(yīng)效率上。但那時候的AI助手認知能力仍然不足，尤其在復(fù)雜任務(wù)理解、知識問答、開放式對話上存在局限，這也制約了理想同學(xué)的產(chǎn)品力。

李想把座艙團隊的高管叫上開會，他給了一個自己的結(jié)論：ChatGPT對產(chǎn)業(yè)影響是摧枯拉朽的，所有人都在關(guān)注AI助手的語音識別速度、靈敏度和準(zhǔn)確率，但這種東西永遠卷不出來。從用戶體驗的角度來看，沒有大模型的加持，這些指標(biāo)只是低維度的競爭。

李想說，“AI助手的核心問題就是‘笨’，不做大模型怎么解決笨的問題？”

從這個時候開始，AI成為李想提及最高頻的詞之一。兩個月后，理想對內(nèi)宣布，理想的愿景是“2030年，成為全球領(lǐng)先的人工智能企業(yè)”。雖然這一愿景后續(xù)有所變化，但理想汽車已經(jīng)不再局限于“車企”的定位。

此時，大模型與座艙空間如何結(jié)合、解決什么問題，沒有任何可參考的樣本，需要座艙團隊自己從頭摸索。

可這不影響李想對大模型堅決的態(tài)度，他甚至要求下屬們參與“對賭”，還要講明白可以如何利用大模型滿足用戶，以及明確的交付時間點。

最終，理想座艙團隊提出了一個大模型上車的路線圖。

當(dāng)時，所有人都沒有完全清楚這應(yīng)該被稱為“智能體”，但團隊已經(jīng)認為大模型是一種形態(tài)——作為大腦，可以連接各種工具和記憶、行動的組件。

2023年4月，座艙團隊向李想進行了一次匯報，并為它起好了名字--Mind GPT。兩個月之后，理想的空間AI團隊就交出了第一個版本——6月7日，家庭科技日活動上，李想對外證實了大模型MindGPT的存在。

代表理想進行分享的是空間AI負責(zé)人陳偉。

「理想同學(xué)」的進化史：從AI助手到智能體的自研之路

（陳偉）

他表示，Mind GPT使用了1.3萬億token，進行基座模型訓(xùn)練，這相當(dāng)于它具備了人類高質(zhì)量知識的總和。當(dāng)時，理想已經(jīng)基本確定了場景，主要集中在出行娛樂、用車以及兒童教育，仍然是圍繞家庭用戶的需求做文章。

這些需求在內(nèi)部被稱為“三助一師”，涵蓋了用戶用車助手、出行助手、娛樂助手及百科老師四個角色，理想甚至為這個新名詞注冊了多個商標(biāo)。

后來，空間AI團隊又定下了2023年底大模型上車的新目標(biāo)。整個團隊不僅要完成從0到1的大模型全鏈路技術(shù)突破，更要從0到1完成將大模型賦能給理想同學(xué)。

留給空間AI團隊的時間只有6個月，這個目標(biāo)的難度非常大。

過去，空間AI團隊成員主要擅長開發(fā)功能單一、目標(biāo)明確的小模型，現(xiàn)在卻要轉(zhuǎn)向研發(fā)功能復(fù)雜、需求不斷升級的大模型，并最終部署到汽車上，這本身就極具挑戰(zhàn)。更何況，當(dāng)時的開源資源并不充足。

大模型時代不僅技術(shù)門檻高，其協(xié)作方式也發(fā)生了根本變化。整個研發(fā)流程涉及預(yù)訓(xùn)練、后訓(xùn)練、評估等多個環(huán)節(jié)，需要訓(xùn)練、數(shù)據(jù)、底層工程等多方面能力的緊密協(xié)作，如何合理切割階段成為關(guān)鍵，切得太細協(xié)作低效，太粗人力不足傳統(tǒng)的“擊鼓傳花”式研發(fā)邏輯，每增加環(huán)節(jié)就導(dǎo)致效率下降和不可控性的上升。

這意味著，座艙AI團隊需要圍繞大模型重新定義關(guān)鍵崗位和角色，摒棄過去習(xí)慣的傳統(tǒng)互聯(lián)網(wǎng)大廠研發(fā)路徑，在同時推進大模型基座、訓(xùn)練算法研發(fā)的同時，確保產(chǎn)品在各類車載場景下的體驗。

這不僅要解決算法的準(zhǔn)確性問題，還需兼顧工程的執(zhí)行效率等現(xiàn)實因素。

幾乎每周，理想都會對Mind GPT進行一次版本迭代，并同步集成到“理想同學(xué)”中進行升級，涉及與已有模塊的聯(lián)動和新策略的聯(lián)調(diào)。為了確保每次升級都能帶來體驗穩(wěn)定提升，上線之前團隊都需要進行人工標(biāo)注和測試驗證。

據(jù)理想座艙團隊的張棟回憶，“李想是一個非常愿意給資源的人。2023年，李想經(jīng)常要求座艙AI團隊大膽提出資源或者算力的需求。預(yù)算上直接批了三四千張卡（芯片）的資源，團隊累計擁有近八千張卡?！?/p>

事實上，自研意味著要工作始終比行業(yè)快半步，甚至是一步。

2023年9月，座艙AI團隊還推出“方言自由說”功能。更令團隊感到興奮的是，多模態(tài)互動的落地，讓手勢控制進入座艙成為可能。在車內(nèi)，用戶只需隨手一指，就能輕松控制車窗、空調(diào)、燈光甚至影音娛樂。

2023年底，Mind GPT隨著OTA 5.0版本更新成功“上車”，并通過國家大模型備案，是較早實際應(yīng)用于車端的大語言模型之一。在Mind GPT加持之下，理想同學(xué)能夠理解更為復(fù)雜的功能組合，用戶交互更自然。

通向未來的AI世界

2024年1月，理想成立了AI委員會，由謝炎負責(zé)。

這個委員會里，包括產(chǎn)品部和各個研發(fā)部門的負責(zé)人及主要人員，目的是對未來的技術(shù)路線進行評審和判斷，以及對技術(shù)投資進行決策。

比如，決定是否在某個項目上立項。理想有一個面向研究的RD預(yù)算池，這個池子的資金分配，很大程度上就由技術(shù)委員會進行技術(shù)評審。

2024春季發(fā)布會上，理想推出首款純電車型MEGA；一個月后，公司啟動組織升級，CEO辦公室改名“產(chǎn)品與戰(zhàn)略群組”，設(shè)立產(chǎn)品線和質(zhì)量運營兩個新部門。

這些變化都只為了AGI（通用人工智能）進入李想認為的“iPhone 4時刻”。

李想曾將OpenAI定義的聊天機器人認為是第一階段，第二階段是推理者，而進入上述時刻的第三階段是出現(xiàn)Agent，理想要做的就是將汽車作為載體實現(xiàn)AGI的Agent階段。

這也意味著，理想需要突破更底層的技術(shù)。

2024年10月，理想秋季戰(zhàn)略會上，車機端的理想同學(xué)的業(yè)務(wù)優(yōu)先級由最高降低兩級，陳偉在2025年初被調(diào)任基座模型部門負責(zé)人，主導(dǎo)基座模型自研。

基座模型是蔚小理等新勢力爭奪AI時代的一張門票。今年4月，小鵬智駕負責(zé)人李力耘曾表示，小鵬目前已經(jīng)著手推進72B超大規(guī)模參數(shù)世界基座模型的研發(fā)。

理想也不甘人后。今年3月，理想在英偉達2025春季GTC大會上宣布，在車端部署了參數(shù)為 22 億的 MindVLA大模型(Vision-Language-Action Model，視覺-語言-動作模型)。

據(jù)基座團隊向雷峰網(wǎng)(公眾號：雷峰網(wǎng))反饋，內(nèi)部不會追求一個超大規(guī)模的基座，要結(jié)合投入產(chǎn)出比以及場景結(jié)合度。（后續(xù)，雷峰網(wǎng)還將推出理想端到端、基座模型、芯片等自研話題，感興趣的讀者可添加編輯微信 Gru1993 互通有無）

過去的三年時間里，承擔(dān)理想基礎(chǔ)性技術(shù)研發(fā)工作的人是理想CTO謝炎。

加入理想前，謝炎曾在華為工作三年，期間升任消費者BG軟件部副總裁、終端OS部部長，他還曾作為AliOS首席架構(gòu)師在阿里巴巴工作五年。與更側(cè)重產(chǎn)品的勾曉菲不同，謝炎將精力主要放在基礎(chǔ)設(shè)施和底層技術(shù)的研發(fā)上。

謝炎曾對他人表示，自己70%的時間都在操作系統(tǒng)和自研芯片。

2025年4月16日，理想汽車正式宣布開源理想星環(huán)OS，成為全球首家開源整車操作系統(tǒng)的車企。李想在微博上表示，開源的理想星環(huán)OS可以幫助任何一個品牌每年節(jié)省千萬甚至上億的成本。

目前來看，理想要重點打造兩款人工智能產(chǎn)品，理想同學(xué)用以實現(xiàn)Agent和自動駕駛用以實現(xiàn)L4級別的自動駕駛，并且基座模型發(fā)展到最后階段會融合成VLA模型。因此，基座模型被理想高層寄予了更高的期待。

在李想看來，車將從工業(yè)時代的交通工具，進化成為AI時代的空間機器人。

從2021年決定自研起，從智能駕駛到理想同學(xué)，所有的一切工作都是指向了未來的AI世界。（注：文中的張江、孫浩、張棟等皆為化名。）

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章