丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李雨晨
發(fā)送

0

「理想同學(xué)」的進(jìn)化史:從AI助手到智能體的自研之路

本文作者: 李雨晨   2025-09-30 09:58
導(dǎo)語:從傳統(tǒng)的AI助手到大模型時(shí)代下的智能體,理想同學(xué)如何讓座艙實(shí)現(xiàn)自我革命?

「理想同學(xué)」的進(jìn)化史:從AI助手到智能體的自研之路

如果要選出最早憑借座艙功能占領(lǐng)用戶心智的一家造車新勢(shì)力,答案或許是理想。

“冰箱彩電大沙發(fā)”是理想最被人所知的賣點(diǎn)。但拋開這些精準(zhǔn)的硬件定義,作為未來用戶智駕空間與娛樂的第三空間,座艙里只有這些是遠(yuǎn)遠(yuǎn)不夠的。智能化尤其是座艙空間的智能化,已經(jīng)成為車企的核心賣點(diǎn)。

2023年5月,理想汽車智能空間副總裁勾曉菲曾在美國(guó)硅谷的一次半公開宣講會(huì)上說,“觸控不是座艙最主要的交互方式,把觸控做得再好,生態(tài)做得再好,它不適合在這個(gè)終端里?;谟|控生態(tài)的車機(jī)系統(tǒng),就是在用正確的方式回答了一個(gè)錯(cuò)誤的問題?!?/p>

勾曉菲這句話說完后的一個(gè)月,理想汽車推出了自研認(rèn)知大模型“Mind GPT”,并將其以“理想同學(xué)”App的形式嵌入車機(jī)系統(tǒng)中,成為座艙里眾多用戶與數(shù)字內(nèi)容交互的“新按鈕”。

大模型加速上車后,智能座艙的競(jìng)爭(zhēng)更顯白熱化。作為全公司最大的產(chǎn)品經(jīng)理,李想對(duì)于AI的投入非常堅(jiān)決,每個(gè)月都會(huì)參加數(shù)場(chǎng)AI的主題會(huì)。

他經(jīng)常說的一句話是:“我們是一個(gè)AI公司,我們必須把大模型做出來,沒有大模型就不配稱為AI公司?!?/p>

李想不是技術(shù)科班出身,但在2024年6月,他做了一件非常具有“預(yù)言性”的事情:大模型的研究重心,要從預(yù)訓(xùn)練向后訓(xùn)練遷移。三個(gè)月后,OpenAI o1驚艷世人,后訓(xùn)練(Post-Training) 在大模型端到端訓(xùn)練中的話題度不斷提升。而在李想此前的授意下,理想已經(jīng)提前進(jìn)行了內(nèi)部共識(shí)和組織的切換。

效率,是理想智能化超車的重要保障。

回顧歷史,在2021年2月全面自研之前,理想的語音助手還需要依賴思必馳、地平線、大象聲科等供應(yīng)商來支撐,甚至“用戶數(shù)據(jù)”都還握在別人手中。從傳統(tǒng)的AI助手到大模型時(shí)代下的智能體,理想通過“理想同學(xué)”,實(shí)現(xiàn)了一次座艙“自我革命”的重建。

擺脫供應(yīng)商,組建初始團(tuán)隊(duì)

2020年,在交付一萬輛車一個(gè)月后,理想汽車在美股上市。理想希望通過建立和完善自研能力,盡快追趕上競(jìng)爭(zhēng)對(duì)手小鵬。然而,理想汽車內(nèi)部算法團(tuán)隊(duì)和供應(yīng)商的博弈中處于劣勢(shì)。這讓李想敏感地意識(shí)到,如果沒有自研能力,就會(huì)一直被牽制。

全面啟動(dòng)自研之前,理想的座艙技術(shù)“一窮二白”,更多依賴供應(yīng)商,例如思必馳的語音識(shí)別、大象聲科的聽覺算法、虹軟的視覺能力等等。座艙方面還沒有明確的路線圖,團(tuán)隊(duì)如何建設(shè)、產(chǎn)品如何定義、技術(shù)路線怎么走,沒有一個(gè)清晰的結(jié)論。

語音助手自研的任務(wù),落在了座艙部門的空間AI團(tuán)隊(duì)身上。

2021年底,李想在智能空間大部門的戰(zhàn)略會(huì)上,明確智能空間與AI相關(guān)的全部算法都要自研,之前底層算法依賴于供應(yīng)商的局面必須被打破。與此同時(shí),理想內(nèi)部正在力推兩件事情:一個(gè)是IPD流程,將所有人的工作綁定在流程上;二是推動(dòng)研發(fā)平臺(tái)的建設(shè)。

理想的座艙平臺(tái)化策略是通過SS1、SS2、SS3、SS4等不同平臺(tái)來實(shí)現(xiàn),每個(gè)平臺(tái)基本上對(duì)應(yīng)一款車型。由于理想的車型設(shè)計(jì)相似,結(jié)構(gòu)上也相對(duì)可控。對(duì)于研發(fā)團(tuán)隊(duì)而言,最具挑戰(zhàn)性的是麥克風(fēng)和攝像頭傳感器的布局,這些布局直接影響算法的開發(fā)。因此,標(biāo)準(zhǔn)化的配置單,只會(huì)有“一份菜單”,避免了定制化的資源消耗。

原本,勾曉菲規(guī)劃用兩年時(shí)間完成自研,但這將會(huì)落后于理想新車的發(fā)布節(jié)奏。

「理想同學(xué)」的進(jìn)化史:從AI助手到智能體的自研之路

(勾曉菲)

2022年,理想汽車計(jì)劃只發(fā)布一款L9,到2023年L9、L8、L7系列車型同時(shí)上市。如果兩年后才切回自研,理想可能會(huì)錯(cuò)失市場(chǎng)機(jī)會(huì)。在無法預(yù)知蔚來、小鵬、華為等對(duì)手迭代速度的情況下,切換供應(yīng)商的進(jìn)程被縮短到了一年。

2022年的前半年內(nèi),從搜狗加入的陳偉負(fù)責(zé)組建空間AI團(tuán)隊(duì),成員既有來自搜狗的老同事,也有百度、快手、字節(jié)、阿里達(dá)摩院等互聯(lián)網(wǎng)大廠成員。

與搜狗等互聯(lián)網(wǎng)公司相比,理想仍沒脫離車企的“草莽”氣質(zhì)——沒有架設(shè)云端服務(wù)器,甚至連基本的工作站也沒有,用戶的數(shù)據(jù)全在語音技術(shù)供應(yīng)商思必馳手中。

團(tuán)隊(duì)要做的第一件事,就是將數(shù)據(jù)所有權(quán)拿回,并在公司內(nèi)部架設(shè)服務(wù)器,開始自己存儲(chǔ)數(shù)據(jù)。

與此同時(shí),由于成員背景多元,團(tuán)隊(duì)需要明確未來的發(fā)展方向,迅速提升這支團(tuán)隊(duì)的戰(zhàn)斗力,只能專注于主線任務(wù)。有座艙AI同事張江回憶:“我們得到的目標(biāo)是全力專注于自研,效果要比供應(yīng)商好30%。”

其次,在團(tuán)隊(duì)沒有成型時(shí),空間AI團(tuán)隊(duì)全部實(shí)行扁平化管理,確保信息溝通足夠迅速。要打破從大廠可能帶來的部門墻思維,通過流程和制度的變化來解決協(xié)作問題,讓更多人快速融入團(tuán)隊(duì)。

理想所有的高層,都對(duì)座艙的推進(jìn)保持了高度關(guān)注。座艙自研之初,空間AI團(tuán)隊(duì)設(shè)想的一種發(fā)展路徑是,未來一到兩年內(nèi),讓理想同學(xué)的AI能力可以覆蓋車、門店、客服等等場(chǎng)景。

但據(jù)另一位理想座艙員工孫浩回憶,有一次李想?yún)⒓恿俗搱F(tuán)隊(duì)的LSA戰(zhàn)略分析會(huì)。會(huì)后,李想給了一個(gè)結(jié)論:不要把目前已經(jīng)成熟的方案重做一遍。

“智能客服這種事,值不值得做,如果你能花錢買過來,你就去買,你不要再讓團(tuán)隊(duì)再去支撐這樣業(yè)務(wù)。我們這個(gè)團(tuán)隊(duì)是把理想同學(xué)的產(chǎn)品力度做好,解決車內(nèi)交互的問題?!?/p>

空間AI團(tuán)隊(duì)的任務(wù)變得更加聚焦——做好“理想同學(xué)”。

完成資源切換后,成果很快顯現(xiàn)。與供應(yīng)商方案相比,自研技術(shù)的車內(nèi)表現(xiàn)有了實(shí)質(zhì)性的突破,用戶能感受到語音控制的便捷性得到了顯著提升,交互體驗(yàn)變得更流暢自然。

2022年11月,空間AI團(tuán)隊(duì)首次在理想ONE車型上完成了自研語音的落地。

等到理想L7首發(fā)的時(shí)候,搭載其上的語音和視覺功能已經(jīng)全部是自研技術(shù)。2023年上半年,理想基本完成了座艙自研技術(shù)的切換,徹底擺脫對(duì)外部供應(yīng)商的依賴。

ChatGPT來了

2022年底,科技圈最大的一件事是,ChatGPT來了。

理想座艙團(tuán)隊(duì)此前進(jìn)行了一些預(yù)訓(xùn)練工作,對(duì)大模型的到來有預(yù)判,但沒想到模型能發(fā)展到如此大的規(guī)模。當(dāng)時(shí),座艙的自研技術(shù)切換還沒有完成,OpenAI還是實(shí)行閉源,沒有人知道大模型應(yīng)該怎么做。

在大模型出現(xiàn)前,語音交互主要是命令式或任務(wù)型的,行業(yè)競(jìng)爭(zhēng)更多集中在語音識(shí)別的速度、執(zhí)行的準(zhǔn)確性和響應(yīng)效率上。但那時(shí)候的AI助手認(rèn)知能力仍然不足,尤其在復(fù)雜任務(wù)理解、知識(shí)問答、開放式對(duì)話上存在局限,這也制約了理想同學(xué)的產(chǎn)品力。

李想把座艙團(tuán)隊(duì)的高管叫上開會(huì),他給了一個(gè)自己的結(jié)論:ChatGPT對(duì)產(chǎn)業(yè)影響是摧枯拉朽的,所有人都在關(guān)注AI助手的語音識(shí)別速度、靈敏度和準(zhǔn)確率,但這種東西永遠(yuǎn)卷不出來。從用戶體驗(yàn)的角度來看,沒有大模型的加持,這些指標(biāo)只是低維度的競(jìng)爭(zhēng)。

李想說,“AI助手的核心問題就是‘笨’,不做大模型怎么解決笨的問題?”

從這個(gè)時(shí)候開始,AI成為李想提及最高頻的詞之一。兩個(gè)月后,理想對(duì)內(nèi)宣布,理想的愿景是“2030年,成為全球領(lǐng)先的人工智能企業(yè)”。雖然這一愿景后續(xù)有所變化,但理想汽車已經(jīng)不再局限于“車企”的定位。

此時(shí),大模型與座艙空間如何結(jié)合、解決什么問題,沒有任何可參考的樣本,需要座艙團(tuán)隊(duì)自己從頭摸索。

可這不影響李想對(duì)大模型堅(jiān)決的態(tài)度,他甚至要求下屬們參與“對(duì)賭”,還要講明白可以如何利用大模型滿足用戶,以及明確的交付時(shí)間點(diǎn)。

最終,理想座艙團(tuán)隊(duì)提出了一個(gè)大模型上車的路線圖。

當(dāng)時(shí),所有人都沒有完全清楚這應(yīng)該被稱為“智能體”,但團(tuán)隊(duì)已經(jīng)認(rèn)為大模型是一種形態(tài)——作為大腦,可以連接各種工具和記憶、行動(dòng)的組件。

2023年4月,座艙團(tuán)隊(duì)向李想進(jìn)行了一次匯報(bào),并為它起好了名字--Mind GPT。兩個(gè)月之后,理想的空間AI團(tuán)隊(duì)就交出了第一個(gè)版本——6月7日,家庭科技日活動(dòng)上,李想對(duì)外證實(shí)了大模型MindGPT的存在。

代表理想進(jìn)行分享的是空間AI負(fù)責(zé)人陳偉。

「理想同學(xué)」的進(jìn)化史:從AI助手到智能體的自研之路

(陳偉)

他表示,Mind GPT使用了1.3萬億token,進(jìn)行基座模型訓(xùn)練,這相當(dāng)于它具備了人類高質(zhì)量知識(shí)的總和。當(dāng)時(shí),理想已經(jīng)基本確定了場(chǎng)景,主要集中在出行娛樂、用車以及兒童教育,仍然是圍繞家庭用戶的需求做文章。

這些需求在內(nèi)部被稱為“三助一師”,涵蓋了用戶用車助手、出行助手、娛樂助手及百科老師四個(gè)角色,理想甚至為這個(gè)新名詞注冊(cè)了多個(gè)商標(biāo)。

后來,空間AI團(tuán)隊(duì)又定下了2023年底大模型上車的新目標(biāo)。整個(gè)團(tuán)隊(duì)不僅要完成從0到1的大模型全鏈路技術(shù)突破,更要從0到1完成將大模型賦能給理想同學(xué)。

留給空間AI團(tuán)隊(duì)的時(shí)間只有6個(gè)月,這個(gè)目標(biāo)的難度非常大。

過去,空間AI團(tuán)隊(duì)成員主要擅長(zhǎng)開發(fā)功能單一、目標(biāo)明確的小模型,現(xiàn)在卻要轉(zhuǎn)向研發(fā)功能復(fù)雜、需求不斷升級(jí)的大模型,并最終部署到汽車上,這本身就極具挑戰(zhàn)。更何況,當(dāng)時(shí)的開源資源并不充足。

大模型時(shí)代不僅技術(shù)門檻高,其協(xié)作方式也發(fā)生了根本變化。整個(gè)研發(fā)流程涉及預(yù)訓(xùn)練、后訓(xùn)練、評(píng)估等多個(gè)環(huán)節(jié),需要訓(xùn)練、數(shù)據(jù)、底層工程等多方面能力的緊密協(xié)作,如何合理切割階段成為關(guān)鍵,切得太細(xì)協(xié)作低效,太粗人力不足傳統(tǒng)的“擊鼓傳花”式研發(fā)邏輯,每增加環(huán)節(jié)就導(dǎo)致效率下降和不可控性的上升。

這意味著,座艙AI團(tuán)隊(duì)需要圍繞大模型重新定義關(guān)鍵崗位和角色,摒棄過去習(xí)慣的傳統(tǒng)互聯(lián)網(wǎng)大廠研發(fā)路徑,在同時(shí)推進(jìn)大模型基座、訓(xùn)練算法研發(fā)的同時(shí),確保產(chǎn)品在各類車載場(chǎng)景下的體驗(yàn)。

這不僅要解決算法的準(zhǔn)確性問題,還需兼顧工程的執(zhí)行效率等現(xiàn)實(shí)因素。

幾乎每周,理想都會(huì)對(duì)Mind GPT進(jìn)行一次版本迭代,并同步集成到“理想同學(xué)”中進(jìn)行升級(jí),涉及與已有模塊的聯(lián)動(dòng)和新策略的聯(lián)調(diào)。為了確保每次升級(jí)都能帶來體驗(yàn)穩(wěn)定提升,上線之前團(tuán)隊(duì)都需要進(jìn)行人工標(biāo)注和測(cè)試驗(yàn)證。

據(jù)理想座艙團(tuán)隊(duì)的張棟回憶,“李想是一個(gè)非常愿意給資源的人。2023年,李想經(jīng)常要求座艙AI團(tuán)隊(duì)大膽提出資源或者算力的需求。預(yù)算上直接批了三四千張卡(芯片)的資源,團(tuán)隊(duì)累計(jì)擁有近八千張卡?!?/p>

事實(shí)上,自研意味著要工作始終比行業(yè)快半步,甚至是一步。

2023年9月,座艙AI團(tuán)隊(duì)還推出“方言自由說”功能。更令團(tuán)隊(duì)感到興奮的是,多模態(tài)互動(dòng)的落地,讓手勢(shì)控制進(jìn)入座艙成為可能。在車內(nèi),用戶只需隨手一指,就能輕松控制車窗、空調(diào)、燈光甚至影音娛樂。

2023年底,Mind GPT隨著OTA 5.0版本更新成功“上車”,并通過國(guó)家大模型備案,是較早實(shí)際應(yīng)用于車端的大語言模型之一。在Mind GPT加持之下,理想同學(xué)能夠理解更為復(fù)雜的功能組合,用戶交互更自然。

通向未來的AI世界

2024年1月,理想成立了AI委員會(huì),由謝炎負(fù)責(zé)。

這個(gè)委員會(huì)里,包括產(chǎn)品部和各個(gè)研發(fā)部門的負(fù)責(zé)人及主要人員,目的是對(duì)未來的技術(shù)路線進(jìn)行評(píng)審和判斷,以及對(duì)技術(shù)投資進(jìn)行決策。

比如,決定是否在某個(gè)項(xiàng)目上立項(xiàng)。理想有一個(gè)面向研究的RD預(yù)算池,這個(gè)池子的資金分配,很大程度上就由技術(shù)委員會(huì)進(jìn)行技術(shù)評(píng)審。

2024春季發(fā)布會(huì)上,理想推出首款純電車型MEGA;一個(gè)月后,公司啟動(dòng)組織升級(jí),CEO辦公室改名“產(chǎn)品與戰(zhàn)略群組”,設(shè)立產(chǎn)品線和質(zhì)量運(yùn)營(yíng)兩個(gè)新部門。

這些變化都只為了AGI(通用人工智能)進(jìn)入李想認(rèn)為的“iPhone 4時(shí)刻”。

李想曾將OpenAI定義的聊天機(jī)器人認(rèn)為是第一階段,第二階段是推理者,而進(jìn)入上述時(shí)刻的第三階段是出現(xiàn)Agent,理想要做的就是將汽車作為載體實(shí)現(xiàn)AGI的Agent階段。

這也意味著,理想需要突破更底層的技術(shù)。

2024年10月,理想秋季戰(zhàn)略會(huì)上,車機(jī)端的理想同學(xué)的業(yè)務(wù)優(yōu)先級(jí)由最高降低兩級(jí),陳偉在2025年初被調(diào)任基座模型部門負(fù)責(zé)人,主導(dǎo)基座模型自研。

基座模型是蔚小理等新勢(shì)力爭(zhēng)奪AI時(shí)代的一張門票。今年4月,小鵬智駕負(fù)責(zé)人李力耘曾表示,小鵬目前已經(jīng)著手推進(jìn)72B超大規(guī)模參數(shù)世界基座模型的研發(fā)。

理想也不甘人后。今年3月,理想在英偉達(dá)2025春季GTC大會(huì)上宣布,在車端部署了參數(shù)為 22 億的 MindVLA大模型(Vision-Language-Action Model,視覺-語言-動(dòng)作模型)。

據(jù)基座團(tuán)隊(duì)向雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))反饋,內(nèi)部不會(huì)追求一個(gè)超大規(guī)模的基座,要結(jié)合投入產(chǎn)出比以及場(chǎng)景結(jié)合度。(后續(xù),雷峰網(wǎng)還將推出理想端到端、基座模型、芯片等自研話題,感興趣的讀者可添加編輯微信 Gru1993 互通有無)

過去的三年時(shí)間里,承擔(dān)理想基礎(chǔ)性技術(shù)研發(fā)工作的人是理想CTO謝炎。

加入理想前,謝炎曾在華為工作三年,期間升任消費(fèi)者BG軟件部副總裁、終端OS部部長(zhǎng),他還曾作為AliOS首席架構(gòu)師在阿里巴巴工作五年。與更側(cè)重產(chǎn)品的勾曉菲不同,謝炎將精力主要放在基礎(chǔ)設(shè)施和底層技術(shù)的研發(fā)上。

謝炎曾對(duì)他人表示,自己70%的時(shí)間都在操作系統(tǒng)和自研芯片。

2025年4月16日,理想汽車正式宣布開源理想星環(huán)OS,成為全球首家開源整車操作系統(tǒng)的車企。李想在微博上表示,開源的理想星環(huán)OS可以幫助任何一個(gè)品牌每年節(jié)省千萬甚至上億的成本。

目前來看,理想要重點(diǎn)打造兩款人工智能產(chǎn)品,理想同學(xué)用以實(shí)現(xiàn)Agent和自動(dòng)駕駛用以實(shí)現(xiàn)L4級(jí)別的自動(dòng)駕駛,并且基座模型發(fā)展到最后階段會(huì)融合成VLA模型。因此,基座模型被理想高層寄予了更高的期待。

在李想看來,車將從工業(yè)時(shí)代的交通工具,進(jìn)化成為AI時(shí)代的空間機(jī)器人。

從2021年決定自研起,從智能駕駛到理想同學(xué),所有的一切工作都是指向了未來的AI世界。(注:文中的張江、孫浩、張棟等皆為化名。)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說