0
| 本文作者: 劉欣 | 2025-12-12 14:16 |
每晚 10 點(diǎn),城市漸入靜謐,英諾天使基金 ED 王建明的 “專屬寫作時(shí)間” 才剛剛開啟;周末的時(shí)光,也早已被她固定分配給了采訪與寫作。
這份堅(jiān)持,源于一直在堅(jiān)持做的 “石麻筆記”,最初她只是想隨手記錄工作中接觸的技術(shù)信息,未曾想,石麻筆記受到了越來越多業(yè)內(nèi)人士的關(guān)注,也在潛移默化中改變著她對機(jī)器人行業(yè)的認(rèn)知。
早在具身智能成為資本熱詞之前,英諾王建明就已經(jīng)踏入機(jī)器人賽道。據(jù)科技產(chǎn)業(yè)投資平臺(tái)華芯資本統(tǒng)計(jì),在一級市場,2025 年前七個(gè)月,具身智能行業(yè)總?cè)谫Y金額超過 300 億元,在 2024 年上半年,這個(gè)數(shù)字還只是 75 億元。資本狂歡的背后,卻難掩數(shù)據(jù)困境。
從 2017 年到現(xiàn)在的 2025 年,她幾乎見證了這個(gè)行業(yè)從默默無聞到名揚(yáng)世界,也比任何人都清楚,若數(shù)據(jù)難題不解決,再高的融資額也難以支撐行業(yè)走得長遠(yuǎn)。
英諾王建明坦言:“機(jī)器人的數(shù)據(jù)問題如果不被解決的話,具身行業(yè)用現(xiàn)在的范式不一定做得通?!?/p>
以下是 AI 科技評論與王建明的對話,AI 科技評論對其進(jìn)行了不改原意的編輯:
01 只是想要記錄而已
AI科技評論:最開始做石麻筆記有遇到困難嗎?怎么解決的?
王建明:沒遇到什么困難,因?yàn)榉浅kS性,叫“筆記”其實(shí)就是因?yàn)檫@只是工作或?qū)W習(xí)過程的記錄,沒有什么期待,所以沒有什么困難。
AI科技評論:有給自己規(guī)定訪談or寫作計(jì)劃嗎?
王建明:沒有,完全是隨性隨機(jī)的,我自己有空并且是感興趣的話題就會(huì)想一下,寫一下。
AI科技評論:石麻筆記的文章既有專業(yè)深度又能讓技術(shù)小白看懂,您是怎么把握這個(gè)平衡的?
王建明:我會(huì)從我看論文所產(chǎn)生的問題去發(fā)問,因?yàn)槲易约阂膊皇菍W(xué)術(shù)背景,也不會(huì)問非常專業(yè)的問題,而是從比較容易理解這個(gè)工作的點(diǎn)來問的,所以問題比較通俗,受訪者的回答也會(huì)比較照顧我,會(huì)簡單的解釋一些專業(yè)問題,因此寫出來的內(nèi)容對于非技術(shù)背景也比較容易消化。
AI科技評論:為什么從投資人來做石麻日記呢?這其中的心路歷程是怎么樣的?
王建明:其實(shí)我在關(guān)注具身智能之前就已經(jīng)在寫石麻筆記了,我一直會(huì)對自己看的方向進(jìn)行梳理,比如看SAAS的時(shí)候就會(huì)有一些技術(shù)向的東西也會(huì)記錄下來,所以機(jī)器人的核心點(diǎn)也會(huì)梳理,比如具身智能的脈絡(luò)、機(jī)器人創(chuàng)業(yè)者的聚集地、還比如很多打過機(jī)器人比賽的創(chuàng)業(yè)者,誰先把工作做出來,這個(gè)也需要梳理。
具身是一個(gè)比較前沿的技術(shù),技術(shù)的擁有者大部分都在學(xué)術(shù)圈。而且技術(shù)一般都有多個(gè)技術(shù)路徑,每個(gè)技術(shù)路徑上都有一些階段性的突破,在梳理的過程中也會(huì)比較關(guān)注當(dāng)下的技術(shù)突破,對一些有影響力的論文去做一些科普采訪。
我不是學(xué)術(shù)背景,同時(shí)對具身又很感興趣,很好奇落地邊界在哪里?離落地的距離有多遠(yuǎn)?技術(shù)所創(chuàng)造的價(jià)值是什么?從這個(gè)角度去跟有影響力的老師做一些訪談,將論文以通俗的方式解釋出來、科普出來。而且也能跟作者建立一些聯(lián)系,很多技術(shù)創(chuàng)新的創(chuàng)業(yè)者都是來自學(xué)術(shù)圈,建立了這些聯(lián)系,也方便后續(xù)去跟進(jìn)他們的創(chuàng)業(yè)項(xiàng)目。
AI科技評論:做石麻筆記的過程中,有沒有哪些具身的行業(yè)觀點(diǎn)或認(rèn)知,是通過訪談和寫作后發(fā)生顛覆式改變的?
王建明:石麻筆記我一直是業(yè)余時(shí)間做的,一般是晚上 10 點(diǎn)之后和周末的時(shí)間點(diǎn)來整理或者采訪。
之所以一直持續(xù)去做的原因就在于,它在持續(xù)地改變我對于這個(gè)行業(yè)的一些認(rèn)知,這個(gè)改變是潛移默化的,不是說我采訪了某一篇工作直接就對整個(gè)行業(yè)的認(rèn)知就改變了,而是每一次的采訪、每一篇文章的梳理都會(huì)慢慢改變我對這個(gè)行業(yè)的一些認(rèn)知,尤其是對前沿方向的判斷。
AI科技評論:有沒有什么投的項(xiàng)目體現(xiàn)出來了慢慢改變的認(rèn)知呢?
王建明:現(xiàn)階段的一些交流不一定能夠通過投資體現(xiàn)出來這個(gè)認(rèn)知的價(jià)值,但通過時(shí)間的慢慢積累我相信是可以體現(xiàn)出來的,因?yàn)橥顿Y本身就是一個(gè)長周期的閉環(huán)驗(yàn)證,而且現(xiàn)在具身智能處于一個(gè)泡沫之中,不管是什么樣的項(xiàng)目都可以有一個(gè)比較好的融資,這意味著我通過自己的訪談過程中積累出來的對技術(shù)路徑或商業(yè)模式的認(rèn)知判斷,可以篩選出我自己愿意推進(jìn)的項(xiàng)目和不愿意推進(jìn)的項(xiàng)目。
雖然可能不愿意推進(jìn)的項(xiàng)目也會(huì)有一個(gè)好的表現(xiàn),但這個(gè)事情可以拉長到終局來看,現(xiàn)在付出的努力和時(shí)間是不會(huì)白費(fèi)的。其實(shí)我跟很多行業(yè)人士交流的時(shí)候,大家都有有一些小范圍的共識(shí),這些共識(shí)不見得每一個(gè)投資人都有,這就是在交流過程中的認(rèn)知差異,所以這些訪談對我的幫助是非常大的。
AI科技評論:您覺得作為投資人和作為采訪者這兩個(gè)身份面對交談的對象的側(cè)重點(diǎn)有什么不同嗎?
王建明:作為采訪者,主要的側(cè)重點(diǎn)其實(shí)是針對于論文本身,我會(huì)想為什么會(huì)往這個(gè)方向去做,這個(gè)方向肯定有自己的一些局限性或者過往工作沒有解決好的問題,相當(dāng)于這個(gè)工作的起因。還會(huì)側(cè)重于工作中會(huì)用到的一些方法,在方法上有一些比較大的創(chuàng)新,或者另一些工作會(huì)沿用核心的思想和方法,比如石麻筆記的 Human Data 系列,很多都是在 DeepMimic 這一套思想的基礎(chǔ)上進(jìn)行微創(chuàng)新。
另外是這個(gè)方法能解決什么現(xiàn)實(shí)問題,比如去年采訪的 UMI 的工作,它從硬件的結(jié)構(gòu)去做相對應(yīng)的方法,雖然沒那么難,但提出了一個(gè)很好的解決數(shù)據(jù)采集的方法,可以真的解決行業(yè)內(nèi)的某個(gè)問題,雖然可能早一點(diǎn)、晚一點(diǎn)都會(huì)被人提出來,但他們就是第一個(gè)提出來的,利用手持夾爪的末端軌跡來訓(xùn)練機(jī)器人,既可以很方便的解決真機(jī)末端執(zhí)行器的數(shù)據(jù)稀缺問題,又在最終應(yīng)用角度對行業(yè)有巨大貢獻(xiàn)。
而投資人訪談,我所在的投資機(jī)構(gòu)英諾天使基金主要是投早期,所以我們的訪談核心是圍繞著人的背景,創(chuàng)始人對創(chuàng)業(yè)這件事的理解,他為什么想現(xiàn)在這個(gè)時(shí)間點(diǎn)創(chuàng)業(yè)以及他看到的機(jī)會(huì)是什么等等這些方面去了解。
AI科技評論:您是屬于比較早期就深耕在具身智能賽道的投資人了,對吧?
王建明:我看機(jī)器人時(shí)間比較久了,2017 年就在看機(jī)器人這個(gè)方向了。
AI科技評論:那您這么多年看下來感覺有什么變化嗎?或者是您自己心態(tài)有什么變化嗎?
王建明:我自己對于機(jī)器人的理解是有基于前一波的機(jī)器人的投資和觀察的,這個(gè)經(jīng)驗(yàn)對于現(xiàn)在去看機(jī)器人也會(huì)有一些指導(dǎo)。
現(xiàn)在的具身智能,也需要借助機(jī)器人的外殼去實(shí)現(xiàn)它的 AI 能力,再從最終交付的產(chǎn)品上來說,也無外乎是一個(gè)機(jī)器人的產(chǎn)品。
AI科技評論:軟硬解耦可行嗎?
王建明:我其實(shí)不那么相信只需要做機(jī)器人的系統(tǒng)和軟件,我覺得能夠真正的把機(jī)器人做好的,一定是同時(shí)具備硬件的能力、系統(tǒng)的能力、軟件的能力以及算法的能力的公司。
如果是從最終應(yīng)用的角度來說,現(xiàn)階段需要去考慮的是解決行業(yè)痛點(diǎn),其中硬件就是一個(gè)很大的卡點(diǎn)。硬件涉及到本體和上游的零部件,那上游的零部件從終局的角度來說,它真正的核心的價(jià)值點(diǎn)又在哪里?其實(shí)也不僅僅限于在關(guān)節(jié)模組本身,那可能是更上游的一些零部件的真正突破。
另外在系統(tǒng)層面,更多的是嫁接軟件和硬件,現(xiàn)在有很多單純做算法的一些團(tuán)隊(duì),但我個(gè)人不會(huì)覺得單純做算法能夠把整個(gè)機(jī)器人系統(tǒng)做好,因?yàn)樗x硬件和最終的產(chǎn)品距離有點(diǎn)遠(yuǎn)。機(jī)器人系統(tǒng)其實(shí)就是鏈接軟件和硬件的,必須要有很好的對硬件的理解、硬件的適配,以及很好的算法能力,互相需要密集的互動(dòng),最終才能夠把整個(gè)機(jī)器人系統(tǒng)做到完美。所以我對于軟硬解耦這件事情沒那么相信,尤其是一些單純做算法的公司。
AI科技評論:您目前有在看什么具身項(xiàng)目嗎?
王建明:今年其實(shí)是投了不少項(xiàng)目,我一般會(huì)階段性的去找側(cè)重的方向看,比如 23 年就會(huì)重點(diǎn)看一些擁有好的學(xué)術(shù)背景的人,以及用 Robot learning 的方式來做機(jī)器人控制,尤其是能夠做機(jī)器人基座模型的那類公司,23年我當(dāng)時(shí)聊了很多第一輪的公司現(xiàn)在漲得都非常好。
到了 24 年就會(huì)側(cè)重去看有應(yīng)用能力的公司;到了今年關(guān)注點(diǎn)則回到了雙足人形的一些工作,可以看到我今年一整年的工作都是跟雙足人形相關(guān)的。
雖然存在著一些隨機(jī)性,但我認(rèn)為最核心的點(diǎn)是因?yàn)榫呱硇袠I(yè)的數(shù)據(jù)問題越來越嚴(yán)重,怎么去解決數(shù)據(jù)問題變得異常的迫切。所以我現(xiàn)在比較關(guān)注怎么利用現(xiàn)成的數(shù)據(jù)也就是人的數(shù)據(jù) Human Data 去解決這個(gè)問題,過程中遇到的鴻溝能否用什么數(shù)據(jù)或方法去彌合。
AI科技評論:您主要關(guān)注具身創(chuàng)始團(tuán)隊(duì)的哪些方面?
王建明:像我們做早期,維度首先主要是看這個(gè)人本身,他作為創(chuàng)業(yè)者的一些素質(zhì)和他自己內(nèi)心深處的關(guān)于創(chuàng)業(yè)這件事情的一些想法。第二點(diǎn)是他現(xiàn)在選的這個(gè)方向,通過跟他溝通為什么要做這個(gè)方向,來去了解他自己思考問題的過程。第三點(diǎn)是創(chuàng)始人他過往的背景,現(xiàn)在想做的這個(gè)事情有沒有足夠的支撐。最后是他想做的這個(gè)事情他怎么去做,是不是和我的認(rèn)知有共鳴,或者我能不能被他說服。
AI科技評論:在具身智能領(lǐng)域,您是怎么判斷哪些是好的項(xiàng)目?
王建明:具身智能現(xiàn)在還太早期了,太技術(shù)向了,對于很多標(biāo)的篩選是需要有一些技術(shù)方向的預(yù)判,不太像單純做一個(gè)很成熟的技術(shù)路徑下的產(chǎn)品創(chuàng)新的項(xiàng)目,這個(gè)就更多看執(zhí)行力。而具身智能需要有一些你對于技術(shù)路徑的預(yù)判,然后去篩選你認(rèn)為可能對這個(gè)行業(yè)的發(fā)展有核心推動(dòng)力的一些項(xiàng)目,大家把這些問題都逐步解決的過程中,才有落地的可能性。
其實(shí)現(xiàn)在具身智能的創(chuàng)業(yè)者都是有很好的背景,我們常常會(huì)篩選的眼花繚亂,至少我自己在內(nèi)部推進(jìn)項(xiàng)目的一個(gè)核心點(diǎn)就是,他在這個(gè)階段或者未來兩三年之內(nèi)會(huì)不會(huì)成為這個(gè)行業(yè)的突破圈,或者是進(jìn)一步往前去推動(dòng)的一個(gè)核心價(jià)值貢獻(xiàn)者。
如果是的話,我會(huì)比較愿意去推動(dòng),如果不是的話,可能相對來說就沒有那么愿意推動(dòng)。每一個(gè)人去篩選哪些項(xiàng)目要去推動(dòng)都有自己的標(biāo)準(zhǔn),可能其他的人會(huì)有另外的一些思考,尤其現(xiàn)在有很多很好背景的人去做具身的創(chuàng)業(yè),如果沒有自己的一個(gè)標(biāo)準(zhǔn)的話,很容易篩選的眼花繚亂。
AI科技評論:現(xiàn)在具身智能很多家企業(yè)都宣布自己有落地場景,就您個(gè)人觀察而言,現(xiàn)在具身智能的落地的實(shí)際情況究竟是怎么樣的呢?
王建明:落地的實(shí)際情況是應(yīng)該還沒有什么落地。如果落地是說機(jī)器人可以做一些演出之類的,它是有落地的。但如果是從我們生活中問題的解決來看,其實(shí)現(xiàn)在的機(jī)器人并沒有解決,至少我們在生活中沒有看到任何的具身智能機(jī)器人。
像公司樓下半身倒咖啡的機(jī)器人,它也不是具身智能機(jī)器人,只是用傳統(tǒng)的控制方式來去做的機(jī)器人。那個(gè)很早就有了,我們之前投過的鎂伽機(jī)器人,他們就有這個(gè)產(chǎn)品。
02 資本寒冬或許還沒那么快
AI科技評論:今年具身智能領(lǐng)域它的投融額遠(yuǎn)遠(yuǎn)超于去年,這背后的原因是什么呢?
王建明:首先是因?yàn)?23 年成立的第一波公司,已經(jīng)到了相當(dāng)高的一個(gè)估值,所以資金量的需求就會(huì)大很多。其次是因?yàn)槭忻嫔嫌殖霈F(xiàn)了很多新公司。
很多人沒有想到,這個(gè)賽道的火熱從 2023 年上半年開始一直延續(xù)到了今年下半年,持續(xù)了三年的時(shí)間。每到年末,大家就開始覺得這個(gè)賽道會(huì)變,比如今年很多人就說,明年年初或者明年上半年這個(gè)賽道可能會(huì)變。
這個(gè)賽道有很多刺激因素,比如我們階段性地看到了很多海外公司很厲害的突破或進(jìn)展,或者一些政策性的刺激,也能看到聽到 Elon Musk 之類的大佬他們對這個(gè)賽道的一些預(yù)判,這些都會(huì)形成刺激,而且這些刺激是一波一波的來,每一次刺激都比上一次來來得更強(qiáng)烈一些。刺激因素一直在的話,大家就一直會(huì)敢投,而且今年也確實(shí)看到了一些進(jìn)展。
AI科技評論:今年具身方面的投資特別火熱,經(jīng)常出現(xiàn)搶項(xiàng)目高估值的情況,這種情況會(huì)不會(huì)給你們判斷投資帶來困難?
王建明:肯定是會(huì)的,核心的點(diǎn)就在于,在投資的時(shí)候會(huì)面臨一些泡沫,本來這個(gè)項(xiàng)目不用那么貴,但因?yàn)橛腥藸帗專怨乐稻蜁?huì)高一點(diǎn)。
今年我有一個(gè)普遍的感覺,本來 2023 年當(dāng)時(shí)的很多項(xiàng)目的第一輪是在兩個(gè)億人民幣左右,今年好一點(diǎn)的具身智能公司,第一輪基本上都是 5 個(gè)億人民幣了。其實(shí)這些項(xiàng)目回到 23 年,估計(jì)可能也是兩個(gè)億人民幣,能感覺到估值的溢價(jià)。
AI科技評論:好多人都說明年具身智能就會(huì)遭遇資本寒冬了。
王建明:好像去年就有聽到,到了 25 年,可能具身智能賽道就會(huì)轉(zhuǎn)冷,但實(shí)際上今年又上了一個(gè)高度。投資行業(yè)是一波一波的熱潮,如果按照一個(gè)正常的行業(yè)來看,會(huì)有一個(gè)周期,大概到了一個(gè)時(shí)間點(diǎn)的頭部形成,整個(gè)賽道就相對來說降溫了。
但是具身智能這個(gè)方向,它的技術(shù)創(chuàng)新性持續(xù)的出現(xiàn),而且本身技術(shù)難度很大,很多個(gè)環(huán)節(jié)是需要有突破的,終極的想象空間又是巨大的,所以整個(gè)賽道的厚度和大家對它的期望值是極限的高,泡沫的生命周期也是意料之外的長。
AI科技評論:也就是說您認(rèn)為明年或者未來兩三年,應(yīng)該還不至于說陷入寒冬?
王建明:我不太會(huì)做這種預(yù)測,但是從今年的觀察來說,依然有大量的非常優(yōu)秀的人,持續(xù)跳到這個(gè)行業(yè)里面來創(chuàng)業(yè),我們是看早期的第一輪,所以能夠發(fā)現(xiàn)持續(xù)有很多項(xiàng)目出來,而且感覺今年好像比往年都多。
AI科技評論:目前進(jìn)入具身賽道還有機(jī)會(huì)嗎?
王建明:任何時(shí)間都不晚,但確實(shí)從融資的角度或者從生態(tài)位的角度來說,要面臨一個(gè)問題:如果要卡一個(gè)比較好的生態(tài)位,這個(gè)時(shí)間點(diǎn)出來感覺是會(huì)有點(diǎn)晚。但是依然可以做一些事情,比如能不能推動(dòng)整個(gè)行業(yè)的核心價(jià)值貢獻(xiàn)?例如數(shù)據(jù)問題。另外,這個(gè)時(shí)間點(diǎn)其實(shí)有很多做細(xì)分應(yīng)用的公司出來的。
AI科技評論:現(xiàn)在有好多投資人都說現(xiàn)在具身里面有很太多泡沫了都不敢投,那您覺得現(xiàn)在還適合投嗎?
王建明:這個(gè)見仁見智,還是得回到篩選項(xiàng)目的標(biāo)準(zhǔn)是什么?如果現(xiàn)階段是能夠解決這個(gè)行業(yè)價(jià)值卡點(diǎn)的一個(gè)事情,那就有意義做。
AI科技評論:現(xiàn)在投資具身智能面臨的最大的風(fēng)險(xiǎn)是什么呢?
王建明:風(fēng)險(xiǎn)和收益是并存的,對個(gè)人來說最大的風(fēng)險(xiǎn)是你投中的公司最終都沒有跑出來,而跑出來的公司你都沒有投中。
整個(gè)行業(yè)的風(fēng)險(xiǎn)是,現(xiàn)在很多成立兩三年的公司也在資本化,從投資人的角度來說,只要他在二級市場上市了,至少階段性的流動(dòng)性就能夠被滿足。只要行業(yè)沒有一下子垮掉,從收益的角度還是可以保證的。所以這也是為什么 23 年出手早、出手猛的投資人其實(shí)是可以賺到第一波收益的。
當(dāng)下確實(shí)太多的公司在這個(gè)行業(yè)里面了,未來不管是從業(yè)務(wù)落地,還是從融資,還是從生態(tài)位各方面來說,都會(huì)有很多挑戰(zhàn)的,這個(gè)時(shí)間不會(huì)是短期的,可能得等這個(gè)賽道的融資遇冷之后,才會(huì)暴露出來問題。
如果拉長周期來看,現(xiàn)在的創(chuàng)業(yè)公司可能最終的成功率是百分之個(gè)位數(shù)的,意味著大多數(shù)公司后面會(huì)掛掉。這就是任何一個(gè)行業(yè)的規(guī)律。百分之個(gè)位數(shù)的數(shù)字,主要是因?yàn)榛鶖?shù)比較大,現(xiàn)在跟具身智能這個(gè)標(biāo)簽相關(guān)的公司,應(yīng)該有幾千家了,而且還會(huì)持續(xù)有新的公司出來。
我們現(xiàn)在相對還處于比較早期,屬于風(fēng)險(xiǎn)點(diǎn)還沒有被暴露出來的時(shí)間。
AI科技評論:機(jī)器人未來的行業(yè)格局可能是怎么樣子的呢?
王建明:行業(yè)格局這個(gè)挺難判斷的,可能會(huì)有很多個(gè)應(yīng)用場景,每一個(gè)應(yīng)用場景可能會(huì)有一些做的比較好的公司。
值得推敲的是為什么在過往的自動(dòng)駕駛行業(yè)和大語言模型行業(yè),中國沒有培養(yǎng)出來相應(yīng)的數(shù)據(jù)公司,可能是因?yàn)橹袊髲S太強(qiáng)了。但是機(jī)器人它暫時(shí)還沒有一個(gè)很明確的終極應(yīng)用場景,誰可以做成比較強(qiáng)的大廠,我們現(xiàn)在還不知道。
另外,不管是 AI 1.0,還是自動(dòng)駕駛,還是大模型,其實(shí)中國都是跟隨者,但是具身智能這個(gè)賽道有可能成為引領(lǐng)者,比如數(shù)據(jù)范式被引領(lǐng)者嘗試出來之后,后來者有一個(gè)成功的路徑可以去參考。所以在具身智能這個(gè)行業(yè)作為引領(lǐng)者是需要在數(shù)據(jù)上做一些引領(lǐng)的。在中游會(huì)有像數(shù)據(jù)公司存在的,也可能會(huì)有一些基礎(chǔ)設(shè)施的公司存在,上游的話可能有很多的硬件的零部件公司。
03 數(shù)據(jù)是目前機(jī)器人領(lǐng)域的核心問題
AI科技評論:現(xiàn)在有一批自動(dòng)駕駛的團(tuán)隊(duì)過來做具身智能,您覺得最后能做成的人會(huì)是他們嗎?
王建明:他們是最接近具身智能的一個(gè)形態(tài),也是一個(gè)物理 AI,也有一個(gè)現(xiàn)實(shí)的載體,所以他們過往的一些經(jīng)驗(yàn)確實(shí)是很值得參考,但是我倒覺得最終能做成功機(jī)器人的還是機(jī)器人行業(yè)內(nèi)的人。
AI科技評論:為什么?
王建明:自動(dòng)駕駛其實(shí)是車廠的生意,終端的形態(tài)是極其之固定的,就是一輛汽車。在終端場景上的電動(dòng)汽車,其實(shí)是產(chǎn)品上的創(chuàng)新,這個(gè)東西跟算法沒關(guān)系,是主機(jī)廠的生意。
回到機(jī)器人的形態(tài),能想象到終極的機(jī)器人形態(tài)是什么嗎?其實(shí)想象不到的。所以這個(gè)過程中需要一個(gè)非常有產(chǎn)品、硬件、結(jié)構(gòu)設(shè)計(jì)天賦的團(tuán)隊(duì)去突破它最終能夠進(jìn)入生活中的形態(tài)的問題。
這有點(diǎn)像當(dāng)年蘋果手機(jī)研發(fā),如果當(dāng)時(shí)沒有蘋果手機(jī)無按鍵的形式,那可能我們現(xiàn)在還在用按鍵手機(jī)。其實(shí)機(jī)器人現(xiàn)在也是差在這個(gè)環(huán)節(jié),機(jī)器人的產(chǎn)品形態(tài)其實(shí)跟自動(dòng)駕駛沒什么關(guān)系,還是需要一個(gè)有著極致產(chǎn)品和結(jié)構(gòu)天賦的人去推動(dòng)。
自動(dòng)駕駛行業(yè)他們有過往的一些經(jīng)驗(yàn),可以告訴具身行業(yè)里面的人要避開的坑是什么?自動(dòng)駕駛對可靠性和安全性的要求是比較高的。但是實(shí)際上機(jī)器人進(jìn)到家庭里面,不管是產(chǎn)品的復(fù)雜度,還是動(dòng)作的維度,還是指令的復(fù)雜度,它對于安全的需求都是遠(yuǎn)遠(yuǎn)高于自動(dòng)駕駛的。
AI科技評論:目前機(jī)器人這個(gè)領(lǐng)域還沒有出現(xiàn)像您剛剛說的那種人嗎?
王建明:我覺得可能有,但是至少從產(chǎn)品層面還沒看到。
AI科技評論:您認(rèn)為現(xiàn)在機(jī)器人的進(jìn)程類比到自動(dòng)駕駛,處于自動(dòng)駕駛的哪個(gè)階段?
王建明:我其實(shí)沒怎么系統(tǒng)地看過自動(dòng)駕駛,如果要類比的話,其實(shí)很多都是固定程序編程,把道路上的很多情況都模擬出來,然后手工的編一些規(guī)則,讓它去遵循這些規(guī)則。
這就跟傳統(tǒng)機(jī)器人差不多。像現(xiàn)在的割草機(jī)、泳池、清洗機(jī)器人,甚至掃地機(jī),它的智能化程度也是夠的,那我覺得這些機(jī)器人是不是可以說成是自動(dòng)駕駛的 L1 和 L2?
現(xiàn)在通用機(jī)器人的技術(shù),其實(shí)在處理剛才說的場景上,可能還趕不上過往的技術(shù)。大家都喜歡去對標(biāo)現(xiàn)在是 Chatgpt.幾的時(shí)間或者自動(dòng)駕駛 L 幾的時(shí)間,我覺得不太能夠去類比,核心還是回到機(jī)器人本身的技術(shù)棧上面,它現(xiàn)在的問題是什么?問題被解決的可能性是什么?
AI科技評論:那機(jī)器人現(xiàn)在最核心的問題是什么?
王建明:核心問題還是數(shù)據(jù),數(shù)據(jù)問題被解決之后,可能又暴露出來其他的問題,比如說模型結(jié)構(gòu)、算法路徑。只是可能匹配到相應(yīng)的數(shù)據(jù)之后,算法路徑也會(huì)更清晰一點(diǎn),在相應(yīng)能成的算法路徑上,判斷模型的框架要不要被修改,有了更合適的模型框架,最終回到解決到這個(gè)行業(yè)的問題,通用任務(wù)的完成度、可靠性。
去做落地的時(shí)候,可能有更多問題。所以整個(gè)環(huán)節(jié)問題有太多了,很難去對標(biāo)到曾經(jīng)的 Chatgpt 級和 L 級,因?yàn)檎麄€(gè)機(jī)器人系統(tǒng)的復(fù)雜度是遠(yuǎn)遠(yuǎn)高于大語言模型和自動(dòng)駕駛的。
AI科技評論:您在機(jī)器人領(lǐng)域深耕了這么久,您能觀察目前相對比較確定的一個(gè)趨勢是什么嗎?
王建明:確定的趨勢是機(jī)器人的數(shù)據(jù)問題如果不被解決的話,具身行業(yè)用現(xiàn)在的范式不一定做得通。
AI科技評論:今年有很多創(chuàng)業(yè)者進(jìn)入了機(jī)器人數(shù)據(jù)這個(gè)賽道,您是怎么看待這個(gè)現(xiàn)象的?這背后有什么原因呢?
王建明:大家是到了一個(gè)節(jié)點(diǎn),認(rèn)為這個(gè)行業(yè)進(jìn)一步推動(dòng)的卡點(diǎn)就在于數(shù)據(jù),所以大家都是要先解決數(shù)據(jù)的這個(gè)問題,解決數(shù)據(jù)問題會(huì)有不同的角度和邏輯。
AI科技評論:如果是創(chuàng)業(yè)公司的話,它聚焦于這個(gè)機(jī)器人數(shù)據(jù)這個(gè)細(xì)分的賽道可行嗎?
王建明:要看他做的數(shù)據(jù)是什么類型的數(shù)據(jù),以及他能夠給客戶提供的數(shù)據(jù)維度是什么。如果它本身提供的數(shù)據(jù)的采集難度很大,而且提供的價(jià)值鏈條不僅僅是采下來的數(shù)據(jù),還涉及到一些算法,甚至涉及到模型層的一些東西,那這個(gè)東西的價(jià)值貢獻(xiàn)還蠻大的。
AI科技評論:中國好像沒怎么聽到數(shù)據(jù)公司。
王建明:從商業(yè)模式的角度來說,大家都會(huì)質(zhì)疑在中國會(huì)不會(huì)有數(shù)據(jù)的生意的模式存在,因?yàn)檫^往并沒有很成功的數(shù)據(jù)公司。但是如果不從這個(gè)維度思考,而是從具身智能本身行業(yè)的卡點(diǎn)來思考的話,那數(shù)據(jù)這個(gè)問題它值不值得被解決?并且解決這個(gè)問題的公司是不是有一個(gè)商業(yè)生態(tài)位?從這個(gè)角度去思考,答案是肯定的。
AI科技評論:數(shù)據(jù)的采集路徑有哪些?壁壘高嗎?
王建明:可以想象一下未來的機(jī)器人行業(yè),它跟自動(dòng)駕駛和現(xiàn)在的大模型都不一樣。自動(dòng)駕駛它的數(shù)據(jù)生產(chǎn)的過程是可以強(qiáng)烈的依靠在本體上面的,這個(gè)也是為什么像去年 VLA 很火的時(shí)候,大家是用模仿學(xué)習(xí),所以大家會(huì)覺得我反正有大量的本體,把本體布出去,通過本體來采數(shù)據(jù)。這個(gè)路徑就是典型的自動(dòng)駕駛的思路,就是通過遙操設(shè)備去采集數(shù)據(jù)。
但現(xiàn)在大家發(fā)現(xiàn)這個(gè)方式采集數(shù)據(jù)的量、效率,包括質(zhì)量都是有問題的。像今年世界模型也比較火,那它核心點(diǎn)就是做了數(shù)據(jù)生成式的東西,想通過生成式的東西來解決數(shù)據(jù)問題。最后是人的數(shù)據(jù),維度還挺多的,包括人的形態(tài)的數(shù)據(jù)、人的視角的數(shù)據(jù)等等。
數(shù)據(jù)這個(gè)生意得要想得透,如果數(shù)據(jù)本身采集的壁壘很低的話,那很多做場景的公司依托自己的數(shù)據(jù)采集設(shè)備來搞就好了。如果數(shù)據(jù)采集的壁壘比較高的話,比如一套設(shè)備都幾百上千萬,還要很大的量,那這個(gè)肯定就是壁壘。做一個(gè)數(shù)據(jù)公司是不是就可以給行業(yè)帶來很多的貢獻(xiàn)?順著這個(gè)角度去分析,就會(huì)發(fā)現(xiàn)一定會(huì)有數(shù)據(jù)公司的生態(tài)位在的。
AI科技評論:具身領(lǐng)域中所提的世界模型究竟是什么?
王建明:世界模型的定義很廣,如果抽象出來它的一個(gè)定義,就是基于當(dāng)下的觀察,引入一個(gè)個(gè)影響因素,它去預(yù)測下一步的東西,下一步東西可能是下一幀的視頻生成,可以是下一幀機(jī)器人動(dòng)作的預(yù)測。定義是很廣的,不同的人腦子里的世界模型也不一樣。
從事機(jī)器人的人腦子里的世界模型一定是有物理的,有三維的?,F(xiàn)在很多創(chuàng)業(yè)公司的世界模型只是一個(gè)視頻生成的事情。
AI科技評論:感覺目前的世界模型還比較粗糙,它生成的數(shù)據(jù)真的能運(yùn)用到機(jī)器人上嗎?
王建明:今年世界模型是比較火,我沒有做過很全面的關(guān)于世界模型的采訪。我首先強(qiáng)調(diào)一下,我也不是那么懂世界模型。但是我之前有采訪一些機(jī)器人領(lǐng)域?qū)W者,他們確實(shí)是世界模型的擁護(hù)者。
世界模型是一個(gè)比較終極的問題,這個(gè)問題短期內(nèi)它還有很多的問題沒有被解決,從落地的角度來說,它可能是一個(gè)更遙遠(yuǎn)的技術(shù)路徑,需要在學(xué)術(shù)上面有很多的探索和突破,是一個(gè)需要嘗試的路線。
AI科技評論:您對于想要入局的一些創(chuàng)業(yè)者或者從業(yè)者有什么建議嗎?
王建明:對于年輕的創(chuàng)業(yè)者來說,我個(gè)人的建議是不著急。
可以先在大的創(chuàng)業(yè)公司里面,去把需要積累的資源給積累下來,比如人的資源、創(chuàng)業(yè)的小伙伴資源、投資人資源,包括整個(gè)行業(yè)里面合作伙伴的資源,同時(shí)積累對于創(chuàng)業(yè)這件事情的認(rèn)知。
AI科技評論:為什么是創(chuàng)業(yè)公司?
王建明:因?yàn)樵谝粋€(gè)創(chuàng)業(yè)公司里面,是可以跟 1 號(hào)位比較接近的,可以側(cè)面觀察到創(chuàng)業(yè)的一些事情,把這個(gè)認(rèn)知積累下來,同時(shí)再去加深一些對于這個(gè)行業(yè)的思考和觀察,然后等待你能夠把自己想要解決的問題給解決了的那個(gè)時(shí)間點(diǎn)的到來。
因?yàn)楝F(xiàn)在具身行業(yè)對于很多年輕的創(chuàng)業(yè)者來說需要去競爭,很多項(xiàng)目的創(chuàng)始人背景很好,可能要花大量的時(shí)間和力氣去跟他們?nèi)?PK,拿投資人的錢。與其花這個(gè)時(shí)間,還不如先積累資源,等待這個(gè)行業(yè)的下一個(gè)拐點(diǎn)。(雷峰網(wǎng))
04 GAIR 2025
2025年 12 月 12-13 日,由 GAIR 研究院與雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))聯(lián)合主辦的「第八屆 GAIR 全球人工智能與機(jī)器人大會(huì)」,將在深圳南山·博林天瑞喜來登酒店舉辦。
今年大會(huì),將開設(shè)三個(gè)主題論壇,聚焦大模型、算力變革、世界模型等多個(gè)議題,描繪 AI 最前沿的探索群像,折射學(xué)界與產(chǎn)業(yè)界共建的智能未來。
英諾天使基金執(zhí)行董事、石麻筆記主理人王建明也將蒞臨 12 月 13 日的《世界模型》論壇,她是數(shù)據(jù)專場的主席,也是圓桌活動(dòng)的主持人。歡迎點(diǎn)擊文末“閱讀原文”或識(shí)別海報(bào)二維碼,報(bào)名參會(huì),相約 GAIR 2025 ~

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。