丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給聰聰
發(fā)送

0

對話顧嘉唯:AI正在從虛擬世界,開始進入物理世界

本文作者: 聰聰   2025-11-19 12:08
導語:“像特斯拉做FSD一樣,做具身智能?!?

11月17號,AI+消費機器人公司靈宇宙宣布,已于近期完成2億元PreA輪系列融資,投資方包括滴滴出行、拉卡拉、上海國際、國泰海通、廣發(fā)信德等。這是靈宇宙繼去年包括三七互娛、商湯科技、線性資本等資本加碼后的又一輪系列融資。

不久前,我們在北京望京的辦公室,見到靈宇宙創(chuàng)始人顧嘉唯,并與他進行了一次深度對話。

“微軟亞研院研究員”“百度少帥”,百度IDL(深度學習實驗室)主任研發(fā)構(gòu)架師,麻省理工媒體評論MIT TR35科技創(chuàng)新者,這是顧嘉唯曾經(jīng)的標簽。

2016年,顧嘉唯加盟A股上市公司,出任副總裁,并擔任旗下公司物靈科技聯(lián)合創(chuàng)始人。彼時,顧嘉唯曾經(jīng)接受雷峰網(wǎng)專訪,分享他對“萬物有靈”的設想。2023年,顧嘉唯重新創(chuàng)業(yè),創(chuàng)辦靈宇宙,延續(xù)他的創(chuàng)業(yè)愿景。

新的公司“麻雀雖小,但五臟俱全”。在不足百十平方米的會議室,有一幅漫畫格外顯眼,它被放置于房間門口。這幅畫暢想了人類未來的生活:機器人可以端茶倒水,可以成為育兒嫂,可以做幾乎一切人所需要的服務。

對話顧嘉唯:AI正在從虛擬世界,開始進入物理世界

顧嘉唯說,這是他從第一次創(chuàng)業(yè)就想做的事情,但當時的時間點比較早。當下,隨著大模型的快速發(fā)展,到了做這件事的timing。

顧嘉唯這樣解釋他在做的事情,“World as prompt, World as interface。(把世界變成一個提示詞,把世界變成一個交互界面)”。

在顧嘉唯看來,今天最大的一個機會就是,AI 從虛擬世界和電腦屏幕,走到下一個階段,解決物理世界的問題,利用物理世界的數(shù)據(jù)來讓 AI 進入智能涌現(xiàn)的下一步。

在商業(yè)化路徑上,靈宇宙選擇以消費級AI硬件先行切入家庭場景,優(yōu)先于復雜人形機器人實現(xiàn)規(guī)?;涞?,構(gòu)建起類比特斯拉FSD的“南坡路徑”。

顧嘉唯表示,以前其實從大模型 GPT 3 ,到今天我們看到的所有發(fā)展,是來自于涌現(xiàn)于線上的文本數(shù)據(jù),人類創(chuàng)造的互聯(lián)網(wǎng)數(shù)據(jù)跟模型的關(guān)系。

一旦我們能走到下一步,我們定義的這套空間交互大模型,基于空間的行為動作模型關(guān)系去構(gòu)建,就能實現(xiàn)說今天所說的具身也好,空間智能也好,最稀缺的一部分數(shù)據(jù)供給。但前提是我們得像特斯拉做FSD 一樣,能夠先鋪量,先把足夠多的設備布出來,才能構(gòu)建這個閉環(huán)。

顧嘉唯坦言:“我是很篤信這件事的。因為對我來說,未來我要最終實現(xiàn)海報上面那樣的場景,你的養(yǎng)老,你的育兒,都是可以讓機器人去輔助完成。用AI機器人來解決人和家庭的關(guān)系變得更簡單,把重復勞作和娛樂陪伴各方面都分擔一部分給出去,讓成長快樂和天倫之樂回歸人性的簡化,這是我認為再往下發(fā)展很有可能會出現(xiàn)的一個變化,它會改造人類家庭常規(guī)的交互方式?!?/p>

從繪本閱讀機器人的開創(chuàng)者Luka(盧卡),到隨身AI終端“靈宇宙小方機”,顧嘉唯以及靈宇宙正沿著他們的既定路線,不斷向著未來的愿景前進。

以下是雷峰網(wǎng)(公眾號:雷峰網(wǎng))AI科技評論等媒體與顧嘉唯的對話

一、融資主要用于團隊升級,但不追求公司規(guī)模

Q:首先恭喜完成新的融資。您能否透露本輪融資主要將用于哪些重點方向?比如是技術(shù)研發(fā)、市場推廣還是海外擴張?

A:我們的資金主要用于研發(fā),市場投入等方面,包括人才招聘,主要是要招人。因為我們原來的團隊其實是上一個周期迭代經(jīng)驗沉淀下來的資源和人脈,也確實是適配于今天這個大模型做 AI 硬件或者 AI 消費電子或者 AI 機器人的路徑。

這個賽道不像純 AI 軟件,來一個新的玩家就能夠快速做起來,因為現(xiàn)在積累厚度還是蠻厚的。但是我今天也遇到新的一些挑戰(zhàn)和問題,比如海外,我們現(xiàn)在要更加速我們的海外整個商業(yè)化落地,那我們要去找到更多的海外跨境的人才。以及當商業(yè)化的時候,我們發(fā)現(xiàn)我們 GTM ( go to market)做商業(yè)化規(guī)劃這部分能力要求,不論是國內(nèi)還是海外,我需新的打法,因為這個品類是新品類,以前沒有過。

Q:具體要怎么做新品類的市場推廣?

A:比如怎么以一個像蘋果一樣方式去落地商業(yè)化。我們要有很強的發(fā)布能力,把所有每次軟件功能的升級和硬件的版本都能發(fā)布出去,以及下面能承載專營店、體驗店。因為新品類是重體驗。

舉個例子,比如說Apple Vison Pro,要先用手機、用蘋果先注冊完人臉驗證之后,然后到線下才能體驗預約才能實現(xiàn)。

那人才維度也需要升級,我們也希望說能夠在這次不斷地拿到新的資本來加持的時候,能夠引入這樣的品類創(chuàng)新人才。我們目前40人+團隊,已經(jīng)實現(xiàn)了這樣一個階段性成果,我覺得這也是未來AI公司的一個普遍情況,用AI賦能團隊,然后持續(xù)找到創(chuàng)新人才。

Q:之前物靈科技有幾百人,這次創(chuàng)業(yè)人好像少了很多。未來團隊規(guī)模未來預計擴大到多少人?有怎樣的考量?

A:目前沒有太明確的數(shù)字,因為說實在我覺得現(xiàn)在跟以前不一樣。以前公司成立第一天,我們就 300 號人的團隊,是因為當時有孵化的項目以及并購的項目弄到一起了。現(xiàn)在,我對于人員和對于控制要求都比較高,你能感受到,我們其實是很緊湊高效的一個創(chuàng)業(yè)氛圍,跟上一個周期是不一樣的。這跟今天的外部環(huán)境,以及跟我的經(jīng)歷都有關(guān)系。

我走過這些中間的起起伏伏的路之后,我再選擇這邊,對人員的整體規(guī)劃是沒有的,我更希望是一個人能多用的,因為大模型時代, AI native的公司一定是很多東西不需要自己干,模型就可以幫你解決。但我會找到關(guān)鍵人,有些關(guān)鍵的需求的人員是對我比較重要,通過原來的人脈沒有 reach 到的,通過資本市場的獲得更大的股東的人脈,以及說我們通過更多人知道我們在今天這個公司在做什么,我們可以吸引到更多這樣的人才。

Q:和投資人或機構(gòu)交流的過程當中,您最大的感受是什么?現(xiàn)在具身智能這么火的市場環(huán)境下,您會有危機感嗎?

A:我覺得可能今天在我們這個公司的股東結(jié)構(gòu)里面,這些機構(gòu)有一個讓我印象特別深的地方,就是從質(zhì)疑到最后印證的一個過程。

一開始當我說要去走一個特斯拉 FSD 的南坡路徑,去鋪硬件、收數(shù)據(jù),可能最終我也要去做端茶倒水這種機器人形態(tài)時候,大家覺得好像沒有一個連接線過去。但當大家看到我們產(chǎn)品落地的過程,使用的交互形式和它開始鋪量不斷做增長這個過程,當大家發(fā)現(xiàn)Meta小扎和Google等前沿實驗室最近的關(guān)鍵動作的時候,大家發(fā)現(xiàn)這件事情其實是一個有通路的東西,我覺得這反而是我認為大家印證了一個終局思維的方式做一家公司的一些不一樣的路徑。

Q:怎么理解這個終局思維?

A:其實,我先去定義的一個終局思考,然后回過來再畫出兩個roadmaps,然后一點點走過去的,這其實是個非共識的過程。我覺得今天我感受到這些股東能加碼,也有老股東加持,也有新的進來。

大家看到了一個機會,他發(fā)現(xiàn)其實一開始被質(zhì)疑的和不確定的這些東西逐漸一點點被印證出來,我覺得這是我感觸最深的一點。

中間我們每一步的這個過程,讓大家看到了說這件事真的是在發(fā)生的,這個南坡路徑是在發(fā)生的,這種輕量級的終端能采集數(shù)據(jù),完成構(gòu)建今天具身智能和世界模型里面最缺失的真實數(shù)據(jù)閉環(huán),是我覺得可能大家逐漸已經(jīng)從一個從非共識到加注的一個重要因素。

Q:作為公司老股東,您也提到與商湯的合作,能不能具體展開介紹一下這方面的合作有哪些關(guān)鍵性進展?下一步還會有沒有什么延伸?

A:商湯的優(yōu)勢在于他們能夠把以前的計算機視覺這部分的數(shù)據(jù)源和計算機視覺基因搭建的這種多模態(tài)大模型引擎和模型的能力賦能給我們,所以在我們看到的 real time 的實時交互的大模型上面,能做到這么好的體驗,換任何一個非深度合作的模型公司是很難做到的。所以對我的好處在于,啟動的時候有一些全新的多模態(tài)的交互數(shù)據(jù)體驗是在別的基模(比如字節(jié)的豆包或者是阿里的通義)實現(xiàn)不到的深度的體驗。另外一個比較重要的優(yōu)勢,大家知道其實最早啟動的時候,商湯的集群卡也比較多,所以我們會比較在意是怎么應用它現(xiàn)在最新的 SenseNova模型,怎么能夠通過算力的加速盡快應用到消費電子里面,這是我們可能一起會耦合去迭代的一個方式。

二、預測未來最好方式就是去做它

Q:商業(yè)化這一塊有什么具體戰(zhàn)略上面的想法嗎?

A:國內(nèi)的抖音是很強大的一個過去的積累,你會發(fā)現(xiàn)視頻電商的算法推薦以及說視頻內(nèi)容的展現(xiàn)效率 3 ~ 10 秒鐘,進來捕捉完之后持續(xù)結(jié)單和下單,這種效率在國外其實反而學中國的。

因為抖音我們其實過去也做過好多年,反而北美那邊或者說東南亞那邊,或者說像歐洲有點難,還沒有完全起來,在視頻電商和興趣電商的這個環(huán)節(jié),我們反而是有過經(jīng)驗之后,只要復制這個經(jīng)驗,找對那邊的人就行。我覺得這個套路其實是可以通達的。

其實像我們這樣重體驗的產(chǎn)品不是一個標品,我覺得國內(nèi)已經(jīng)有過積累的公司是反而會彎道超車的,我覺得這是有好的一面的可能性。我們往下走,海外市場是有積累的能力的,因為媽媽類的產(chǎn)品、母嬰類產(chǎn)品,這兩個都打得是很透的。其實既有做過微商,也有做過抖音的直播帶貨的流量模式,都打過一遍實操的經(jīng)驗。

Q:我們?nèi)绾尉S持產(chǎn)品的壁壘和厚度?

A:今天這個大模型時代有兩個關(guān)鍵詞。

第一是極致個性化適合每個人,絕對做到千人千面。以前千人千面,字節(jié)時代是推薦算法,一個內(nèi)容創(chuàng)造出來,在云端通過推薦函數(shù)連接給你,今天我們把它定義叫“關(guān)系算法”,也就是說這個角色更懂你,因為這個角色跟你共同經(jīng)歷。跟你互動更多的Agent智能體,他會更懂你的情況,他會主動來和你交互。我們在過去把所有的角色主動適配的能力建立起來,讓每個角色可以主動的適合每個人。然后,他長期的記憶,主動的意識都可以交互起來。那我覺得是今天大模型跟隨的公司沒有這樣的技術(shù)積累能力是做不到的這點的。

第二是數(shù)據(jù)的伴隨AI原住民成長的長期周期。為什么我們能做到小方機,就是用過去盧卡積累過數(shù)據(jù)和用戶洞察。當年人口紅利高峰期的產(chǎn)品用戶,今天長大了,正好從盧卡過渡到小方機,我們會通過靈宇宙的AI終端不斷迭代升級去靈性陪伴這一波Alpha世代人群(10后)共同成長,盧卡的數(shù)據(jù)已經(jīng)在這邊放量成為了一個看得見的結(jié)果,那進一步就在堆積這個產(chǎn)品,下一步的數(shù)據(jù)源來讓他繼續(xù)領(lǐng)跑和成為下一個閉環(huán)的優(yōu)勢。

Q:漫畫里面機器人繞膝左右場景,您覺得未來多長時間會實以實現(xiàn)這樣一個場景?

A:我覺得我很喜歡 Alan key (連線雜志作者)的兩句話。

第一句話是,"The best way to predict the future is to invent it."(預測未來最好方式就是去發(fā)明它。)

我覺得這是讓我自己比較幸福的一句話,因為我覺得時間軸很難預判,人們對技術(shù)的科技發(fā)展很容易高估短期,低估長期做的事情。所以我覺得這個時間線我覺得挺難判斷,但我會一直在履行實踐、試錯、迭代這件事。

從盧卡,到今天的小方機。大家會說你不是做機器人嗎?怎么搞了一個這個玩意出來?我其實在用我的時間路徑再去履行這樣事情。

第二句話是,"People who are serious about software should make their own hardware."(如果你執(zhí)念要去做出好的軟件體驗來,請去做硬件。)

所以你會發(fā)現(xiàn),如果從投入度和價值資產(chǎn)的角度來看,我們是軟件占80% 的公司,硬件反而只占20%。但是,我們產(chǎn)品是以硬件的方式在這個人群里面有專有需求。做AI硬件要離手機遠,一種離手機遠的方式就是干這種端茶倒水的這種實體硬件解決原子交互問題。第二種是要離手機遠,是那個人群沒有手機或者家長不想給他手機,他需要專業(yè)設備。例如今天家長想給孩子用豆包,又擔憂給了手機會去打游戲的痛點,這兩個都是我覺得比較重要的做AI硬件的底層思考。

回過頭來,我會覺得,既然是軟件,我不怕迭代,我只要高密度的錨準我認為的核心邏輯去迭代軟件,我一定是會排活在牌桌上,成為做成這家公司的人,所以你會發(fā)現(xiàn)其實“穿越周期有韌性”是很關(guān)鍵的,“識別機會和timing”又是很關(guān)鍵的。

Q:如何解決大模型“幻覺”在具身機器人上的風險?

A:幻覺問題在過去的一年多時間是有大規(guī)模的降低的,其實有很多解法基模已經(jīng)在解了,底層的基模都在幫你解決,所以它是個時代給予的機會。我們還有過去那么多年做盧卡積累的模型微調(diào)和數(shù)據(jù)經(jīng)驗。

Q:您目前創(chuàng)業(yè)做家用機器人,比較擔心的是什么?

A:我會擔心的是,當這個攝像頭在真實界你交互的時候,你會發(fā)現(xiàn)其實這個數(shù)據(jù)源的優(yōu)勢是會被場景的割裂而影響,因為孩子會各種跑動、遮擋環(huán)境等,這部分東西是不可控的,而且有很多好的模型,高算力的方案,放到家長買給孩子產(chǎn)品也有難度。有很多最新的模型未必能用得上,所以每一項的環(huán)節(jié)體驗都有可能出現(xiàn)打折的地方,遇到很多挑戰(zhàn),這種挑戰(zhàn)是把事做好的,一個會有的難度和微妙的痛苦,我覺得這痛苦是一個創(chuàng)業(yè)者要去解決的。

另外我覺得孩子類的東西,他反而對數(shù)據(jù)隱私是很敏感的。這東西是會持續(xù)收集,會把一天當中所有的東西記下來壓縮,然后整理,跟你互動,其實今天會有很多這樣的隱私的不確定性。比起跟別人同質(zhì)化競爭,這是我更在意的東西。

本文作者代聰飛,既看產(chǎn)品,也看人與業(yè)務的故事,持續(xù)關(guān)注AI行業(yè)的潮水方向。歡迎各位讀者添加作者微信Congc_a交流。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

對話顧嘉唯:AI正在從虛擬世界,開始進入物理世界

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說