0
本文作者: 吳華秀 | 2025-02-05 18:27 |
在一年一度 CES 2025 上,AI 陪伴機(jī)器人成為新的熱點(diǎn)。其中,美國(guó)玩具公司 TOMBOT 和國(guó)內(nèi)大象機(jī)器人分別推出了AI大模型仿生寵物,既有仿生拉布拉多犬,也有仿生熊貓;日本公司 Yuaki Engineering 展示了可掛于背包或手腕上的小型毛絨陪伴玩具 Mirumi。
同樣將目光望向 AI 陪伴機(jī)器人這片藍(lán)海的,還有躍躍欲試的珞博智能——一家成立于 2024 年、聚焦于 AI 情感陪伴機(jī)器人的別樣具身智能公司。
珞博智能的創(chuàng)辦者孫兆治,此前是一位連續(xù)創(chuàng)業(yè)者,也是一位深耕汽車與機(jī)器人領(lǐng)域多年的行業(yè)老兵。
孫兆治 2011 年碩士畢業(yè)于英國(guó)考文垂大學(xué)汽車內(nèi)飾設(shè)計(jì)專業(yè)。這所院校坐落于二戰(zhàn)前的全球汽車城考文垂,具備濃厚的汽車文化底蘊(yùn),是汽車設(shè)計(jì)領(lǐng)域知名院校。畢業(yè)后,孫兆治在汽車行業(yè)開(kāi)啟了長(zhǎng)達(dá)十年的職業(yè)生涯。
起初,孫兆治在歐洲從事汽車設(shè)計(jì),曾參與過(guò)上一代奔馳 S 的交互架構(gòu)、寶馬 3 和阿爾法?羅密歐 Giulia 的內(nèi)飾造型等設(shè)計(jì)工作。
2015 年,國(guó)內(nèi)造車新勢(shì)力如火如荼,孫兆治選擇回國(guó)加入小鵬汽車,負(fù)責(zé)整個(gè)小鵬汽車的內(nèi)飾設(shè)計(jì),參與定義了中國(guó)新能源汽車引領(lǐng)全球的內(nèi)飾座艙用戶體驗(yàn)。2017年,孫兆治加入滴滴,擔(dān)任滴滴造車項(xiàng)目的產(chǎn)品負(fù)責(zé)人,深度參與了共享出行及無(wú)人駕駛時(shí)代交通工具的產(chǎn)品定義。
2020 年底小鵬成立機(jī)器人公司鵬行智能,孫兆治受邀加入,負(fù)責(zé)機(jī)器人全線產(chǎn)品設(shè)計(jì)及品牌工作,毅然加入這一波具身智能的技術(shù)浪潮之中。至此,孫兆治正式開(kāi)啟由汽車行業(yè)轉(zhuǎn)向機(jī)器人的新征程,再一次嘗試去定義全新的產(chǎn)品品類。
作為一名由自動(dòng)駕駛賽道切換至機(jī)器人領(lǐng)域的創(chuàng)業(yè)者,孫兆治長(zhǎng)期浸淫在技術(shù)的前沿高地。期間,他親歷了智能化技術(shù)為汽車帶來(lái)的深刻變革,也參與了機(jī)器人技術(shù)的發(fā)展推演與應(yīng)用探索,這讓他對(duì)技術(shù)發(fā)展與產(chǎn)品創(chuàng)新之間的節(jié)奏關(guān)聯(lián)有了深刻認(rèn)識(shí)。
尤其是自動(dòng)駕駛技術(shù)的創(chuàng)業(yè)歷程,讓他意識(shí)到,尋找技術(shù)進(jìn)程中的“溢出點(diǎn)”并快速實(shí)現(xiàn)商業(yè)化是一條可行路徑。
自動(dòng)駕駛火熱時(shí),L4、L5 被高高捧上王座,連 L3 都成了瞧不上眼的存在。但哪怕是在 AI 狂奔十年后的當(dāng)下,真正意義上的 L4、L5 級(jí)別商業(yè)化應(yīng)用仍然還沒(méi)能問(wèn)世。反倒是自動(dòng)駕駛技術(shù)發(fā)展過(guò)程中的一些技術(shù)溢出,如 SLAM 技術(shù)的成熟,滋養(yǎng)了一批掃地機(jī)器人公司,接連傳來(lái)上市的敲鐘聲。
同樣,具身智能浪潮中,具備高智能水平的人形機(jī)器人就如同自動(dòng)駕駛的終局 L4、L5,想象空間大、令人神往,同時(shí)技術(shù)難度極高、實(shí)現(xiàn)漫長(zhǎng)。從商業(yè)落地角度考慮,探索技術(shù)溢出也將成為 2025 年具身智能的一大分支。
2021 年 ChatGPT 橫空出世后,孫兆治就跟朋友打賭:大模型帶來(lái)的交互模態(tài)的變革和交互體驗(yàn)的躍升,一定會(huì)催生出一批新的硬件形態(tài)。在鵬行期間,孫兆治與團(tuán)隊(duì)曾嘗試引入大模型算法賦能機(jī)器人,他發(fā)現(xiàn):相比人形中難度更高的運(yùn)動(dòng)控制,C 端用戶最先感知到的其實(shí)是與機(jī)器人的交互體驗(yàn)。
珞博智能的創(chuàng)業(yè)初衷由此誕生:基于大模型的語(yǔ)言交流與感知交互提升,打造一款面向 C 端的、能更快落地的智能硬件——AI 情感陪伴類機(jī)器人。
珞博智能創(chuàng)始人孫兆治
從自動(dòng)駕駛切換到陪伴類機(jī)器人是一個(gè)較大的跨越,但孫兆治認(rèn)為后者是一個(gè)“被低估的賽道”。近日,AI 科技評(píng)論與孫兆治進(jìn)行了一次交流:
AI 科技評(píng)論:你此前一直在汽車領(lǐng)域,為什么會(huì)轉(zhuǎn)向機(jī)器人賽道?
孫兆治:我之前在汽車行業(yè)長(zhǎng)達(dá)十年,目睹了智能化給汽車行業(yè)帶來(lái)的深刻變革,今天的智能汽車就是一個(gè)標(biāo)準(zhǔn)意義上的機(jī)器人:能夠自主感知、自主決策、自主執(zhí)行。我過(guò)往創(chuàng)業(yè)也有做過(guò)智能硬件創(chuàng)業(yè),我很堅(jiān)信“AI+硬件”將會(huì)成為下一輪技術(shù)浪潮的核心驅(qū)動(dòng)力,而機(jī)器人是其中極其重要的一個(gè)品類。
如果要投身于 AI+硬件的浪潮中,加入一家具有技術(shù)實(shí)力的機(jī)器人公司顯然是快速學(xué)習(xí)積累的最好選擇,所以 2020 年我就去了鵬行。對(duì)我來(lái)說(shuō),這也是一個(gè)跨領(lǐng)域?qū)W習(xí)的寶貴過(guò)程。
AI 科技評(píng)論:從汽車行業(yè)切換進(jìn)機(jī)器人賽道,是一個(gè)比較大的跨越嗎?
孫兆治:我認(rèn)為汽車與機(jī)器人雖然說(shuō)是兩個(gè)行業(yè),但這是兩個(gè)離得相對(duì)近的行業(yè)了。
我當(dāng)時(shí)負(fù)責(zé)的工作主要是產(chǎn)品設(shè)計(jì)。從產(chǎn)品設(shè)計(jì)上講,很難找到一個(gè)像機(jī)器人這么復(fù)雜的產(chǎn)品體系和形態(tài),基本上只有汽車能匹配得上這樣的復(fù)雜度。
我們當(dāng)時(shí)組建機(jī)器人的產(chǎn)品團(tuán)隊(duì)和設(shè)計(jì)團(tuán)隊(duì)時(shí),其中也有相當(dāng)一部分人才來(lái)自汽車行業(yè),如果過(guò)去做過(guò)的產(chǎn)品復(fù)雜度不夠,其實(shí)是很難 handle (應(yīng)對(duì))機(jī)器人這樣一個(gè)復(fù)雜的品類。
AI 科技評(píng)論:在鵬行時(shí),你主要參與了哪些重要成果?
孫兆治:我主要負(fù)責(zé)鵬行的產(chǎn)品及設(shè)計(jì)工作,同時(shí)也帶品牌團(tuán)隊(duì)。比較顯性的成果,比如鵬行前后發(fā)布的 PX1、PX2 兩代機(jī)器馬,以及 PX5 人形機(jī)器人,它們的外觀設(shè)計(jì)和體驗(yàn)設(shè)計(jì)都是我的團(tuán)隊(duì)做的。
比如,2023 年我們發(fā)布的 PX5 人形機(jī)器人。與很多人形機(jī)器人不同,首先 PX5 人形機(jī)器人的個(gè)頭不大,大概一米五左右;另外,它長(zhǎng)得沒(méi)有那么像人類,就是一個(gè)機(jī)器人模樣。我們沒(méi)有采用非常堅(jiān)硬或冷冰冰的材料去設(shè)計(jì)一款機(jī)器人,而是想讓機(jī)器人擁有一個(gè)非常具有親和力的外形。我們對(duì)這些外形都有過(guò)深度思考,并不是簡(jiǎn)單追求一個(gè)酷炫的外形設(shè)計(jì)。
另外,針對(duì)四足機(jī)器人、人形機(jī)器人在特定場(chǎng)景應(yīng)用,以及技術(shù)演進(jìn)過(guò)程中可能會(huì)出現(xiàn)的一些機(jī)器人形態(tài),我們之前也做了大量的思考和推演。雖然這些工作沒(méi)有對(duì)外展示,但在內(nèi)部對(duì)產(chǎn)品未來(lái)的一系列迭代是有指導(dǎo)作用的。就像汽車行業(yè)會(huì)有大量概念車的討論,對(duì)內(nèi)有指導(dǎo)意義,對(duì)外并不公布。
AI 科技評(píng)論:汽車作為一個(gè)成熟產(chǎn)業(yè),以汽車作類比,機(jī)器人如何才算得上是量產(chǎn)?
孫兆治:通常而言,量產(chǎn)產(chǎn)品是指用量產(chǎn)工藝進(jìn)行生產(chǎn),并達(dá)到流程化驗(yàn)收標(biāo)準(zhǔn)的產(chǎn)品。
現(xiàn)在機(jī)器人一年可能只是幾十臺(tái)、幾百臺(tái)的產(chǎn)量,規(guī)模比較小,基本上還不會(huì)用到量產(chǎn)工藝。不過(guò),只要產(chǎn)量能達(dá)到千臺(tái)以上,就有機(jī)會(huì)去進(jìn)行規(guī)?;僮?。
像汽車行業(yè),如果年銷量超過(guò) 3 萬(wàn)臺(tái),那就能夠支撐起一款車型從沖壓、焊接到涂裝等所有產(chǎn)線的投產(chǎn)運(yùn)營(yíng)。所以一旦機(jī)器人產(chǎn)量達(dá)到上萬(wàn)臺(tái),就意味著機(jī)器人進(jìn)入到規(guī)?;慨a(chǎn)階段了。
AI 科技評(píng)論:你在汽車領(lǐng)域長(zhǎng)達(dá)十年,得到了哪些啟發(fā),可以應(yīng)用在具身智能領(lǐng)域?
孫兆治:汽車已經(jīng)被發(fā)明一百多年了,技術(shù)還在持續(xù)迭代,但這不妨礙每個(gè)時(shí)代都有非常經(jīng)典的車型。我們會(huì)把技術(shù)的發(fā)展視為一個(gè)螺旋上升的過(guò)程,每一個(gè)階段技術(shù)所達(dá)到的程度都會(huì)不同。我們傾向于利用近未來(lái)出現(xiàn)的關(guān)鍵技術(shù)變量去做一個(gè)能商業(yè)化落地的產(chǎn)品。
比如 2013、2014 年時(shí),汽車行業(yè)里自動(dòng)駕駛很火熱,自動(dòng)駕駛初創(chuàng)團(tuán)隊(duì)不斷涌現(xiàn)。那時(shí)候大家熱衷于談?wù)?L4、L5 級(jí)別自動(dòng)駕駛,還看不起做 L3 級(jí)別的公司。但從實(shí)際情況來(lái)看,即便近十年 AI 和整個(gè)智能化的基礎(chǔ)能力發(fā)展已經(jīng)很快了,真正意義上的 L4、L5 級(jí)別商業(yè)化應(yīng)用直到今天也還未出現(xiàn)。
在這一過(guò)程中,很多自動(dòng)駕駛公司垮掉了,就是因?yàn)橐驗(yàn)樯虡I(yè)化路徑不清晰,不僅長(zhǎng)時(shí)間沒(méi)有收入,還得持續(xù)依靠公司自身輸血維持。最終存活下來(lái)的公司,要么是能找到應(yīng)用場(chǎng)景、有客戶的;要么是背后有大資本支持,可以持續(xù)燒錢十年、八年。
反而是自動(dòng)駕駛技術(shù)的溢出,讓其他領(lǐng)域發(fā)展了起來(lái),比如掃地機(jī)器人。 掃地機(jī)器人這一產(chǎn)品類型的出現(xiàn),本質(zhì)上是自動(dòng)駕駛技術(shù)溢出的結(jié)果,具體來(lái)說(shuō)是 SLAM 技術(shù),以及傳感器成本大規(guī)模下降。人們一直都有掃地的清潔需求,只是以前技術(shù)供給不成熟,掃地機(jī)器人產(chǎn)品力欠缺。
現(xiàn)在技術(shù)成熟了,掃地機(jī)器人市場(chǎng)也相應(yīng)爆發(fā)了。國(guó)內(nèi)外幾家大型掃地機(jī)器人公司的市值,有不少是超過(guò)汽車公司的。掃地機(jī)器人也算是首個(gè)走進(jìn)千家萬(wàn)戶的機(jī)器人產(chǎn)品類別了。
在具身智能技術(shù)的長(zhǎng)期發(fā)展過(guò)程中,也一定會(huì)產(chǎn)生技術(shù)溢出,會(huì)支持一些新硬件或產(chǎn)品的出現(xiàn)。
AI 科技評(píng)論:所以你們是從商業(yè)化落地的視角上去考慮產(chǎn)品。
孫兆治:最終大家都要考慮商業(yè)化。技術(shù)也好,設(shè)計(jì)也好,品牌也好,最終都要能轉(zhuǎn)換為用戶價(jià)值,才有機(jī)會(huì)獲得商業(yè)價(jià)值。我們做產(chǎn)品的出發(fā)點(diǎn)是思考清楚能創(chuàng)造怎樣的用戶價(jià)值。
AI 科技評(píng)論:你是怎么發(fā)掘機(jī)器人提供怎樣的用戶價(jià)值的?
孫兆治:一部分來(lái)自于觀察實(shí)際用戶的反應(yīng)。我舉個(gè)例子,在小鵬機(jī)器人的項(xiàng)目中,我們花了很長(zhǎng)時(shí)間去調(diào)整機(jī)器人的一些運(yùn)動(dòng)表現(xiàn),比如讓它走得更好看、更平穩(wěn),行走時(shí)聲音更小、更安靜。
當(dāng)時(shí)受 ChatGPT 的啟發(fā),我們一個(gè)小團(tuán)隊(duì)還做了這么一件事:把機(jī)器人的表情、聲音以及一些動(dòng)作和模型關(guān)聯(lián)起來(lái),這樣就能和機(jī)器人對(duì)話、逗它笑、摸它的頭,它也會(huì)有各種各樣的反應(yīng)。
我們?cè)跈C(jī)器人的交互和運(yùn)動(dòng)能力兩方面的技術(shù)投入比例并不同,很顯然運(yùn)動(dòng)控制難度更大。但在展示時(shí)我們發(fā)現(xiàn),不管是我們自己的團(tuán)隊(duì)成員,還是參與測(cè)試的用戶,都對(duì)交互體驗(yàn)展現(xiàn)出了極大的興趣,因?yàn)檫@是他們最能直觀感受到的,甚至愿意為此付費(fèi)。而對(duì)于機(jī)器人走得更穩(wěn)這類運(yùn)動(dòng)控制方面的改進(jìn),大家?guī)缀鯖](méi)什么特別的感受。所以用戶價(jià)值有時(shí)候跟技術(shù)含量沒(méi)有關(guān)系,需要帶入用戶視角思考或觀察。
AI 科技評(píng)論:這一過(guò)程相當(dāng)考驗(yàn)產(chǎn)品想象力和用戶需求的挖掘。
孫兆治:產(chǎn)品想象力是設(shè)計(jì)師和產(chǎn)品經(jīng)理的強(qiáng)項(xiàng),大部分人很難具備。
我們所做的創(chuàng)業(yè)歸根結(jié)底遵循的是非常商業(yè)化的底層邏輯。關(guān)鍵在于如何一步步地將技術(shù)價(jià)值以及自身對(duì)市場(chǎng)的洞察,轉(zhuǎn)化為用戶價(jià)值,最終形成企業(yè)的商業(yè)價(jià)值。
AI 科技評(píng)論:你是從具身智能技術(shù)棧去思考最靠近落地的技術(shù)。
孫兆治:我們不局限于人形機(jī)器人的形態(tài),而是著眼于具身智能賽道的發(fā)展階段,探究這一技術(shù)棧能催生出什么樣的產(chǎn)品形態(tài)、為用戶創(chuàng)造怎樣的價(jià)值。
目前,具身智能涵蓋機(jī)器人的行走、手臂操作、大腦任務(wù)規(guī)劃以及自然交互等能力,這些構(gòu)成了完整的技術(shù)棧。那么,當(dāng)下最易實(shí)現(xiàn)商業(yè)化落地的場(chǎng)景是什么?我們覺(jué)得得益于大模型的發(fā)展,自然交互與智能規(guī)劃方面的體驗(yàn)將會(huì)有質(zhì)的飛躍。相比之下,雙足行走和雙臂操作距離消費(fèi)級(jí)應(yīng)用還很遙遠(yuǎn)。
在交互智能與規(guī)劃智能方面,能更快實(shí)現(xiàn)商業(yè)化落地的產(chǎn)品應(yīng)該是小型情感陪伴機(jī)器人,而不是通用或人形機(jī)器人。因此,我們選擇聚焦在消費(fèi)級(jí)情感陪伴機(jī)器人,將本體定義為 AI 硬件。
AI 科技評(píng)論:交互智能和規(guī)劃智能屬于機(jī)器人中的“大腦智能”。
孫兆治:對(duì),確實(shí)如此。要是去了解一下人類神經(jīng)學(xué)原理就會(huì)發(fā)現(xiàn),整個(gè)人腦的進(jìn)化歷程中,有一部分人腦在古哺乳動(dòng)物早期就已經(jīng)出現(xiàn)了,我們稱之為“古哺乳動(dòng)物腦”。它最初的作用就是解決基礎(chǔ)的移動(dòng)、部分操作,以及類似反射行為那樣的感知與決策問(wèn)題。這塊其實(shí)也是今天很多具身智能團(tuán)隊(duì)還在解決的問(wèn)題。
一旦說(shuō)到交互,就必然會(huì)涉及語(yǔ)言理解、大量的視覺(jué)理解以及各種感知的融合。所謂的規(guī)劃智能,對(duì)應(yīng)的其實(shí)是人腦前額葉區(qū)域,這是人腦最后才進(jìn)化出來(lái)的區(qū)域。
如果做一個(gè)粗略的仿生方面的比喻,珞博智能正在做的事情,其實(shí)就是整個(gè)人腦在中后期進(jìn)化出的這塊區(qū)域相關(guān)的工作,它與語(yǔ)言、復(fù)雜視覺(jué)緊密相關(guān),并且和邏輯推理、決策相聯(lián)系。從生物進(jìn)化角度來(lái)講,這部分是最后才進(jìn)化出來(lái)的。但從技術(shù)發(fā)展角度看,恰恰因?yàn)槿缃翊竽P图夹g(shù)取得了突破,使得與之相關(guān)的事有望更快地變?yōu)楝F(xiàn)實(shí)。
AI 科技評(píng)論:你們采用的是哪一家模型?
孫兆治:我們主要聚焦于多模態(tài)大模型應(yīng)用,這也是我們的核心能力。產(chǎn)品的設(shè)計(jì)架構(gòu)具備插拔特性,方便測(cè)試各類模型,等最終量產(chǎn)產(chǎn)品推出時(shí),我們會(huì)公布所選用的模型。在交互方面,海外與國(guó)內(nèi)產(chǎn)品所搭載的模型會(huì)存在差異。
此外,我們自主搭建了記憶系統(tǒng),其中長(zhǎng)期記憶分為兩種。一種是觀察記憶,通過(guò)各種傳感器收集基礎(chǔ)信息,比如人們說(shuō)的話、看到的場(chǎng)景等;另一種是反思記憶,它會(huì)基于過(guò)往記憶,利用定期觸發(fā)機(jī)制進(jìn)行總結(jié)與反思,生成更高維度的信息。整個(gè)反思記憶系統(tǒng)由大模型來(lái)驅(qū)動(dòng)。由于不同任務(wù)有著不一樣的要求,不同環(huán)節(jié)需要調(diào)用不同模型來(lái)處理。
AI 科技評(píng)論:現(xiàn)在能實(shí)現(xiàn)的效果是什么樣的?
孫兆治:事實(shí)上,我們現(xiàn)階段所打造的機(jī)器人,賦予了它近似人體的外觀構(gòu)造,配備了脖子和胳膊,由特定數(shù)量的自由度構(gòu)成。當(dāng)前設(shè)定為六個(gè)自由度,具體分布為脖子處兩個(gè),每個(gè)胳膊在肩膀位置各有兩個(gè)。在此基礎(chǔ)上,我們進(jìn)行了一項(xiàng)大膽的嘗試:完全憑借大模型來(lái)操控機(jī)器人的行為舉止。
我們針對(duì)大模型實(shí)施了專門的訓(xùn)練,清晰告知大模型每個(gè)自由度的邊界,以及這些自由度所大致代表的意義,之后就完全讓大模型自主進(jìn)行編程,對(duì)機(jī)器人的所有行為實(shí)施控制。這時(shí)候,就會(huì)出現(xiàn)一個(gè)好玩的現(xiàn)象:以前的交互機(jī)器人,如果要求它表演跳舞,它的舞蹈動(dòng)作往往是預(yù)先設(shè)定好、固定不變的。但是我們?cè)O(shè)計(jì)好的機(jī)器人,每次接到跳舞指令,所呈現(xiàn)出來(lái)的舞蹈動(dòng)作都不一樣,很有意思。
AI 科技評(píng)論:你們團(tuán)隊(duì)組成的特點(diǎn)是什么?目前產(chǎn)品迭代情況如何?
孫兆治:我們團(tuán)隊(duì)有近期實(shí)現(xiàn)商業(yè)化的目標(biāo),為此搭建了一個(gè)能短期內(nèi)將產(chǎn)品推向市場(chǎng)的團(tuán)隊(duì)。但目前還是以研發(fā)工作為主,涵蓋軟件與硬件兩方面。
2024 年年中,我們正式開(kāi)始做,接著 9 月做出第一版功能原型機(jī),10 月、11 月依次推出第二版、第三版,基本保持一月一次迭代的節(jié)奏,每次迭代軟硬件都有較大的更新變化。
AI 科技評(píng)論:你們現(xiàn)在機(jī)器人形態(tài)是什么樣的?
孫兆治:我們前三輪產(chǎn)品迭代都是做了一個(gè)桌面形態(tài)的機(jī)器人,高度是十四五厘米高、很小。我們并不希望讓這個(gè)硬件有多像機(jī)器人,而是讓它足夠可愛(ài)有趣,并且適用于多模態(tài)大模型的交互能力。
AI 科技評(píng)論:這個(gè)桌面機(jī)器人會(huì)是你們的一個(gè)過(guò)渡產(chǎn)品形態(tài)嗎?
孫兆治:我們現(xiàn)在做的情感陪伴機(jī)器人不一定完全就是桌面形態(tài),未來(lái)我們也有可能會(huì)做更輕量、更小型的產(chǎn)品,可以隨身帶在身上。
另外,我們也認(rèn)為地面移動(dòng)類機(jī)器人也非常適合承載我們的技術(shù)和思考,我們后續(xù)也會(huì)有這方面的探索。
AI 科技評(píng)論:在研發(fā)小型情感陪伴機(jī)器人的過(guò)程中,你們有沒(méi)有遇到什么難題?
孫兆治:延遲是大家普遍關(guān)注的問(wèn)題。目前大部分大模型實(shí)時(shí)交互的硬件產(chǎn)品,延遲長(zhǎng)達(dá) 4-8 秒,顯然沒(méi)法滿足溝通需求。為此,我們投入大量技術(shù)精力進(jìn)行優(yōu)化,力求將延遲控制在了 2 秒范圍,只有這樣,產(chǎn)品才能在各類場(chǎng)景中有效發(fā)揮作用。
再一個(gè)是大模型的幻覺(jué)問(wèn)題。當(dāng)下我們嘗試讓大模型操控機(jī)器人的動(dòng)作、語(yǔ)言、情緒以及記憶等方面,偶爾會(huì)有幻覺(jué),但整個(gè)場(chǎng)景的容錯(cuò)率還是比較高的。要是把它應(yīng)用在嚴(yán)肅的工作場(chǎng)景里,可能會(huì)引發(fā)不少棘手問(wèn)題,畢竟這些場(chǎng)景對(duì)機(jī)器人的精準(zhǔn)度、可靠性要求極高。但如果只是將它當(dāng)作一個(gè)用于情感陪伴的“小家伙”,那即便它偶爾出現(xiàn)動(dòng)作失誤、情緒異常,這也可以理解,用戶關(guān)注的重點(diǎn)更多是它所給予的陪伴感。
我們也有和做人形機(jī)器人的團(tuán)隊(duì)交流過(guò),發(fā)現(xiàn)如果把我們這套技術(shù)運(yùn)用在人形機(jī)器人上的話,是沒(méi)法讓大模型去控制機(jī)器人這么多的自由度的,因?yàn)闄C(jī)器人首先可能站都站不穩(wěn),甚至可能還會(huì)出現(xiàn)意料之外的后果。
AI 科技評(píng)論:有人認(rèn)為,AI 陪伴是一個(gè)偽命題。您怎么看?為什么會(huì)選擇 AI 陪伴機(jī)器人賽道?
孫兆治:我們認(rèn)為機(jī)器人能夠創(chuàng)造的情緒價(jià)值,天花板一點(diǎn)也不比生產(chǎn)力價(jià)值低。
機(jī)器人提供的價(jià)值大致分為生產(chǎn)力價(jià)值與情緒價(jià)值兩類。特斯拉的機(jī)器人未來(lái)能進(jìn)工廠擰螺絲,替代工人勞動(dòng)。這是一個(gè)潛力巨大的市場(chǎng),一旦機(jī)器人真能取代人力,影響力難以估量。
但從另一方面看,智能體所承載的情緒價(jià)值,我們認(rèn)為絲毫不亞于生產(chǎn)力價(jià)值。
不妨設(shè)想一下,當(dāng)機(jī)器人成功取代人類勞動(dòng)力,社會(huì)生產(chǎn)力大幅躍升,人們衣食無(wú)憂之際,消費(fèi)重心會(huì)轉(zhuǎn)向何處?必然是那些能夠滿足精神需求、提供情緒滋養(yǎng)的產(chǎn)品。
再舉個(gè)身邊的例子,你知道中國(guó)現(xiàn)在有多少只貓和狗嗎?有數(shù)據(jù)統(tǒng)計(jì),中國(guó)至少有 6000 萬(wàn)只貓,狗的數(shù)量也差不多。而在美國(guó),貓和狗的數(shù)量差不多是中國(guó)的兩倍,日本的數(shù)量也和中國(guó)相近。這些小貓、小狗提供的幾乎都是情緒價(jià)值。現(xiàn)在養(yǎng)貓,很少有人是為了讓貓抓老鼠了。那些養(yǎng)貓養(yǎng)狗的朋友,他們每年在貓身上的花銷并不少。所以情緒價(jià)值的市場(chǎng)空間很大。
AI 科技評(píng)論:除了情感陪伴外還有其他功能嗎?比如協(xié)助導(dǎo)航、知識(shí)問(wèn)答等。
孫兆治:我們很可能會(huì)限制機(jī)器人去解答復(fù)雜的技術(shù)類問(wèn)題,也不會(huì)讓它具備太多工具屬性的功能,因?yàn)槟菢訒?huì)破壞整體的感覺(jué),讓人覺(jué)得不協(xié)調(diào)。
我們希望把機(jī)器人定義為一個(gè)專注于提供情緒價(jià)值的產(chǎn)品,我們的目標(biāo)是希望用戶能夠與小機(jī)器人結(jié)交為朋友。
AI 科技評(píng)論:國(guó)內(nèi)陪伴機(jī)器人市場(chǎng)競(jìng)爭(zhēng)激烈,你們的競(jìng)爭(zhēng)優(yōu)勢(shì)是什么?
孫兆治:大模型在情感陪伴領(lǐng)域的效果調(diào)優(yōu),我們?cè)谶@塊有很大優(yōu)勢(shì)。我們聯(lián)創(chuàng) Yuna(潘雨楠),她曾參與過(guò)字節(jié)豆包團(tuán)隊(duì)以及 MiniMax 團(tuán)隊(duì)在情感陪伴領(lǐng)域項(xiàng)目的調(diào)優(yōu)工作。此外我們團(tuán)隊(duì)也挖掘了不少算法人才,專門針對(duì)情感方面的效果做調(diào)優(yōu)。
其實(shí)這不僅僅是個(gè)技術(shù)問(wèn)題,還考驗(yàn)對(duì)用戶和場(chǎng)景的理解。比如近期很流行的戀愛(ài)類游戲,像上海疊紙開(kāi)發(fā)的《戀與深空》,它厲害的地方就在于能深入地把握女孩子的情感需求,打造出非常細(xì)膩的情感交互體驗(yàn),所以玩家才樂(lè)意玩。
我們團(tuán)隊(duì)小伙伴過(guò)去也曾做過(guò)大量類似產(chǎn)品,積累了大量相關(guān)數(shù)據(jù)以及優(yōu)化方式,能更好地在交互體驗(yàn)方面對(duì)模型進(jìn)行調(diào)優(yōu),讓智能體更具人性、更有人情味。這里面其實(shí)蘊(yùn)含著一些比較微妙、難以言傳的經(jīng)驗(yàn)。
AI 科技評(píng)論:所以你們主要的競(jìng)爭(zhēng)力是在大模型的算法上嗎?
孫兆治:對(duì),從技術(shù)層面來(lái)看,這是最主要的部分。
另一方面是產(chǎn)品設(shè)計(jì)能力,我本身是汽車設(shè)計(jì)出身。對(duì)于這類注重情感價(jià)值的硬件而言,有充分的經(jīng)驗(yàn)。不管是外觀,還是體驗(yàn)設(shè)計(jì),像機(jī)器人動(dòng)作中所呈現(xiàn)的姿態(tài)、表情,以及觸感等方面,都會(huì)涉及大量精細(xì)的設(shè)計(jì)工作。這一塊我們明顯做得比同類產(chǎn)品更好。
AI 科技評(píng)論:你預(yù)計(jì)什么時(shí)候可以商業(yè)落地?
孫兆治:我們計(jì)劃是 2025 年上半年與下半年分別發(fā)布一款產(chǎn)品。我們現(xiàn)在已經(jīng)在做一些用戶基礎(chǔ)測(cè)試,我們發(fā)現(xiàn)這個(gè)市場(chǎng)其實(shí)比我們想象的還要大,大家非常喜歡這類產(chǎn)品。一旦產(chǎn)品實(shí)現(xiàn)商業(yè)化落地,就可以得到的大量數(shù)據(jù),這可以反哺優(yōu)化我們的模型效果,形成一個(gè)用戶數(shù)據(jù)飛輪。
AI 科技評(píng)論:當(dāng)你真正開(kāi)始創(chuàng)業(yè)后,對(duì)機(jī)器人這一賽道有什么不同的感受?
孫兆治:我認(rèn)為從長(zhǎng)期來(lái)看,它所具備的價(jià)值要遠(yuǎn)超當(dāng)下絕大多數(shù)人所預(yù)想的價(jià)值。而從短期來(lái)講,它面臨的難度同樣也比現(xiàn)在絕大多數(shù)人所認(rèn)為的難度更大。
雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。