0
本文作者: 吳華秀 | 2024-09-21 16:57 |
“我們都沒做過芯片,但我們覺得這事必須要做出來?!?/p>
2016年,第一波機(jī)器人浪潮翻涌而來,馬揚(yáng)發(fā)現(xiàn),觸覺傳感器是一片被忽視的藍(lán)海。
對機(jī)器人而言,觸覺傳感器能讓機(jī)器人像人一樣,通過觸覺感知物體形態(tài)、材質(zhì)、壓力等信息。機(jī)器人一旦要執(zhí)行具體任務(wù),不可避免要與物體接觸,觸覺在此時起到重要作用。
既然觸覺傳感器如此重要,馬揚(yáng)與另外兩位聯(lián)合創(chuàng)人孫滕諶和楊五強(qiáng)一合計,三人一同躬身入局,劍指當(dāng)時鮮有人涉獵的人工智能觸覺傳感芯片。
然而,自研芯片并不簡單,更何況是一顆要放入機(jī)器人指尖的觸覺傳感芯片,這對芯片性能、體積都有嚴(yán)苛的要求。此外,馬揚(yáng)三人此前并沒有做芯片的經(jīng)驗。
顯然,這注定是條坎坷的道路。
自2017年末成立,到2022年初成功流片,他山科技整整用了四五年時間,歷經(jīng)萬般險阻,終于做出首款人工智能觸覺傳感芯片。
他山AI觸覺傳感芯片
這一芯片搭載了他山團(tuán)隊基于R-SpiNNaker分布式類腦架構(gòu)下的AI觸覺傳感技術(shù),得以在微小平面上探測多維空間觸感。此外,還能從采集到的混合信號中單獨(dú)提取特定變量,可分析處理不同的物理信號,打破了傳統(tǒng)觸覺傳感器的局限。
雖然產(chǎn)品研發(fā)上取得了突破,但過往五六年的艱辛也曾讓馬揚(yáng)心灰意冷,甚至在第二波浪潮將臨之際,他也一度不相信機(jī)器人能真的起來。
直到去年,馬揚(yáng)發(fā)現(xiàn)確實(shí)有了新變化,“整個機(jī)器人行業(yè),無論是資本的涌入,還是研發(fā)的投入,都有了新高度。與此同時,國家對機(jī)器人的定位也不一樣了?!?/p>
新變量的攪動,讓馬揚(yáng)重燃熱情與信心,又一次帶領(lǐng)團(tuán)隊義無反顧投入進(jìn)第二次機(jī)器人浪潮。
前不久,在世界機(jī)器人大會上,他山科技聯(lián)同多家機(jī)器人廠商,展示了靈巧手、機(jī)械臂和視觸融合等解決方案。
AI觸覺傳感產(chǎn)品矩陣
他山科技不僅在技術(shù)上持續(xù)創(chuàng)新突破,也在產(chǎn)業(yè)落地上頻頻布局,堅持技術(shù)與市場雙輪驅(qū)動。
以機(jī)器人為終局的他山科技,重點(diǎn)部署觸覺傳感器、電子皮膚等領(lǐng)域。此外,秉持著兩條腿走路的態(tài)度,馬揚(yáng)還將目光望向了汽車、家電、消費(fèi)電子等多個場景,成功拿下了奔馳、寶馬等多家主機(jī)廠供應(yīng)商資質(zhì),并與比亞迪在多個項目上達(dá)成量產(chǎn)。
如今,他山科技已推出了多款觸覺傳感芯片,并步入正軌,有望在明年實(shí)現(xiàn)盈虧平衡。
一路披荊斬棘的他山科技,正在一步步越過山丘。上周,馬揚(yáng)向AI科技評論細(xì)數(shù)了他山科技的發(fā)展,并圍繞觸覺傳感芯片解答了我們的困惑。
期間,馬揚(yáng)雖然較少談及機(jī)器人信仰與情懷,更多討論的是實(shí)實(shí)在在的技術(shù)和路線。但談話中,我們能感受到馬揚(yáng)對機(jī)器人發(fā)展的樂觀與向往。
以下是 AI 科技評論與馬揚(yáng)的訪談實(shí)錄,作者進(jìn)行了不改變原意的編輯整理:
AI科技評論:為什么取名作他山科技,有什么含義嗎?
馬揚(yáng):剛成立時,我們與投資人談,說的第一件事就是先把硬件做出來。做芯片相當(dāng)于將二氧化硅變成一個更值錢的東西,于是想到了詩經(jīng)里“他山之石可以攻玉?!?/p>
他山不同的芯片也是用不同石頭名字來命名,最早的芯片就叫紅寶石,叫Ruby;第二顆叫紅水晶;第三顆用在消費(fèi)級上,相對用量更大一些、便宜點(diǎn),我們就叫雨花石。
AI科技評論:是什么契機(jī)讓你們決定進(jìn)入觸覺傳感領(lǐng)域?
馬揚(yáng):2016、2017年正好是機(jī)器人行業(yè)前一波比較火的一個浪潮,我們看到波士頓動力做出了行走功能不錯的機(jī)器人,國內(nèi)優(yōu)必選、達(dá)闥也是最早的一波頭部公司。在我們看來,這些公司偏屬移動派,更多強(qiáng)調(diào)移動能力,能通過屏幕與人進(jìn)行語音互動。
我們當(dāng)時覺得,未來機(jī)器人更重要的事情肯定是對目標(biāo)任務(wù)的執(zhí)行,基于這一角度,觸覺能力就比較重要。實(shí)際上,在公司成立前10年左右的時間,我們在算法層面做了不少觸覺任務(wù)端的訓(xùn)練,也取得了一些不錯的成績。
在那個時間點(diǎn),我們發(fā)現(xiàn)如果要在機(jī)器人手端做執(zhí)行,最大的壁壘是如何將芯片小型化,以便能放入指尖。當(dāng)時市面上沒有任何一顆芯片能做到,我們也是一時沖動,想著要不我們就先把這顆芯片做出來,于是成立了他山科技。
AI科技評論:第一波浪潮里認(rèn)為機(jī)器人在任務(wù)執(zhí)行這塊會有發(fā)展?jié)摿Γ?/strong>
馬揚(yáng):2016、2017年那波機(jī)器人公司,很多做的是非商業(yè)化項目,主要是進(jìn)行語音和視覺交互的輪式機(jī)器人。當(dāng)時我們覺得機(jī)器人在任務(wù)執(zhí)行上非常欠缺,如果真正讓機(jī)器人商業(yè)化落地,走進(jìn)家庭,任務(wù)執(zhí)行是必須要去做的事。
回頭看這幾年最好的兩個方向,一個是智能駕駛,將人從戶外空間 a 移動到 b,完成物理空間的執(zhí)行;另一個是機(jī)器人,更多是幫助人類完成室內(nèi)環(huán)境的移動任務(wù)。無論是洗碗炒菜,還是整理物品,這些都離不開觸覺、指尖的執(zhí)行能力,這是我們當(dāng)時比較篤定的一個方向。
AI科技評論:加入這波浪潮時,當(dāng)時的挑戰(zhàn)是什么?
馬揚(yáng):當(dāng)時整個市場上,還沒有人很深刻地去思考機(jī)器人的執(zhí)行問題,而我們主要從機(jī)器人的廣義層面來思考執(zhí)行。廣義上的機(jī)器人,包括工廠里的機(jī)械臂,都是自動閉環(huán)。所謂自動閉環(huán),舉個例子,工廠機(jī)械臂執(zhí)行任務(wù)時,目標(biāo)是針對固定物體進(jìn)行移動,這一執(zhí)行動作是明確的動作,因此大部分機(jī)械臂在實(shí)際操作時并不需要添加感知,只需設(shè)定好一個重復(fù)性的動作即可。當(dāng)然,有一部分可能會加一些視覺,比如當(dāng)物體位置有所變化時,一個基礎(chǔ)的3D視覺能實(shí)現(xiàn)空間定位,然后機(jī)器人再執(zhí)行下一步命令。
但這會存在一個實(shí)際問題,即執(zhí)行的動作得是已經(jīng)學(xué)習(xí)過的,或目標(biāo)物體的各種特性很明確,甚至說目標(biāo)物體必須是一個剛性物體,才能完成這樣的執(zhí)行。我們當(dāng)時和其他廠商溝通,發(fā)現(xiàn)大家想做的其實(shí)是泛化抓取,也就是執(zhí)行泛化任務(wù)。那時候要是能把桌上不同的幾個物體抓起來,就很不錯了。
我們那波最早進(jìn)入機(jī)器人產(chǎn)業(yè)的人其實(shí)都有點(diǎn)過于樂觀了,當(dāng)時覺得真正走進(jìn)家庭也就三五年,最多不超過 10 年,但現(xiàn)在也過去了七八年?;赝莻€時間點(diǎn),其實(shí)還缺很多東西,尤其是用人工智能做學(xué)習(xí)時,機(jī)器人的一些硬件條件、基礎(chǔ)要求還很難達(dá)到。
AI科技評論:您提到第一波浪潮中缺了不少東西,具體是少了哪些?現(xiàn)在都補(bǔ)上來了嗎?
馬揚(yáng):那時候我感覺機(jī)器人離人還很遠(yuǎn),更多是做出一個像人形的機(jī)器人,能給人看就不錯了。就像一個工業(yè)品,最終實(shí)現(xiàn)需要三步,第一步是想出來,第二步是做出來,第三步是用起來。我感覺第一波浪潮更多是介于第一和第二階段的中間,很多東西都還是一個idea,在“想出來”和“做出來”中間還是差了很多東西。在當(dāng)下這一時間點(diǎn)上,大部分是第二步過渡向第三步,大家已經(jīng)在做小批量商用,這也是為何這波參與進(jìn)來的人更多。
AI科技評論:所以當(dāng)時是直接將目標(biāo)瞄準(zhǔn)向泛化執(zhí)行?
馬揚(yáng):這是比較具體的一個目標(biāo),我們更大的目標(biāo)就是為機(jī)器人提供可在邊緣段執(zhí)行作業(yè)任務(wù)的觸覺能力。
AI科技評論:你們是只做芯片這一塊嗎?
馬揚(yáng):并不是。我們最早要做的事情,其實(shí)是機(jī)器人整個觸覺的解決方案。換言之,我們做的是整個皮膚端的解決能力,其中最主要的是指尖傳感器。
當(dāng)時有一家美國公司指尖傳感器做的能力效果和技術(shù)指標(biāo)還行,但國內(nèi)售價高達(dá)2萬至3萬美金。所以我們當(dāng)時定下了一個主要的任務(wù)目標(biāo)——先把指尖傳感器做好。
AI科技評論:指尖傳感器的技術(shù)要求高,主要門檻在哪里?
馬揚(yáng):對指尖傳感器而言,其核心需求是既要實(shí)現(xiàn)感知,又要實(shí)現(xiàn)抓取,這也是觸覺與其他感知不同之處。
在整個感知領(lǐng)域,視覺與聽覺這兩部分已經(jīng)做得比較成熟,不僅與人的能力不相上下,甚至能超越人的能力。為什么它們能比觸覺做得更快?因為對這部分感知來說,只是對客觀世界的一個圖像化,或是脈沖化的一個反應(yīng)。再基于過往十年多人工智能的深度學(xué)習(xí),我們已經(jīng)擁有了一套成熟的算法,基于此,視覺與聽覺能達(dá)到并超越人的能力。
觸覺相對比較難的一點(diǎn)是除了感知外還要做執(zhí)行,甚至可以說,更重要的是做執(zhí)行。機(jī)器人要想完成一個執(zhí)行的目標(biāo),首先要通過視覺的引導(dǎo),“物體在哪里?”;當(dāng)接近物體時,此時感知轉(zhuǎn)移到觸覺上。觸碰物體時,要感知物體的材質(zhì)、形狀、三維力,將物體整個拿起來作交接時,還需要感知物體內(nèi)部重心的變化。整個過程中,觸覺端要完成從感知到執(zhí)行的全閉環(huán)。
我舉個例子,比如拿起一杯水,如果杯子是柔性材質(zhì),那么在抓取和拿起的過程中,杯子的重心和形狀會一直不斷地發(fā)生變化。當(dāng)人做這一件事時,不同指尖在抓取姿勢和力度的控制上都相應(yīng)會有所調(diào)整。這對于機(jī)器人也是如此,需要不斷進(jìn)行調(diào)整和閉環(huán)。
AI科技評論:目前觸覺感知技術(shù)的發(fā)展情況如何?
馬揚(yáng):對觸覺而言,主要是兩個問題。
第一個問題,在前端上要有更快的反應(yīng)速度。例如,六十赫茲頻率,對視覺而言已經(jīng)算是高頻,對于人眼已經(jīng)足夠。但對于觸覺端,六十赫茲或一百赫茲還遠(yuǎn)遠(yuǎn)不夠。要想達(dá)到人類的能力,基本上要達(dá)到毫秒級,即千赫茲。
此外,觸覺傳感器的數(shù)量更多。無論是觸覺還是聽覺,對機(jī)器人而言一個視覺或聽覺傳感器就夠了。但觸覺涉及到最后目標(biāo)任務(wù)的執(zhí)行,必然需要多個傳感器一起做,比如抓取一杯水,得要有五個傳感器在五個不同的指尖來協(xié)同完成。
每一個指尖傳感器,也是由多個傳感單元來協(xié)同完成。不同于視覺、聽覺只需一個芯片就可解決所有的數(shù)據(jù)問題,由于觸覺感知端可能是幾十個甚至上百個傳感器共同工作,其中所產(chǎn)生的數(shù)據(jù)僅靠一個芯片難以為繼,所以我們采用分布式多芯片系統(tǒng),以便在前端低延時、低功耗狀態(tài)下能實(shí)現(xiàn)快速邊緣處理。
這就好比,當(dāng)我們摸了一個很燙的東西,手會本能地快速躲避。此時動作并不需過腦,完全是靠手部前端的解決能力和神經(jīng)元,因此就需要在邊緣端實(shí)現(xiàn)從感知到執(zhí)行的自主全閉環(huán)。
第二個問題,觸覺由于感知維度不同,涉及物體的材質(zhì)、形狀、表面干濕度、三維力、法向力、切向力的情況,且是分布式傳感器,要解析多維的觸覺數(shù)據(jù),就需要在算法端上從基本的感知結(jié)構(gòu)上去解決問題。
這也是為何對機(jī)器人來講,視覺與聽覺已經(jīng)達(dá)到了一定的商業(yè)化程度,而觸覺相對來說還比較慢的原因。
AI科技評論:指尖傳感器會產(chǎn)生大量數(shù)據(jù),一般如何處理數(shù)據(jù)?
馬揚(yáng):數(shù)據(jù)的處理有兩點(diǎn)。數(shù)據(jù)在單個傳感器上完成時,我們會強(qiáng)調(diào)在單個芯片上快速從感知到執(zhí)行全程數(shù)據(jù)處理的能力。第二,當(dāng)我們執(zhí)行抓取動作時,中間的快速反應(yīng)需要在前端的硬件上完成,即邊緣端要有分布式的數(shù)據(jù)處理能力。
2016、2017年以前,我們基本上也是基于深度學(xué)習(xí)或卷積的算法去做數(shù)據(jù)處理,采用的也是市面上主流的芯片。但是做下來后,我們發(fā)現(xiàn)整個體積和反應(yīng)時間達(dá)不到應(yīng)用端的需求,這也是我們自己要去做芯片的原因。
AI科技評論:相當(dāng)于是在 SNN 結(jié)構(gòu)這一塊找到了突破口?
馬揚(yáng):對,不過與其說是找到一個突破口,不如說是為 SNN 結(jié)構(gòu)找到了一個比較好的應(yīng)用方向。大家原來都會有一個疑惑,就是 SNN 結(jié)構(gòu)很好,但要用在哪里呢?我想,我們找到了一些答案。
AI科技評論:觸覺感知方案上為什么會選擇電容感知這一方向?
馬揚(yáng):聯(lián)創(chuàng)孫滕諶與楊五強(qiáng)是77屆清華自動化系同學(xué)。孫滕諶發(fā)明了平面電容與曲面電容技術(shù),楊五強(qiáng)在曼徹斯特大學(xué)任教時一直在研究電容測量技術(shù)??梢哉f,我們在電容技術(shù)這塊積累了非常強(qiáng)的know-how。
90年代末時,楊五強(qiáng)的一項技術(shù) ECT 在工業(yè)端得到了廣泛的應(yīng)用。我們將搭載電容的傳感單元裝在石油管道外側(cè),可實(shí)時探測管道橫截面上油與水的成分,還能直接做出內(nèi)部物體材質(zhì)的成像。這說明,電容技術(shù)能很好識別物體材質(zhì)。
這樣的應(yīng)用放在10年前,在我們開始做抓取學(xué)習(xí)時非常有用。好比,抓一個塑料瓶還是抓一個玻璃瓶?用多大的力抓???人抓取任何物體時的底層邏輯是,用盡可能小的壓力不讓物體在手中滑動。電容技術(shù)能在抓取過程中提供除視覺端外的觸覺信息,以便幫助我們在抓取端獲取信息。
我們后來又改進(jìn)了傳感端的結(jié)構(gòu),采用多對的電容傳感器,再加以力的識別結(jié)構(gòu),可以很好地做三維力的學(xué)習(xí)。并且,我們在算法上可以把這兩層做一個很好的分級,既能解決前面部分,又能解決后面部分,讓兩部分?jǐn)?shù)據(jù)不產(chǎn)生耦合,這其實(shí)非常有難度。
四五年前,包括現(xiàn)在都有很多選擇了電容這一路線的團(tuán)隊。通過單一傳感器對多維觸覺數(shù)據(jù)做解耦,在這一塊我們可以說我們是做得最好的。
AI科技評論:目前市面上還有哪些路線方案?
馬揚(yáng):觸覺傳感器目前路線方案較多,我們看現(xiàn)在不同的路線都是可行的,其他路線包括視觸覺路線、電子霍爾路線,還有壓電壓感材料等。
在我們看來,機(jī)器人的不同部位對觸覺的需求不太一樣,采用的路線也會有所差異。比如,軀干更多強(qiáng)調(diào)的是可替代化,對單點(diǎn)要有足夠的感知能力,整體成本要足夠低。像壓阻、壓電材料成本已經(jīng)很低了,就很適合大面積布置在機(jī)器人身體上。只不過對于機(jī)器人而言,電子皮膚得是點(diǎn)陣式,一個點(diǎn)壞了,能快速替換掉。
對于指尖傳感器而言,電容感知是業(yè)內(nèi)普遍認(rèn)可的一個方案。雖然也有其他方案路線,但在我們看來都有些不足。比如,有的只是一個中間方案,實(shí)際感知維度是達(dá)不到的;還有的可能更適合做展示、做POC、做樣件。從最終路線的實(shí)現(xiàn)來看,我們會認(rèn)為電容是一個非常合適的解決方案。
AI科技評論:電容感知方案得到了行業(yè)認(rèn)可,目前是主流方案嗎?
馬揚(yáng):從指尖傳感器對廠家的出貨量上看,我覺得已經(jīng)是一個主流方案了。其次,近些年來,我們每年參加 IPRA 會議都會與業(yè)內(nèi)人溝通交流,大家也會認(rèn)為要實(shí)現(xiàn)人形,從目前幾種路線來看是最可行的一個方案。
AI科技評論:觸覺傳感器再進(jìn)一步發(fā)展,要突破的關(guān)鍵點(diǎn)有哪些?
馬揚(yáng):第一個是在傳感端,整個傳感器的結(jié)構(gòu)上大家并沒有走在同一個路線上,a有a的路線,b說b的路線,這就造成傳感器端在商業(yè)化上的速度相對來講是比較慢的。
今年,指尖傳感器我們已經(jīng)可以做到1萬顆及以上的批量了,在行業(yè)里我們應(yīng)該算多了。但我也很難篤定地說我們的穩(wěn)定性已經(jīng)非常好了。如果沒有一個幾十萬,甚至更多的批量,要說自己的穩(wěn)定性非常好,可能都是一句比較空的話。
第二個問題是由第一個問題衍生出來的,大家現(xiàn)在在觸覺端缺少一個可執(zhí)行的標(biāo)準(zhǔn)。大家可以用不同思路做感知,但是感知完后關(guān)于力的一些基礎(chǔ)數(shù)據(jù),在解碼端可以用同一種方式做解碼和存儲,這有利于大家快速地做下一代產(chǎn)品迭代。因為不管是誰的數(shù)據(jù),如果我們大家可以用起來,不過在短期內(nèi)也不太好解決。
再往長遠(yuǎn)看,后面還有一個小壁壘,我們現(xiàn)在還沒講觸覺與視覺相融合。從抓取執(zhí)行的動作來看,視覺先做完再交給觸覺,觸覺執(zhí)行完再還給視覺,不斷反復(fù)進(jìn)行這一過程。人在這一過程中,是用模糊計算做視觸融合,在不同時間里的視觸占比會有所變化,對此人是有自己非常精妙的一套機(jī)制,但對機(jī)器人而言這怎么設(shè)定呢?這會是未來要思考的問題。
此外,我們比較強(qiáng)調(diào)先在手端做私有網(wǎng)絡(luò)訓(xùn)練,然后再把手端數(shù)據(jù)給到腦端,由腦與手的數(shù)據(jù)相結(jié)合,再去做后面的訓(xùn)練,以具備更好的水平。但目前怎么做這種協(xié)調(diào)的訓(xùn)練,也是比較難解決的一個問題。
AI科技評論:今年WRC展會上也看到了不少觸覺傳感器相關(guān)廠商,現(xiàn)在觸覺傳感器市場情況如何?
馬揚(yáng):這次展會上看到做手的廠商是最多的,不只是傳統(tǒng)靈巧手廠商,還有一些頭部機(jī)器人廠商也在做手,包括一些觸覺傳感器廠商也加入。
現(xiàn)在傳感器走到了一個節(jié)點(diǎn)上,主要是兩條路徑。一個是傳統(tǒng)行業(yè)里的傳感器,有電容屏、觸摸屏等應(yīng)用,整個市場規(guī)模也比較大。另一個方向,就是從傳統(tǒng)材料切進(jìn)整個人形機(jī)器人做觸覺感知,但大家對未來的瞄點(diǎn)不同,技術(shù)路徑不同,而這個市場還在慢慢起來,朝著更大的商用方向。目前現(xiàn)在做得出色的還相對較少,未來一兩年可能會有一次比較大的洗牌。
AI科技評論:您親歷了兩次機(jī)器人浪潮,您覺得這兩次浪潮的變化在哪里?
馬揚(yáng):我覺得第一波其實(shí)相對要虛一點(diǎn),而第二波明顯在落地上會更清晰一些。
第一波沒有很多商業(yè)化的東西。當(dāng)時大家更多就是做出來一個樣子,主要也是為了展示技術(shù)能力,以更好融資來進(jìn)行下一步。從我們的感受來看,第一波我們還在找方向,也沒有什么競爭對手。其實(shí),如果沒有競爭對手,就像走夜路一樣,走兩步就得檢查走得對不對。
我希望從第二波開始,這會是真正的一個趨勢,而不只是一個浪潮這樣。尤其是去年年底開始談?wù)摼呱碇悄?,具身智能也涵蓋不同的感知,其中觸覺得到了更多的重視。我們也看到了更多友商、合作伙伴的加入。這相當(dāng)于是把我們要做的事情具象化了,商業(yè)化也變得更現(xiàn)實(shí)了。
AI科技評論:對于人形機(jī)器人的發(fā)展,您是樂觀的嗎?
馬揚(yáng):我還是很樂觀的。很多人在討論,人形落地還要多少年?我覺得這個事情并不是從 0 到 1 的一蹴而就,而是中間會有很多過渡階段。比如我們之前談?wù)摕o人駕駛,雖然到現(xiàn)在也沒有實(shí)現(xiàn)純粹無人駕駛,但是智能駕駛在汽車應(yīng)用上起到了越來越重要的作用, 商業(yè)化方面已經(jīng)做得非常好了。
那么機(jī)器人其實(shí)也是一樣的。我們作為消費(fèi)者,其實(shí)現(xiàn)在還不需要一個能和人同等聰明的機(jī)器人——既能幫我做事,又能給我提供情緒價值,這是一個很遠(yuǎn)的事情。
但是從發(fā)展路徑上看,首先在一些專用場合,比如物流、清潔、養(yǎng)老等都是比較落地的方向,需求顯著。而且,人對機(jī)器人的容忍度并不像我們想的那么難以接受。好比智能駕駛汽車一開始也會有一些弱智表現(xiàn),但只要能給人提供便利,人還是能包容汽車的一些小失誤。所以我們會覺得,機(jī)器人的市場實(shí)在是太大了,你只要能做出一些小小的進(jìn)步,大家就能共同推動行業(yè)一步步發(fā)展。
看今年的情況,我覺得大家都很務(wù)實(shí)?,F(xiàn)在大家都很少談雙足了,基本上都會認(rèn)為可以先做一個輪式,先解決室內(nèi)平地問題。我們也看到很多廠商已經(jīng)可以把成本控制到一兩萬左右,在這基礎(chǔ)上我們能夠訓(xùn)練出一些執(zhí)行能力的話,我想在未來兩年里應(yīng)該很快會有落地。
AI科技評論:您對通用機(jī)器人的想象是什么?
馬揚(yáng):我希望未來的通用機(jī)器人能擁有與人相類似的能力,不僅是物理空間的移動操作能力,也包括情感能力。
我為什么會這么想呢?我們在研究觸覺感知時,中間經(jīng)常要觀察和學(xué)習(xí)人是如何感知的。人特別有意思,人獲取的信息是靠脈沖和神經(jīng)元,這獲取的信息非常模糊,而且都是沖擊信號,沒有具體信號。具體信號只集中在有限的感知上,如視覺和聽覺,其他的都得要充分去調(diào)動大腦才能獲取一些信息。
現(xiàn)在機(jī)器人的信息獲取能力已經(jīng)超過了人。在最終情感的實(shí)現(xiàn)上,人其實(shí)是通過不斷積累的神經(jīng)元訓(xùn)練所得,那么機(jī)器人也可以通過不斷喂數(shù)據(jù)的方式獲得與人相類似的情感溝通能力。
現(xiàn)在機(jī)器人數(shù)據(jù)量已經(jīng)足夠大,但它的維度還沒有像人這么多,所以我們希望能夠在觸覺端解決更高維度的問題。我們下一步其實(shí)也在做多模態(tài)的前端訓(xùn)練,我們希望把聽覺、視覺,甚至嗅覺的脈沖信號都加進(jìn)去,在前端做更多的私有訓(xùn)練。
雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。