1
本文作者: 王金旺 | 2019-01-21 22:21 |
“智能音箱不足以成為第三代人機(jī)交互中心,第三代人機(jī)交互中心將會(huì)是機(jī)器人,”在2019 極客公園創(chuàng)新大會(huì)會(huì)后接受雷鋒網(wǎng)采訪時(shí),優(yōu)必選CTO熊友軍這樣講。
在演講中,熊友軍用一張圖展示了這一觀點(diǎn):機(jī)器人將會(huì)是第三代人機(jī)交互中心。而在前不久CES 2019上,優(yōu)必選推出了Walker新一代,也為這一觀點(diǎn)輔以產(chǎn)品原型。
熊友軍認(rèn)為,機(jī)器人要同時(shí)擁有機(jī)器的屬性和人的屬性。
所謂擁有機(jī)器的屬性,是指能夠代替人類,完成現(xiàn)在機(jī)器完成的一些工作;
所謂擁有人的屬性,是指擁有人的智能,包括感知智能、認(rèn)知智能和運(yùn)動(dòng)能力。例如,感知方面的語音技術(shù)、機(jī)器視覺正是模仿人類的耳朵和眼睛;認(rèn)知方面的遷移學(xué)習(xí)、強(qiáng)制學(xué)習(xí)正是模仿人類的思維方式;運(yùn)動(dòng)方面的直立行走、手眼協(xié)調(diào)則是模仿人類的運(yùn)動(dòng)方式。
相較于最近火熱的入口設(shè)備概念,熊友軍認(rèn)為,“(人形)機(jī)器人是人類與環(huán)境的接口。”從CES 2019上來看,機(jī)器人也再度成為今年一個(gè)熱議話題,優(yōu)必選也推出Walker新版本,三歲多的Walker也終于有了手臂,并輔以更多交互性功能。
在CES 2019上,優(yōu)必選的主推產(chǎn)品Walker身高1.45米,擁有36個(gè)高性能伺服關(guān)節(jié)(腿:6x2,臂:7x2,手:4x2,頸:2),其中,雙臂擁有7個(gè)自由度,據(jù)官方數(shù)據(jù)顯示,在智能感知方面,Walker具有力覺、視覺、聽覺、空間感知系統(tǒng)及能力。另外,輔以手眼協(xié)調(diào)能力,Walker可以實(shí)現(xiàn)端茶倒水,可以開冰箱取飲料。詳見雷鋒網(wǎng)此前報(bào)道:《解讀優(yōu)必選新一代Walker開冰箱取飲料背后的邏輯 | CES 2019》。
在CES 2018上,優(yōu)必選曾展出其前一代Walker,相對而言,前一代Walker產(chǎn)品原型中并沒有加入手臂,因而當(dāng)時(shí)提的是「雙足機(jī)器人」概念;此次加入雙臂后,優(yōu)必選將Walker新一代定義為「大型仿人服務(wù)機(jī)器人」。
優(yōu)必選CTO熊友軍
雷鋒網(wǎng):Walker增加了雙臂后,在技術(shù)上主要進(jìn)行了哪些優(yōu)化?
熊友軍:在運(yùn)動(dòng)控制方面,Walker新一代主要包括對直立行走進(jìn)行了優(yōu)化,提升了穩(wěn)定性,讓W(xué)alker能夠適應(yīng)在各種路面行走和外部沖擊;手眼協(xié)調(diào)方面,增加雙臂后,我們希望Walker能夠能完成更多的工作,想要完成更多工作需要解決很多問題,例如現(xiàn)在機(jī)器人可以端茶倒水,實(shí)際上對于手眼協(xié)調(diào)技術(shù)的要求很高,我們也對Walker新一代增加了一些新的控制策略。
雷鋒網(wǎng):針對Walker接下來的迭代、技術(shù)更新,優(yōu)必選會(huì)針對哪些方面展開?
熊友軍:Walker從立項(xiàng)到現(xiàn)在才近三年的時(shí)間,所以目前還處于比較初級(jí)的一個(gè)狀態(tài),跟Atlas(波士頓動(dòng)力的人形機(jī)器人)相比還是一個(gè)非?!澳贻p”的產(chǎn)品。針對Walker,我們制定了非常長遠(yuǎn)的規(guī)劃,優(yōu)必選最終的目標(biāo)是希望它能夠走入家庭。現(xiàn)階段,Walker需要解決的還是進(jìn)一步提高對環(huán)境的適應(yīng)能力,其次是可靠性、穩(wěn)定性的繼續(xù)提升。
雷鋒網(wǎng):也就是說之后的主要研發(fā)方向還是在運(yùn)動(dòng)控制方面?
熊友軍:運(yùn)動(dòng)控制需要持續(xù)不斷地改進(jìn)。
雖然Walker新一代在運(yùn)動(dòng)能力上距離大眾對智能機(jī)器人的期望還有一定距離,但是在一年的時(shí)間內(nèi),相較上一版本,Walker新一代在運(yùn)動(dòng)能力和控制能力上都得到了一定的提升。熊友軍也向雷鋒網(wǎng)表示,其實(shí)大眾對于人形機(jī)器人的期望還是太高,目前更應(yīng)該對大眾在技術(shù)上做更多的市場普及和教育,讓更多人能夠理解現(xiàn)階段的人形機(jī)器人可以做什么,讓更多人愿意與現(xiàn)階段人形機(jī)器人交互,這也將會(huì)使得機(jī)器人在環(huán)境適應(yīng)方面擁有更多的反饋數(shù)據(jù),技術(shù)和能力提升也會(huì)更快。
現(xiàn)階段的機(jī)器人,電源問題仍是個(gè)關(guān)鍵問題,此前雷鋒網(wǎng)在各大展會(huì)上看到的國內(nèi)外機(jī)器人團(tuán)隊(duì),背后都會(huì)有一條長長的電纜(電源線),通過電纜接交流電進(jìn)行供電。據(jù)此前Walker在CES 2019上的表現(xiàn)來看,Walker并沒有外接電源,而是使用了電池供電,官方數(shù)據(jù)也顯示,Walker采用 54.6V/10Ah/ 6kg磷酸鐵鋰電池,2小時(shí)充滿電后,可以實(shí)現(xiàn)2小時(shí)持續(xù)供電。據(jù)此,雷鋒網(wǎng)也尋求了熊友軍在技術(shù)方面的解讀。
雷鋒網(wǎng):Walker如何解決續(xù)航問題?
熊友軍:機(jī)器人巨大的耗電量實(shí)際上主要來自于關(guān)節(jié)部位,伺服舵機(jī)是最主要的耗電單元,而它的耗電量又與效率有關(guān)。伺服舵機(jī)是優(yōu)必選的強(qiáng)項(xiàng),Walker的伺服舵機(jī)除了擁有減速裝置外,在算法上也有非常好的控制策略能力。在這些方面我們做了很多優(yōu)化,包括單個(gè)伺服舵機(jī)的驅(qū)動(dòng)方式、機(jī)器人直立行走的算法、手眼協(xié)調(diào)的算法等,從而大幅降低機(jī)器人在運(yùn)動(dòng)狀態(tài)下的耗電量。
雷鋒網(wǎng):您剛才提到伺服驅(qū)動(dòng)占了耗電量的很大一部分?大概能占到多少?
熊友軍:舉個(gè)例子,機(jī)器人不斷地在運(yùn)動(dòng)或做一些動(dòng)作的時(shí)候,它的續(xù)航時(shí)間可以達(dá)到兩個(gè)小時(shí)。而在固定不動(dòng)的狀態(tài)下,如果它的視覺和語音系統(tǒng)、操作系統(tǒng)都在運(yùn)行,機(jī)器人可以正常工作8、9個(gè)小時(shí),實(shí)際上伺服驅(qū)動(dòng)占了非常大的耗電量。
雷鋒網(wǎng):現(xiàn)在大部分機(jī)器人的靈活性相對于人還是有一定差別的,主要是因?yàn)榭刂扑惴ǖ膯栴}嗎?
熊友軍:其中主要有兩方面問題:算法問題、成本考慮。機(jī)器人之所以不能夠完全像人一樣運(yùn)動(dòng),首先是因?yàn)樗年P(guān)節(jié)不夠多,人有好幾十個(gè)自由度,機(jī)器人目前一般只有十幾個(gè)自由度。雖然Walker有36個(gè)自由度,但還是不夠靈活。如果想要機(jī)器人像人一樣靈活,成本會(huì)上升,這樣的做法是不是合適,能否被市場接受,是一個(gè)很重要的問題。另外,它的運(yùn)算確實(shí)有一些難度,機(jī)器人如果有幾十個(gè)自由度,對控制算法的要求實(shí)際上會(huì)很高。
雷鋒網(wǎng):會(huì)存在決策和計(jì)算能力放在云端導(dǎo)致延遲的原因嗎?
熊友軍:機(jī)器人的運(yùn)動(dòng)控制部分算法基本上不會(huì)放到云端,都是放到本地端處理。因?yàn)檫\(yùn)動(dòng)控制需要考慮實(shí)時(shí)性,每個(gè)關(guān)節(jié)都有一塊芯片計(jì)算它做運(yùn)動(dòng)的控制,在機(jī)器人的主控制上也會(huì)有做決策調(diào)度、運(yùn)動(dòng)規(guī)劃的東西。
優(yōu)必選成立于2012年,初創(chuàng)團(tuán)隊(duì)以伺服舵機(jī)起家,早在2008年,其初創(chuàng)團(tuán)隊(duì)已經(jīng)著手研發(fā)人形機(jī)器人的伺服舵機(jī)。從熊友軍的解釋中也不難看出,伺服舵機(jī)其實(shí)在整個(gè)機(jī)器人系統(tǒng)中,是非常重要的部分,無論是電源系統(tǒng),還是運(yùn)動(dòng)控制系統(tǒng),都會(huì)受到這方面的制約。而從現(xiàn)在業(yè)界備受困擾的電源問題來看,不僅需要在電源技術(shù)上尋求突破,在電源技術(shù)尚且難以滿足需求時(shí),還需要在伺服舵機(jī),以及其他功能設(shè)計(jì)和結(jié)構(gòu)設(shè)計(jì)上尋求降低功耗。
導(dǎo)航算法是機(jī)器人的另一塊關(guān)鍵技術(shù)體現(xiàn),現(xiàn)在服務(wù)類機(jī)器人主流導(dǎo)航算法是SLAM算法,也有諸多廠商根據(jù)這一算法進(jìn)行了優(yōu)化設(shè)計(jì),并進(jìn)行場景化應(yīng)用,優(yōu)必選采用的也是這樣的套路,在SLAM算法基礎(chǔ)上進(jìn)行優(yōu)化,形成自有的U-SLAM算法。
另外,開發(fā)系統(tǒng)方面,現(xiàn)在機(jī)器人采用的主流系統(tǒng)是ROS系統(tǒng),但是由于ROS系統(tǒng)存在諸多問題,例如多為學(xué)術(shù)界使用,場景化應(yīng)用存在很大問題,因而也為實(shí)際場景化應(yīng)用帶來了諸多難題。優(yōu)必選在去年發(fā)布了自己的ROSA系統(tǒng)。
雷鋒網(wǎng):Walker機(jī)器人的U-SLAM導(dǎo)航系統(tǒng)和現(xiàn)在主流的SLAM導(dǎo)航系統(tǒng)有什么不同?
熊友軍:目前市面上機(jī)器人大部分的視覺都是基于激光雷達(dá)導(dǎo)航技術(shù),這種導(dǎo)航技術(shù)有一些缺點(diǎn),第一,成本高;第二,對環(huán)境的要求高,不適合在家庭中使用,因?yàn)樗鼨z測不到玻璃,還有一些細(xì)的家具的腿是檢測不到的。Walker融合了多種傳感技術(shù),不僅有激光,更多的是視覺方面的技術(shù),能夠讓機(jī)器人的適應(yīng)性更好。
Walker進(jìn)入家庭中,它會(huì)在家中走一圈,基于它的視覺和激光傳感器,針對整個(gè)家庭的環(huán)境建三維地圖。這樣它會(huì)知道門在什么地方、洗手間在哪、衛(wèi)生間在哪,下次你跟Walker說,Walker幫我從冰箱里面拿一杯水出來,它自然而然就會(huì)知道冰箱的位置。
雷鋒網(wǎng):優(yōu)必選去年推出了ROSA 機(jī)器人操作系統(tǒng),這個(gè)操作系統(tǒng)相對于現(xiàn)有的ROS系統(tǒng)有哪些不同?
熊友軍:首先,ROSA是基于行業(yè)的迫切需求而推出的機(jī)器人操作系統(tǒng)。優(yōu)必選深耕機(jī)器人行業(yè)多年,我們知道整個(gè)行業(yè)缺什么。機(jī)器人研發(fā)的鏈條非常長,從底層的硬件到通訊、控制算法、APP,想做機(jī)器人創(chuàng)業(yè)實(shí)際上周期非常長、風(fēng)險(xiǎn)非常大。
我們希望能夠推動(dòng)產(chǎn)業(yè)快速發(fā)展,通過機(jī)器人操作系統(tǒng)把一些標(biāo)準(zhǔn)、技術(shù)集合起來,讓更多的用戶、機(jī)器人開發(fā)者、機(jī)器人愛好者可以使用,縮短他們的開發(fā)周期。ROSA集成了語音、運(yùn)動(dòng)控制、視覺、調(diào)控的策略,然后打包、封裝起來,更具有智能性。
其次是模塊化,如果你的機(jī)器人不需要視覺,就可以去掉視覺模塊,讓機(jī)器人跑得更快。還有一些標(biāo)準(zhǔn),機(jī)器人跟應(yīng)用層打交道,跟底層的硬件打交道,我們固化下來后,形成統(tǒng)一的機(jī)器人標(biāo)準(zhǔn),進(jìn)一步減少在交互資源上的消耗。
前文有提到,正是由于普通用戶對機(jī)器人期望太高,機(jī)器人實(shí)際發(fā)展現(xiàn)狀并無法做到一個(gè)機(jī)器人可以應(yīng)用到各個(gè)行業(yè),機(jī)器人供電問題、運(yùn)動(dòng)控制問題、場景化落地問題,這些問題都使得類似于電視節(jié)目中的智能管家機(jī)器人尚且難以實(shí)現(xiàn)。因而,熊友軍認(rèn)為,機(jī)器人其實(shí)應(yīng)該首先落地于特定場景,談到Walker2019年的計(jì)劃,熊友軍表示,首先會(huì)在科研和高校方面與相關(guān)廠商展開合作。
雷鋒網(wǎng):現(xiàn)在很多機(jī)器人是一個(gè)平板加一個(gè)外殼就投放到市場應(yīng)用,您如何看待國內(nèi)機(jī)器人市場的大環(huán)境?
熊友軍:我覺得這是產(chǎn)業(yè)發(fā)展的必由之路,現(xiàn)在無論從技術(shù)、成本,還是市場接受度來看,都需要有一個(gè)過程,市場剛開始都是百花齊放、百家爭鳴,隨著技術(shù)發(fā)展到一定程度之后,一定會(huì)有幾家公司來統(tǒng)領(lǐng)行業(yè)的發(fā)展方向,我認(rèn)為優(yōu)必選有機(jī)會(huì)引領(lǐng)產(chǎn)業(yè)發(fā)展方向。
雷鋒網(wǎng):Walker新一代在2019年會(huì)有怎樣的商業(yè)計(jì)劃?
熊友軍:我們有自己的商業(yè)計(jì)劃,包括未來Walker會(huì)在科研、教育、To B的場景中落地。
雷鋒網(wǎng):也就是說,之后會(huì)針對不同的場景推出不同的版本?
熊友軍:對。
雷鋒網(wǎng):業(yè)內(nèi)有一種觀點(diǎn),認(rèn)為第三代人機(jī)交互中心應(yīng)該是語音基礎(chǔ)的應(yīng)用,但是應(yīng)用到哪個(gè)方向現(xiàn)在還沒有確定。優(yōu)必選認(rèn)為第三代人機(jī)交互中心應(yīng)該是機(jī)器人,中間還會(huì)不會(huì)有其他的產(chǎn)品形態(tài)、技術(shù)形態(tài)存在?
熊友軍:有可能會(huì)有,但我認(rèn)為它們不會(huì)成為第三代人機(jī)交互中心。很多人提到智能音箱,在我看來,智能音箱相對手機(jī)來說沒有革命性的變化,智能音箱的交互方式更單一(只是語音),而手機(jī)還有圖片、視頻等等,但是智能音箱沒有。我認(rèn)為第三代人機(jī)交互,相對現(xiàn)在的人機(jī)交互應(yīng)該是更多維的,可能會(huì)有更多的動(dòng)作、感覺、表情,以及更多的人工智能技術(shù)。
雷鋒網(wǎng):可以理解為智能音箱只是加了一個(gè)語音功能,交互起來更好一點(diǎn),但是不足以稱之為是第三代人機(jī)交互中心嗎?
熊友軍:我覺得智能音箱是目前技術(shù)發(fā)展過程的一個(gè)產(chǎn)物,隨著技術(shù)的發(fā)展,這些過渡性的產(chǎn)物終究是會(huì)被淘汰掉的。
CES 2019上的機(jī)器人再度引燃,除了讓更多人再次關(guān)注機(jī)器人行業(yè),也使得整個(gè)行業(yè)發(fā)展問題再次引起行業(yè)沉思。
熊友軍在2019極客公園創(chuàng)新大會(huì)上,也再次解釋,人形智能機(jī)器人發(fā)展將會(huì)有三個(gè)階段:仿人、類人和“真人”,同時(shí)也提出了機(jī)器人發(fā)展的三大核心挑戰(zhàn):運(yùn)動(dòng)能力、感知能力和認(rèn)知能力。
通過雷鋒網(wǎng)與熊友軍探討,基本可以對機(jī)器人市場做出以下三個(gè)總結(jié):
第一,用戶期望過高,人形機(jī)器人還需要一定的發(fā)展過程,用戶更應(yīng)看清現(xiàn)有的技術(shù)發(fā)展階段,并能夠更多與現(xiàn)有階段的機(jī)器人交互,這也會(huì)對整個(gè)產(chǎn)業(yè)有推動(dòng)作用;
第二,在落地時(shí),現(xiàn)有的技術(shù)還不足以支撐通用型機(jī)器人,更應(yīng)該與特定行業(yè)合作,從特定行業(yè)入手,例如與金融行業(yè)推出符合金融應(yīng)用的機(jī)器人。據(jù)雷鋒網(wǎng)了解,現(xiàn)在整個(gè)行業(yè)也是這樣發(fā)展的;
第三,第三代交互中心將不會(huì)是智能音箱,而是人形機(jī)器人,原因在于智能音箱并不具備像前兩代交互中心那樣具有顛覆性和多樣性的能力提升,而只是語音技術(shù)的一個(gè)發(fā)展。人形機(jī)器人擁有文字、語音、視覺、運(yùn)動(dòng)等更多模態(tài)的交互方式,將會(huì)是第三代交互中心。
現(xiàn)在的機(jī)器人還處于弱人工智能階段,我們更期望人形機(jī)器人成為人類伙伴。
雷鋒網(wǎng)誠摯招聘AIoT方向記者 | 深圳:
工作內(nèi)容:跟蹤報(bào)道AIoT領(lǐng)域的公司、產(chǎn)品、技術(shù)和事件,包括物聯(lián)網(wǎng)、機(jī)器人、智能硬件、智能家居等。
要求:1-3年相關(guān)媒體經(jīng)驗(yàn);能勝任外翻的英語水平;文筆優(yōu)秀;良好的工作態(tài)度,對內(nèi)容、科技有熱情。
簡歷投遞:投遞郵箱:liufangping@leiphone.com,或添加微信:liu_fangping。
歡迎對AIoT領(lǐng)域感興趣的小伙伴咨詢/加入。
相關(guān)文章:
「胸以下全是腿」,優(yōu)必選想做商業(yè)化量產(chǎn)的人形機(jī)器人 | CES 2018
解讀優(yōu)必選新一代Walker開冰箱取飲料背后的邏輯 | CES 2019
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。