1
本文作者: 黃鑫 | 2016-07-06 18:58 |
在對(duì)人工智能和機(jī)器人的探索中,人們慢慢發(fā)現(xiàn)一個(gè)規(guī)律:雖然我們還沒(méi)有徹底搞清楚智能是一種怎樣的存在,但對(duì)于人工智能的研究一樣在不斷進(jìn)展中,時(shí)至今日已經(jīng)取得了令人贊嘆的成果,似乎對(duì)于人類(lèi)智能的透徹理解,對(duì)研發(fā)人工智能來(lái)說(shuō)并不是必要條件。
IEEE機(jī)器人與自動(dòng)化協(xié)會(huì)機(jī)器人手,抓取與操控技術(shù)委員會(huì)的始創(chuàng)主席、南佛羅里達(dá)大學(xué)計(jì)算機(jī)系的孫宇教授帶領(lǐng)的RPAL(機(jī)器人感知與行為實(shí)驗(yàn)室)研發(fā)了一款能夠精確控制力度、實(shí)現(xiàn)很多日常任務(wù)的機(jī)械臂。在對(duì)孫宇的采訪中,我們?cè)俅误w會(huì)到了這條規(guī)律的存在,和它帶給我們思維上的解放。
提起機(jī)器人的機(jī)械臂,我們通常會(huì)想起一些非常笨重的東西,像下面這樣的。
這些機(jī)械臂無(wú)論是從靈活性還是通用性上都很難稱(chēng)得上優(yōu)秀。也很難拿來(lái)做一些精細(xì)化的活。但孫宇和團(tuán)隊(duì)做出來(lái)的機(jī)械臂卻能做到很多這種機(jī)械臂想都不敢想的事。他們是怎么做到的?
機(jī)械臂的精確力度控制
準(zhǔn)確的說(shuō),孫宇他們開(kāi)發(fā)的并不是機(jī)器人的硬件,而是機(jī)器人智能大腦中的抓取中樞,其具有很高的可擴(kuò)展性,是可以很方便的嵌入到現(xiàn)有的機(jī)器人產(chǎn)品中去的。而目前這個(gè)中樞算法已經(jīng)有了很驚艷的表現(xiàn)。
在一個(gè)演示視頻里,機(jī)械臂順利的將放在桌上的一個(gè)燈泡拿了起來(lái),然后擰在了底座上。
可能僅僅在5年前,人們還很難想象機(jī)器人能順利完成這樣的工作。這個(gè)燈泡被制造出來(lái)的時(shí)候,估計(jì)也想象不到自己會(huì)以這樣的方式開(kāi)始自己發(fā)光發(fā)熱的使命。事實(shí)上要做到這一點(diǎn)確實(shí)很不容易,尤其是相對(duì)于較為成熟的認(rèn)知手段來(lái)說(shuō),機(jī)械臂的精確施力控制是更難做到的。
首先把它抓起來(lái)就不是一件容易的事了,孫宇表示,自己希望目前的研究將來(lái)能使機(jī)器人進(jìn)入在日常生活,為人類(lèi)提供服務(wù)。而目前機(jī)器人在日常生活中面對(duì)的最大挑戰(zhàn)可能就是各種工具的使用了:機(jī)器人如果想要用好一樣?xùn)|西,首先還得保證自己不會(huì)把它弄壞了。然后才能談使用的事。因?yàn)橥ǔG闆r下,機(jī)械臂“拿起”一樣?xùn)|西的方法,都是直接將它“握住”,就像這樣:
或許你注意到了,上面的gif和圖片中握住紅球的機(jī)械手,都是結(jié)構(gòu)比較簡(jiǎn)單的機(jī)械手,但是,要讓機(jī)器人的手像人一樣靈活,最好的辦法難道不是造一個(gè)同人類(lèi)的手一模一樣有許多關(guān)節(jié)、可以實(shí)現(xiàn)靈活處理的機(jī)械手,然后寫(xiě)出一個(gè)精妙的程序來(lái)控制它嗎?
事實(shí)上機(jī)器人界確實(shí)早在80年代就流行過(guò)高度仿生的多關(guān)節(jié)機(jī)械手,但是孫宇說(shuō),這種結(jié)構(gòu)存在一些明顯的缺陷,比如造價(jià)過(guò)于昂貴,還有由于其結(jié)構(gòu)非常精細(xì),即使不考慮故障率,也意味著驅(qū)動(dòng)其關(guān)節(jié)的電機(jī)都無(wú)法做得足夠大,因此力量也很受限制,能做的事情可能也很有限。所以,最后大家還是普遍傾向于使用結(jié)構(gòu)稍微簡(jiǎn)單一些的機(jī)械手,這樣一來(lái),不僅成本降下來(lái)了,這些機(jī)械手確實(shí)也能完成要求的任務(wù),看似是理念的倒退,實(shí)際上卻有了更好的效果。最近隨著技術(shù)的發(fā)展,仿生機(jī)械手又有所崛起,不過(guò)那都是后話了。
孫宇帶領(lǐng)的團(tuán)隊(duì)選擇的是一種只有三根手指的機(jī)械手。不過(guò)不管幾根手指,當(dāng)你需要用它來(lái)做一件很具體的事情的時(shí)候,很明顯只是握住它是不行的。各位可以試著拿起你的手機(jī)、端起你的碗、拿起刀來(lái)切菜,大家會(huì)發(fā)現(xiàn)凡是需要“使用”某樣物體的動(dòng)作,基本都需要指尖同物體的接觸和施力,而如果讓機(jī)器人來(lái)做這件事,如何使用工具時(shí)施加正確的力,不毀壞工具,又能完成任務(wù)就是一件需要考慮一下的事了。
感覺(jué)和認(rèn)知
不過(guò)這個(gè)問(wèn)題孫宇和他的團(tuán)隊(duì)倒是老早就解決了,早在09年,孫宇就開(kāi)發(fā)出了一種讓機(jī)械臂能借助機(jī)器視覺(jué)從人拿一樣?xùn)|西時(shí)手指的反應(yīng)來(lái)判斷物體材質(zhì),從而用合適的力去拿起它的技術(shù)。能讓機(jī)器人在拿起哪怕雞蛋這樣脆弱的物體的時(shí)候也不會(huì)弄壞它。
在機(jī)器理解燈泡的材質(zhì)之前,它會(huì)用默認(rèn)的力道握下去,直接將雞蛋壓碎,而理解之后,就能穩(wěn)穩(wěn)的握住了(右圖)
這種技術(shù)是今天成就的基礎(chǔ)。將雞蛋,或者燈泡穩(wěn)穩(wěn)的握住只是一個(gè)靜態(tài)的過(guò)程。事實(shí)上,只需調(diào)整力度讓機(jī)器人將任何物體都輕輕的握住,也能達(dá)到上面的效果。但當(dāng)涉及了具體的操作,機(jī)械臂的手指與物體之間的力就不再是簡(jiǎn)單不變的一個(gè)最小值。
就比如說(shuō)拿這個(gè)燈泡的時(shí)候,如果你需要把燈泡擰到燈座上去,那你需要考慮的就不止是重力的問(wèn)題了,當(dāng)燈泡伸入燈座內(nèi)之后,底座內(nèi)的彈簧和螺紋還會(huì)給你帶來(lái)一個(gè)額外的力,機(jī)械臂需要據(jù)此調(diào)整自己握著燈泡的力,才能保證穩(wěn)定的握持。而當(dāng)機(jī)械臂開(kāi)始旋轉(zhuǎn)燈泡時(shí),還需要額外的再加一些力。
孫宇說(shuō),在機(jī)械臂擰燈泡這個(gè)過(guò)程中,尋找底座并將燈泡的底部與其對(duì)準(zhǔn)算是相對(duì)容易的部分了。因?yàn)榻o予視覺(jué)的姿態(tài)估計(jì)技術(shù)已經(jīng)比較成熟。難點(diǎn)就在于機(jī)器對(duì)力的理解和調(diào)節(jié)上。當(dāng)機(jī)器收到任務(wù)去擰這個(gè)燈泡的時(shí)候,他就要考慮到擰燈泡的時(shí)候可能會(huì)遇到什么樣的各種力,然后依此來(lái)決定用怎樣的力道和手抓方式來(lái)執(zhí)行這個(gè)任務(wù)了。
當(dāng)然,孫宇和RPAL的目的遠(yuǎn)遠(yuǎn)不止是做一個(gè)擰燈泡的機(jī)器人,正如前面所說(shuō)的,孫宇希望自己的技術(shù)能應(yīng)用在日常家庭的生活中,具體一點(diǎn),就是幫助機(jī)械手變得更靈活,讓它像人手一樣使用各種物體。孫宇說(shuō)在日常生活中,即使是拿著同一個(gè)東西的時(shí)候,做不同的事時(shí)也需要用不同的力和姿勢(shì)去行動(dòng),比如當(dāng)你拿著一把刀去切面包和去給面包抹黃油的時(shí)候,需要施加的力和拿物體的姿勢(shì)也是完全不同的,因?yàn)楫?dāng)你抹黃油的時(shí)候刀片是刀側(cè)受力,切面包的時(shí)候是刀鋒受力,需要不同的姿勢(shì)才能實(shí)現(xiàn)這兩個(gè)用力的方式。
不過(guò)畢竟世界上的“面包”和“燈泡”都是無(wú)窮無(wú)盡的,你不可能指望機(jī)器人拿每種東西之前都要你先去在數(shù)據(jù)庫(kù)中添加什么數(shù)據(jù)?!皩W(xué)習(xí)”這項(xiàng)能力是非常重要的。之前提到的根據(jù)人手的反應(yīng)來(lái)決定握東西的力度,其實(shí)也是一種學(xué)習(xí)。
為了教給機(jī)器人如何使用工具,通過(guò)美國(guó)自然科學(xué)基金的支持,孫宇和團(tuán)隊(duì)建立了一個(gè)日常工具使用的數(shù)據(jù)庫(kù),可以記錄之前的每次同物品互動(dòng)的各種細(xì)節(jié),比如力度、姿勢(shì)、運(yùn)動(dòng)方式。當(dāng)被要求做新的任務(wù)時(shí),機(jī)械手就可以根據(jù)之前的數(shù)據(jù),機(jī)械手的形狀和物體的形狀來(lái)預(yù)估一個(gè)合適的方式和力度。
深度學(xué)習(xí)
其實(shí)在現(xiàn)在說(shuō)到機(jī)器的學(xué)習(xí)就不得不提到深度學(xué)習(xí),深度學(xué)習(xí)是目前大熱的研究領(lǐng)域,甚至開(kāi)始有人懷疑深度學(xué)習(xí)是不是已經(jīng)對(duì)科研界形成了一種不利的壟斷,不過(guò)對(duì)于這種質(zhì)疑,孫宇總體還是持一種比較樂(lè)觀的態(tài)度。因?yàn)樯疃葘W(xué)習(xí)從客觀上來(lái)說(shuō)確實(shí)是能產(chǎn)生很好的結(jié)果。
因此孫宇和RPAL也將深度學(xué)習(xí)應(yīng)用到了他們的系統(tǒng)中,除了之前提到的數(shù)據(jù)庫(kù),目前他們還在開(kāi)發(fā)一個(gè)基于圖機(jī)構(gòu)的機(jī)器人的知識(shí)系統(tǒng),這個(gè)系統(tǒng)的理念是將所有日常生活中的物體都用動(dòng)作聯(lián)系起來(lái),脫胎于人腦中的鏡像神經(jīng)元 (Mirror Neuron),孫宇和RPAL正在建立機(jī)器人智能大腦中鏡像神經(jīng)元。
孫宇表示,比如之前舉例的切面包,面包和刀本身是兩個(gè)獨(dú)立的物體,但是“切”這個(gè)動(dòng)作將這兩者聯(lián)系了起來(lái)。同樣“切”這個(gè)動(dòng)作也可以和其它物體聯(lián)系起來(lái)。而刀不僅可以通過(guò)切這個(gè)動(dòng)作和面包聯(lián)系起來(lái),還可以同菜、水果等物體聯(lián)系起來(lái),同樣,面包也可以通過(guò)“裝入容器”這樣的“裝”的動(dòng)作同碗、袋子等容器聯(lián)系起來(lái),生活中的物品就是這樣通過(guò)功能建立起來(lái)了一個(gè)網(wǎng)絡(luò),它的英文名叫functional object-oriented network,這樣的一個(gè)網(wǎng)絡(luò)就可以很方便的被機(jī)器人理解,讓它們知道做什么事的時(shí)候應(yīng)該怎樣做。
那如何得到這個(gè)網(wǎng)絡(luò)呢?孫宇表示,他們目前的網(wǎng)絡(luò)建立主要有兩個(gè)途徑,一是通過(guò)人工手動(dòng)添加,一是通過(guò)讓機(jī)器觀看YouTube的視頻自動(dòng)學(xué)習(xí)。這其中也用到了深度學(xué)習(xí)。這個(gè)項(xiàng)目由另一項(xiàng)美國(guó)自然科學(xué)基金資助,已經(jīng)初具規(guī)模。
這個(gè)知識(shí)系統(tǒng)的結(jié)構(gòu)圖
對(duì)于這項(xiàng)技術(shù)的最終落地,孫宇認(rèn)為,技術(shù)從研究角度來(lái)說(shuō)已經(jīng)成熟了,只是需要一些針對(duì)應(yīng)用和機(jī)器人的工程開(kāi)發(fā),機(jī)器人就可以使用鏡像神經(jīng)網(wǎng)絡(luò)和抓取中樞來(lái)為人類(lèi)日常生活提供服務(wù)。出現(xiàn)在市場(chǎng)上的時(shí)間已經(jīng)不會(huì)遠(yuǎn)了。
人工智能可能是一種全新的東西
我們?cè)絹?lái)越明顯的發(fā)現(xiàn)這個(gè)規(guī)律:至少在現(xiàn)階段,機(jī)器人、人工智能的最好實(shí)現(xiàn)方式并不是對(duì)人類(lèi)的直接模仿,而是對(duì)人類(lèi)的行為、智能等特征進(jìn)行抽象后,另辟蹊徑的實(shí)現(xiàn)。從起源于大腦神經(jīng)網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò)、曾經(jīng)流行但后來(lái)被更簡(jiǎn)單的機(jī)械手取代的高度仿生機(jī)械手、到早期“捏雞蛋機(jī)器人”通過(guò)視覺(jué)來(lái)實(shí)現(xiàn)觸覺(jué)的調(diào)整、模仿人腦鏡像神經(jīng)元卻用不同概念替換其中元素的機(jī)器人智能大腦鏡像神經(jīng)元,無(wú)一不是這樣思維的產(chǎn)物。我們可以把它理解成技術(shù)局限下的妥協(xié),但換一個(gè)角度講,或許人類(lèi)確實(shí)不應(yīng)該局限于一味的模仿智能。雖然人工智能中有著“智能”的名字,但這不意味著它就需要以同人類(lèi)的智能一樣的思路來(lái)建造。在那些復(fù)雜的電路和元件之下,或許人工智能的終極形態(tài)會(huì)以一種完全超越現(xiàn)在人類(lèi)想象的形式出現(xiàn)?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。