0
本文作者: 陳?ài)?/a> | 2016-08-13 23:31 | 專(zhuān)題:CCF-GAIR | 全球人工智能與機(jī)器人峰會(huì) |
引言
機(jī)器人學(xué)習(xí)與機(jī)器學(xué)習(xí)相比是有所不同,機(jī)器人學(xué)習(xí)更加強(qiáng)調(diào)在現(xiàn)實(shí)世界中與實(shí)際物體進(jìn)行接觸,而機(jī)器學(xué)習(xí)則大多數(shù)是在虛擬的環(huán)境下進(jìn)行的。機(jī)器學(xué)習(xí)中,解決機(jī)器智能臂又是一個(gè)尤為重要的事情。人的骨骼有206個(gè),手的部分就占了1/4。手是人身體最為靈活的部分,想要造出一個(gè)完整的智能機(jī)器人,智能手是必不可少的。本文會(huì)就關(guān)于機(jī)器臂方面對(duì)孫宇教授進(jìn)行提問(wèn)。
您今天的演講題目是“機(jī)器人靈巧手抓取的復(fù)興”,您能說(shuō)說(shuō)如何看待“復(fù)興”二字?
機(jī)器人抓取是一個(gè)很古老的話題,學(xué)術(shù)界在80年代做的也是非常多的,但是它有一個(gè)低潮期,就是90年代和2000年;我個(gè)人認(rèn)為其原因是大家都認(rèn)為所能做的事情不多了,例如我在會(huì)上就有提到,在1983年機(jī)器手就已經(jīng)做得非常先進(jìn)了。但是有許多的瓶頸無(wú)法解決,因?yàn)闊o(wú)法解決這些問(wèn)題,許多的科學(xué)家就去做別的事情去了,比如在80年代徐教授還有其他的教授都是做機(jī)器臂和手抓的,但是由于問(wèn)題無(wú)法解決就轉(zhuǎn)換了研究方向。在2000年或是05年,我們就認(rèn)為機(jī)器手或是手抓是一定要解決的問(wèn)題,因?yàn)椴唤鉀Q這個(gè)問(wèn)題機(jī)器人就變成了智能在地上走或是沒(méi)有胳膊的機(jī)器,他沒(méi)法做任何事情只能是看起來(lái)很酷但是實(shí)用性不大。所以我們也是正好趕上了機(jī)器學(xué)習(xí)有了很大的發(fā)展,通過(guò)機(jī)器學(xué)習(xí)來(lái)解決人手的一些技能,然后AI也有一個(gè)很好的發(fā)展,所以說(shuō)正好是一個(gè)比較好的時(shí)期。
您研究的研究的機(jī)器臂能像人類(lèi)一樣感知物體材料并使用相應(yīng)的力度將其拿起來(lái),請(qǐng)問(wèn)是使用了特殊的材質(zhì)還是特殊的算法?
對(duì)于這個(gè)問(wèn)題,可以從幾個(gè)角度來(lái)講,在機(jī)器人領(lǐng)域當(dāng)中有幾個(gè)不同的方向,對(duì)于我們來(lái)說(shuō)要考慮的就是在手抓的時(shí)候,手抓力的反饋。手抓力的反饋就涉及到一個(gè)比較重要的領(lǐng)域就是haptics(觸覺(jué)學(xué)),在這個(gè)領(lǐng)域需要比較好的傳感器,目前的問(wèn)題就是沒(méi)有比較便宜的傳感器用在機(jī)器手上。再接著需要用機(jī)器學(xué)習(xí)來(lái)進(jìn)行訓(xùn)練。
您的智能機(jī)器臂是機(jī)器與算法相結(jié)合,您比較看好哪一種算法?
對(duì)于我們來(lái)說(shuō),我們認(rèn)為現(xiàn)在的AI在下棋中做得很好,但是最大的問(wèn)題AI不能與自然界的物體進(jìn)行實(shí)實(shí)在在的接觸。我們的要做的是盡量得到接觸上的信息,然后利用這些信息來(lái)研發(fā)我們自己的智能算法。其中最重要的是對(duì)任務(wù)要有很好的了解,表達(dá)。你的手抓就要滿足任務(wù)的要求。
您的機(jī)器臂是基于手指因接觸產(chǎn)生壓力而變色的原理一系列的定位,追蹤,以及基于陰影和視深原理的視覺(jué)定位等技術(shù),您認(rèn)為手抓中最為關(guān)鍵的是哪一個(gè)技術(shù)?
我可以廣泛的講一下這里面都用到的技術(shù)就是視覺(jué)技術(shù),這一視覺(jué)技術(shù)的應(yīng)用范圍十分的廣泛。我們理念是希望以后的視覺(jué)技術(shù)能對(duì)自然界或是人類(lèi)能有一個(gè)高清的觀察,我們所做的觀察就是手指頭的變化,通過(guò)計(jì)算機(jī)視覺(jué)的算法得到一個(gè)力量。你在問(wèn)題中所提到的陰影技術(shù)就是另外一個(gè)項(xiàng)目,陰影是用二維相機(jī)來(lái)得到三維的信息。我們都知道在我們抓一個(gè)東西或是取一個(gè)東西的時(shí)候,我們不光要知道二維信息還要知道三維信息,在什么位置,有多高。當(dāng)時(shí)三維相機(jī)十分的昂貴,我們當(dāng)時(shí)就是希望利用陰影能更好的得到三維信息。
手指甲蓋顏色變化的靈感是來(lái)自何處?
這一想法并不是我們先提出來(lái),當(dāng)時(shí)我們跟MIT有一個(gè)合作,他們做的就是一個(gè)簡(jiǎn)單的光傳感器。我們想用他們的光傳感器做虛擬現(xiàn)實(shí),但是發(fā)現(xiàn)他們的傳感器并不好用,因?yàn)橘N在手指甲上的話,條件光會(huì)有很大的影響,所以就覺(jué)得可以用視覺(jué),這樣就不需要把東西放在手指甲上,可以放到任何一個(gè)地方,這樣就可以得到顏色的變化。
人的手有27個(gè)自由度,對(duì)于控制算法來(lái)說(shuō)要求很高,是什么讓人形機(jī)器手重新流行?
正如我今日所說(shuō),人形機(jī)器手還有很多問(wèn)題。首先成本高,造價(jià)昂貴。想要它重新流行起來(lái)并不困難,但必須得解決造價(jià)高的問(wèn)題。只要造價(jià)降下來(lái),其他問(wèn)題都可以迎刃而解。如果價(jià)格低,每個(gè)人都可以制造,大家群策群力問(wèn)題都可以想辦法解決。
您可以說(shuō)一下,中美日三國(guó)在機(jī)器人上的不同嗎?
我了解的也不是十分全面,簡(jiǎn)單的說(shuō)一下我自己的看法。首先我覺(jué)得美國(guó)這兩年趕上和超過(guò)日本,因?yàn)槿毡驹?0,90年代發(fā)明了許多機(jī)器人東西,包括3D 打印,開(kāi)始都是日本的專(zhuān)利?,F(xiàn)在3D打印這么火是因?yàn)槿毡镜膶?zhuān)利過(guò)期了,大家都可以用3D打印,這樣打印機(jī)器的成本就降下來(lái)了。美國(guó)之所以能趕上并超過(guò)日本是因?yàn)樗麄兊哪繕?biāo)和定位做的十分好。美國(guó)最近這一段時(shí)間做的是人工智能這一方面。大家都知道日本的機(jī)械設(shè)計(jì)這方面做得非常好,但是他們的軟件發(fā)展不是很好,沒(méi)有趕上IT發(fā)展的大潮。對(duì)于美國(guó)來(lái)說(shuō),他們相當(dāng)于IT的開(kāi)始者,IT的發(fā)展就需要處理信息,這樣就引起了人工智能的發(fā)展,使用AI來(lái)處理信息。自然而然美國(guó)的AI就要比其他國(guó)家發(fā)展的就要更快。我覺(jué)得日本關(guān)鍵在于軟件和IT這一方面落后于美國(guó)。我覺(jué)得中國(guó)的好處就是,并沒(méi)有做哪一個(gè)會(huì)做得好的局限,這樣就可以想做什么就做什么,就是可以在兩方面都進(jìn)行追求。比如在南方有些企業(yè)做齒輪做得很好,百度還有其他的大公司做AI做得也是十分的好。雖然這兩方面與美國(guó)和日本都有一定的差距,但是在這兩方面都做得很好。
您所上的課中有一門(mén)是給medical school學(xué)生上的,這與給CS和EE專(zhuān)業(yè)學(xué)生所上的課相比有什么不同?
我們當(dāng)時(shí)是與醫(yī)學(xué)院有一些合作,醫(yī)學(xué)院的教授就認(rèn)為機(jī)器人會(huì)在醫(yī)療領(lǐng)域會(huì)有很大的應(yīng)用。傳統(tǒng)的醫(yī)學(xué)訓(xùn)練并沒(méi)有使這些醫(yī)學(xué)院的學(xué)生接觸新的科技,他們可能有機(jī)會(huì)知道達(dá)芬奇的醫(yī)療機(jī)器人,但是在醫(yī)學(xué)院進(jìn)行訓(xùn)練時(shí),并不是所有的人有機(jī)會(huì)接觸到。所以醫(yī)學(xué)院的教授就是希望通過(guò)這門(mén)課讓醫(yī)學(xué)院的學(xué)生知道了解這些高科技,再以后他們成為醫(yī)生之后想在哪些方面可以使醫(yī)學(xué)發(fā)展的更好。
限制機(jī)器手發(fā)展的因素有哪一些?
首先就是成本的問(wèn)題,不是所有的人都能拿到昂貴的機(jī)器手來(lái)進(jìn)行研究,比如我實(shí)驗(yàn)室買(mǎi)的一個(gè)機(jī)器手需要花費(fèi)我3萬(wàn)美元,這還是很簡(jiǎn)單只有4個(gè)自由度的手。還有一個(gè)問(wèn)題是如何控制這些自由度,以及如何得到視覺(jué)的結(jié)果,并把視覺(jué)結(jié)果用在手抓上面去。但是這兩方面都有很大的解決,人們開(kāi)始發(fā)明一種簡(jiǎn)單的機(jī)器手,關(guān)節(jié)較少的機(jī)器手但也可做很多的事情。其二,視覺(jué)領(lǐng)域方面也有很大的進(jìn)步,例如微軟的三維相機(jī),這樣就能更加容易得到三維信息。
機(jī)器人手抓會(huì)用到哪一個(gè)方向或是領(lǐng)域比較好?
正如我剛才所說(shuō)的機(jī)器人手抓取是非得解決的問(wèn)題。我認(rèn)為影響最大的領(lǐng)域是服務(wù)機(jī)器人,如果服務(wù)機(jī)器人沒(méi)有辦法抓取東西來(lái),并把他交給客人,這是不稱職的服務(wù)機(jī)器人。
現(xiàn)在的技術(shù)突破和發(fā)展局限是什么?
局限是我希望大家都清楚計(jì)算機(jī)智能和機(jī)器人智能不是完全相等的兩個(gè)事情。現(xiàn)在計(jì)算機(jī)智能在虛擬世界,例如游戲或是棋類(lèi),這類(lèi)不需要物理或是實(shí)實(shí)在在接觸的領(lǐng)域內(nèi)做的很好。IT領(lǐng)域都是信息交流,都是在處理數(shù)據(jù)。在這些領(lǐng)域人工智能都處理的很好,但一旦涉及到實(shí)實(shí)在在的接觸就會(huì)有很多的問(wèn)題,接觸的話就會(huì)發(fā)生差之毫厘失之千里的事情。抓東西時(shí),如果只差一點(diǎn)點(diǎn)那么結(jié)果就會(huì)有非常大的區(qū)別。此外技術(shù)上最大的突破我認(rèn)為是機(jī)器人靈巧手是可以使用工具的,以前研究的重點(diǎn)都是在抓取或是抓起之后進(jìn)行轉(zhuǎn)移。人類(lèi)之所以比其他動(dòng)物先進(jìn)是因?yàn)槲覀兡苤圃旌褪褂霉ぞ?,而不是只?huì)抓書(shū)或是抓其他的東西。我們意識(shí)到這一點(diǎn)之后就會(huì)更好地對(duì)任務(wù)進(jìn)行理解。我認(rèn)為AI和學(xué)習(xí)對(duì)于任務(wù)的理解是十分重要的,通過(guò)對(duì)任務(wù)理解之后的表達(dá)理解進(jìn)而選出最優(yōu)的抓東西方案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章