0
本文作者: 陳圳 | 2016-08-13 23:31 | 專題:CCF-GAIR | 全球人工智能與機器人峰會 |
引言
機器人學(xué)習(xí)與機器學(xué)習(xí)相比是有所不同,機器人學(xué)習(xí)更加強調(diào)在現(xiàn)實世界中與實際物體進行接觸,而機器學(xué)習(xí)則大多數(shù)是在虛擬的環(huán)境下進行的。機器學(xué)習(xí)中,解決機器智能臂又是一個尤為重要的事情。人的骨骼有206個,手的部分就占了1/4。手是人身體最為靈活的部分,想要造出一個完整的智能機器人,智能手是必不可少的。本文會就關(guān)于機器臂方面對孫宇教授進行提問。
您今天的演講題目是“機器人靈巧手抓取的復(fù)興”,您能說說如何看待“復(fù)興”二字?
機器人抓取是一個很古老的話題,學(xué)術(shù)界在80年代做的也是非常多的,但是它有一個低潮期,就是90年代和2000年;我個人認為其原因是大家都認為所能做的事情不多了,例如我在會上就有提到,在1983年機器手就已經(jīng)做得非常先進了。但是有許多的瓶頸無法解決,因為無法解決這些問題,許多的科學(xué)家就去做別的事情去了,比如在80年代徐教授還有其他的教授都是做機器臂和手抓的,但是由于問題無法解決就轉(zhuǎn)換了研究方向。在2000年或是05年,我們就認為機器手或是手抓是一定要解決的問題,因為不解決這個問題機器人就變成了智能在地上走或是沒有胳膊的機器,他沒法做任何事情只能是看起來很酷但是實用性不大。所以我們也是正好趕上了機器學(xué)習(xí)有了很大的發(fā)展,通過機器學(xué)習(xí)來解決人手的一些技能,然后AI也有一個很好的發(fā)展,所以說正好是一個比較好的時期。
您研究的研究的機器臂能像人類一樣感知物體材料并使用相應(yīng)的力度將其拿起來,請問是使用了特殊的材質(zhì)還是特殊的算法?
對于這個問題,可以從幾個角度來講,在機器人領(lǐng)域當中有幾個不同的方向,對于我們來說要考慮的就是在手抓的時候,手抓力的反饋。手抓力的反饋就涉及到一個比較重要的領(lǐng)域就是haptics(觸覺學(xué)),在這個領(lǐng)域需要比較好的傳感器,目前的問題就是沒有比較便宜的傳感器用在機器手上。再接著需要用機器學(xué)習(xí)來進行訓(xùn)練。
您的智能機器臂是機器與算法相結(jié)合,您比較看好哪一種算法?
對于我們來說,我們認為現(xiàn)在的AI在下棋中做得很好,但是最大的問題AI不能與自然界的物體進行實實在在的接觸。我們的要做的是盡量得到接觸上的信息,然后利用這些信息來研發(fā)我們自己的智能算法。其中最重要的是對任務(wù)要有很好的了解,表達。你的手抓就要滿足任務(wù)的要求。
您的機器臂是基于手指因接觸產(chǎn)生壓力而變色的原理一系列的定位,追蹤,以及基于陰影和視深原理的視覺定位等技術(shù),您認為手抓中最為關(guān)鍵的是哪一個技術(shù)?
我可以廣泛的講一下這里面都用到的技術(shù)就是視覺技術(shù),這一視覺技術(shù)的應(yīng)用范圍十分的廣泛。我們理念是希望以后的視覺技術(shù)能對自然界或是人類能有一個高清的觀察,我們所做的觀察就是手指頭的變化,通過計算機視覺的算法得到一個力量。你在問題中所提到的陰影技術(shù)就是另外一個項目,陰影是用二維相機來得到三維的信息。我們都知道在我們抓一個東西或是取一個東西的時候,我們不光要知道二維信息還要知道三維信息,在什么位置,有多高。當時三維相機十分的昂貴,我們當時就是希望利用陰影能更好的得到三維信息。
手指甲蓋顏色變化的靈感是來自何處?
這一想法并不是我們先提出來,當時我們跟MIT有一個合作,他們做的就是一個簡單的光傳感器。我們想用他們的光傳感器做虛擬現(xiàn)實,但是發(fā)現(xiàn)他們的傳感器并不好用,因為貼在手指甲上的話,條件光會有很大的影響,所以就覺得可以用視覺,這樣就不需要把東西放在手指甲上,可以放到任何一個地方,這樣就可以得到顏色的變化。
人的手有27個自由度,對于控制算法來說要求很高,是什么讓人形機器手重新流行?
正如我今日所說,人形機器手還有很多問題。首先成本高,造價昂貴。想要它重新流行起來并不困難,但必須得解決造價高的問題。只要造價降下來,其他問題都可以迎刃而解。如果價格低,每個人都可以制造,大家群策群力問題都可以想辦法解決。
您可以說一下,中美日三國在機器人上的不同嗎?
我了解的也不是十分全面,簡單的說一下我自己的看法。首先我覺得美國這兩年趕上和超過日本,因為日本在80,90年代發(fā)明了許多機器人東西,包括3D 打印,開始都是日本的專利?,F(xiàn)在3D打印這么火是因為日本的專利過期了,大家都可以用3D打印,這樣打印機器的成本就降下來了。美國之所以能趕上并超過日本是因為他們的目標和定位做的十分好。美國最近這一段時間做的是人工智能這一方面。大家都知道日本的機械設(shè)計這方面做得非常好,但是他們的軟件發(fā)展不是很好,沒有趕上IT發(fā)展的大潮。對于美國來說,他們相當于IT的開始者,IT的發(fā)展就需要處理信息,這樣就引起了人工智能的發(fā)展,使用AI來處理信息。自然而然美國的AI就要比其他國家發(fā)展的就要更快。我覺得日本關(guān)鍵在于軟件和IT這一方面落后于美國。我覺得中國的好處就是,并沒有做哪一個會做得好的局限,這樣就可以想做什么就做什么,就是可以在兩方面都進行追求。比如在南方有些企業(yè)做齒輪做得很好,百度還有其他的大公司做AI做得也是十分的好。雖然這兩方面與美國和日本都有一定的差距,但是在這兩方面都做得很好。
您所上的課中有一門是給medical school學(xué)生上的,這與給CS和EE專業(yè)學(xué)生所上的課相比有什么不同?
我們當時是與醫(yī)學(xué)院有一些合作,醫(yī)學(xué)院的教授就認為機器人會在醫(yī)療領(lǐng)域會有很大的應(yīng)用。傳統(tǒng)的醫(yī)學(xué)訓(xùn)練并沒有使這些醫(yī)學(xué)院的學(xué)生接觸新的科技,他們可能有機會知道達芬奇的醫(yī)療機器人,但是在醫(yī)學(xué)院進行訓(xùn)練時,并不是所有的人有機會接觸到。所以醫(yī)學(xué)院的教授就是希望通過這門課讓醫(yī)學(xué)院的學(xué)生知道了解這些高科技,再以后他們成為醫(yī)生之后想在哪些方面可以使醫(yī)學(xué)發(fā)展的更好。
限制機器手發(fā)展的因素有哪一些?
首先就是成本的問題,不是所有的人都能拿到昂貴的機器手來進行研究,比如我實驗室買的一個機器手需要花費我3萬美元,這還是很簡單只有4個自由度的手。還有一個問題是如何控制這些自由度,以及如何得到視覺的結(jié)果,并把視覺結(jié)果用在手抓上面去。但是這兩方面都有很大的解決,人們開始發(fā)明一種簡單的機器手,關(guān)節(jié)較少的機器手但也可做很多的事情。其二,視覺領(lǐng)域方面也有很大的進步,例如微軟的三維相機,這樣就能更加容易得到三維信息。
機器人手抓會用到哪一個方向或是領(lǐng)域比較好?
正如我剛才所說的機器人手抓取是非得解決的問題。我認為影響最大的領(lǐng)域是服務(wù)機器人,如果服務(wù)機器人沒有辦法抓取東西來,并把他交給客人,這是不稱職的服務(wù)機器人。
現(xiàn)在的技術(shù)突破和發(fā)展局限是什么?
局限是我希望大家都清楚計算機智能和機器人智能不是完全相等的兩個事情?,F(xiàn)在計算機智能在虛擬世界,例如游戲或是棋類,這類不需要物理或是實實在在接觸的領(lǐng)域內(nèi)做的很好。IT領(lǐng)域都是信息交流,都是在處理數(shù)據(jù)。在這些領(lǐng)域人工智能都處理的很好,但一旦涉及到實實在在的接觸就會有很多的問題,接觸的話就會發(fā)生差之毫厘失之千里的事情。抓東西時,如果只差一點點那么結(jié)果就會有非常大的區(qū)別。此外技術(shù)上最大的突破我認為是機器人靈巧手是可以使用工具的,以前研究的重點都是在抓取或是抓起之后進行轉(zhuǎn)移。人類之所以比其他動物先進是因為我們能制造和使用工具,而不是只會抓書或是抓其他的東西。我們意識到這一點之后就會更好地對任務(wù)進行理解。我認為AI和學(xué)習(xí)對于任務(wù)的理解是十分重要的,通過對任務(wù)理解之后的表達理解進而選出最優(yōu)的抓東西方案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。