1
本文作者: 徐鵬 | 2015-06-10 14:33 |
文/徐鵬
人類的眼睛總是和各種富有靈氣的詞匯聯(lián)系在一起,并不斷賦予人們創(chuàng)新的源泉。人類大腦中接近一千億個(gè)神經(jīng)元,絕大多數(shù)只做一件事情,就是處理我們的視覺(jué)信息,因?yàn)榇竽X所接收80%的信息都源自視覺(jué)。那么在極限追求智能的今天,機(jī)器也變得越來(lái)越靈光閃閃。而當(dāng)機(jī)器有了高精度的視覺(jué),將為整個(gè)世界帶來(lái)怎樣的改變?
機(jī)器視覺(jué)有什么用?
英國(guó)《每日郵報(bào)》2013年11月曾報(bào)道過(guò)日本東京大學(xué)研制出的機(jī)器人。這款機(jī)器人在玩經(jīng)典的游戲石頭剪刀布時(shí),戰(zhàn)無(wú)不勝,打敗了所有的人類挑戰(zhàn)者。如此好戰(zhàn)績(jī)都得歸功于它的高速視覺(jué)系統(tǒng),系統(tǒng)能幫助它觀察對(duì)手的手指運(yùn)動(dòng)趨勢(shì),并在最短時(shí)間內(nèi)分析出對(duì)手手指的最終形狀,然后伸出能夠戰(zhàn)勝對(duì)方的手勢(shì)。但嚴(yán)格來(lái)說(shuō),這可是在作弊呀。
開(kāi)掛的石頭剪刀布機(jī)器人
2014年3月在英國(guó)伯明翰一個(gè)青年科技展上,代號(hào)為“Cubestormer3”的機(jī)器人以3.253秒的極速還原魔方,打破吉尼斯世界紀(jì)錄,比上一代機(jī)器人創(chuàng)下的舊紀(jì)錄快了2.017秒。據(jù)稱人類目前最快的世界紀(jì)錄也要5.55秒呢。這款機(jī)器人由科技公司ARMMobile花費(fèi)18個(gè)月研發(fā),還原魔方時(shí)會(huì)先用一部三星GalaxyS4手機(jī)掃描魔方,完成計(jì)算后便能開(kāi)始利用4只機(jī)械臂不斷翻轉(zhuǎn),3秒搞定還原。
魔方高手 Cubestormer3
順便給大家看一下Cubestormer3是如何殘暴地還原魔方:
這些鮮活的科技成就,讓我們體會(huì)到機(jī)器視覺(jué)所帶來(lái)的震撼和新奇體驗(yàn)。但機(jī)器視覺(jué)絕非僅僅應(yīng)用于以上所述狹小范圍,發(fā)展機(jī)器視覺(jué)的目的是為科學(xué)研究、國(guó)防軍事、自然旅游、科普教育、歷史文化、工程建設(shè)、醫(yī)療衛(wèi)生等眾多領(lǐng)域提供服務(wù)。視覺(jué)產(chǎn)品也將涉及人們的工作與生活、對(duì)傳統(tǒng)各行業(yè)的改造,并可提供更加卓越的效率。
我們需要什么樣的機(jī)器視覺(jué)?
所謂機(jī)器視覺(jué),并不僅僅是人眼的簡(jiǎn)單延伸,更重要的是要具有人腦的一部分功能一一從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測(cè)、測(cè)量和控制。
這項(xiàng)技術(shù)從上個(gè)世紀(jì)發(fā)展至今,不斷被刷新,但是與創(chuàng)想不同的是,
現(xiàn)實(shí)應(yīng)用中也存在諸多“痛點(diǎn)”:
比如工作環(huán)境光線不充足,或者同時(shí)需檢測(cè)的幾個(gè)部件顏色過(guò)于接近,或者需檢測(cè)的部件是黑色的,這些情況下,機(jī)器眼睛就會(huì)傻傻分不清楚。而與此并存的另一個(gè)問(wèn)題是機(jī)器視覺(jué)的實(shí)時(shí)性不足,及“大腦”對(duì)圖像信息的分析和理解速度慢。
如果把機(jī)器視覺(jué)比作人類賦予機(jī)器人的眼睛,那么目前機(jī)器人的視覺(jué)水平還處于嬰孩階段,雖然能看到影像,但是還非常欠缺分析信息和反饋信息的機(jī)制,我們要做的還很多。
試想下機(jī)器人如果能夠識(shí)別移動(dòng)物體的攻擊性動(dòng)作,并及時(shí)觸發(fā)反制機(jī)制,那么我們的政要們出門就可以不用帶著保鏢而是隨身跟著機(jī)器人保護(hù)自己,而且安全系數(shù)更高;如果機(jī)器服務(wù)生能夠非??焖俨?zhǔn)確的看到過(guò)往的顧客,并及時(shí)躲避,那么機(jī)器服務(wù)生就可以實(shí)現(xiàn)真正安全的服務(wù)水準(zhǔn);如果能實(shí)現(xiàn)以上所述,那么我們的無(wú)人駕駛汽車就可以得到迅速推廣,并放心的開(kāi)到馬路上了;如果孩子的機(jī)器玩具能夠看懂孩子的表情,那么它就可以在孩子需要的時(shí)候幫他們拿到想要的東西,如果孩子周圍有危險(xiǎn)物品,也可以第一時(shí)間移開(kāi)。
這種交互方式或許才是我們最終想要的,也是真正帶我們走進(jìn)智能世界的終極途徑。
“察言觀色”,機(jī)器視覺(jué)的新標(biāo)準(zhǔn)
本人傾向于認(rèn)為(當(dāng)然可能被某些專家認(rèn)為不靠譜,但是)識(shí)別這些視覺(jué)信息的能力才最終決定機(jī)器智能化程度的高低以及人機(jī)交互體驗(yàn)的優(yōu)劣。
人工智能領(lǐng)域也一直在追求這一目標(biāo),并且是一個(gè)十分有活力有前景的領(lǐng)域。最近博人眼球的百度人工智能在國(guó)際大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽中的成績(jī)雖然存在爭(zhēng)議,但是我們不難看出這個(gè)領(lǐng)域的關(guān)注度和各個(gè)公司在不斷追求的目標(biāo)。還有那個(gè)很可愛(ài)很可愛(ài)的Jibo機(jī)器人助理,除了它會(huì)和你說(shuō)話、幫你訂餐、它哪里讓你覺(jué)得最親切、交互體驗(yàn)最舒服呢?個(gè)人感覺(jué)就是當(dāng)你和它說(shuō)話時(shí),它會(huì)轉(zhuǎn)過(guò)頭看你; 如果你邊走邊和它說(shuō)話,它的“目光”也可以一直鎖定你; 當(dāng)你回到家時(shí),它能認(rèn)出你; 還可以幫你拍美照。這些功能都屬于機(jī)器視覺(jué)范疇。
可愛(ài)的機(jī)器人助理Jibo
最近我們研發(fā)出一款工業(yè)視覺(jué)軟件,可以實(shí)現(xiàn)對(duì)黑色器件的檢測(cè),并支持最高60k/小時(shí)的檢測(cè)速率,這在某種程度上是上述“痛點(diǎn)”的良藥。仿佛我們昔日傻傻的機(jī)器人朋友,視力變好了,反應(yīng)能力也提高了。這在中國(guó)工業(yè)視覺(jué)領(lǐng)域也可以看作一項(xiàng)進(jìn)步,所以我們才能找到國(guó)星光電這樣的巨頭客戶。
元啟工業(yè)視覺(jué)軟件工作現(xiàn)場(chǎng)
上帝給了人類眼睛讓我們了解世界,我們可以毫不謙虛的預(yù)測(cè)我們賦予機(jī)器的眼睛將會(huì)改變世界。從早期的掃描儀,OCR識(shí)別軟件,到現(xiàn)在光學(xué)照相機(jī),攝像機(jī),再到數(shù)字照相機(jī)攝像機(jī),每一項(xiàng)進(jìn)步,不單純是一個(gè)事件,而是一種需求,只要人類有需求,世界就會(huì)有變化,相信機(jī)器會(huì)察言觀色也將很快變成司空見(jiàn)慣的事實(shí)。
【作者介紹】徐鵬,青島元啟智能機(jī)器人科技有限公司總經(jīng)理,擁有15年機(jī)器人研發(fā)與管理經(jīng)驗(yàn)。
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。