丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
特寫 正文
發(fā)私信給游瑞
發(fā)送

4

除了單口相聲,機器人還得能“閱面”識人

本文作者: 游瑞 2016-05-26 17:27
導語:語音講究的是聽說讀寫,相聲靠的是說學逗唱,智能機器人靠單口相聲能火多久?

今年8月,雷鋒網(wǎng)將在深圳舉辦一場盛況空前,且有全球影響力的人工智能與機器人峰會(CCF-GAIR)。屆時雷鋒網(wǎng)將發(fā)布“人工智能&機器人Top25創(chuàng)新企業(yè)榜”榜單。目前,我們正在拜訪人工智能、機器人領域的相關公司,從中篩選最終入選榜單的公司名單。如果你也想加入我們的榜單之中,請聯(lián)系:2020@leiphone.com。

除了單口相聲,機器人還得能“閱面”識人

趙京雷,閱面科技CEO,上海交通大學人工智能博士,前阿里巴巴北京算法研究中心負責人,高級算法專家;前WiseNut研發(fā)中心算法負責人,專注人工智能領域算法研究超過15年。

去年7月,趙京雷覺得時機差不多了,便拉著Leon,宋向明和陳婧四人成立了上海閱面科技,這四個創(chuàng)始人之前是相識超過了兩年的朋友。

公司英文名叫“ReadSense”,中文名也簡單“閱面”,典型的技術人員取名風格,簡單明了,一眼就懂。單從名字就能看出這家公司十有八九是做人臉識別的,雖然如此,但趙京雷更愿意按自己的話來介紹閱面,“一家人工智能科技公司,通過深度學習和計算機視覺技術,讓智能機器以嶄新的視角看世界”。

對于智能機器定義,每個人都會有自己的標準,手機是個智能機器這是大家都認同的,但VR頭盔是嗎?在趙京雷眼里,新一代的機器人,像家庭陪伴機器人,掃地機器人,包括一些能與智能電子設備相關聯(lián)的東西,能跟人的生活空間緊密的東西,都可以定義為消費級別的智能機器,這里面就還包括像AR與VR。他所指的當然是一體機,單個的盒子我想也沒有討論的必要了。

那為什么要讓機器擁有嶄新的視角?目前機器人行業(yè)面臨的最大瓶頸就在于人機交互。語音是現(xiàn)在大部分認為最好的一種交互方式之一,也是行業(yè)中采用最多的交互方式。語音講究的是聽說讀寫,相聲靠的是說學逗唱,現(xiàn)在很多做語音交互的公司很厲害,采用他們方案的機器人,個個都能說的一口好相聲。但是黑眼說唱的單口相聲能活多久呢?機器人視覺則能為更多的交互方式提供基礎,人臉識別,手勢識別,行為(體態(tài))識別,環(huán)境識別。與語音比較起來,視覺還具有更深層次的意義,視覺讓機器人能從被動的接受信息,到主動地去觀察周邊的環(huán)境、主動觀察和它接觸的人與他的動作,然后做出一些更具有個性化的反應,這也是機器人智能的一個基礎。

有了視覺,智能機器才能對人有更好的理解,它可以能夠通過識別你的臉來找到你并通過對環(huán)境的識別來定位你的位置,通過你臉上的表情來讀懂你的情緒,識別出你的手勢或者行為指令,更加高效的,有目的性的跟你進行交流。

除了單口相聲,機器人還得能“閱面”識人

趙京雷說在視覺算法中,主要使用到一項技術就是深度學習技術,而深度學習現(xiàn)在卻面臨著另一個問題:低效。通過云端處理數(shù)據(jù)的解決方案不能保證任何時候機器都能快速,高精地處理數(shù)據(jù),尤其是在網(wǎng)絡情況復雜的環(huán)境中。于是,他找來了前美國卡內(nèi)基梅隆大學機器人研究所副研究員Leon一起優(yōu)化視覺算法;前百度高級工程師宋向明來做架構,不僅解決了精度和效率問題,同時還通過大量的前端化工作,讓閱面的產(chǎn)品離線時也能比API云服務產(chǎn)品可靠,人臉識別和表情識別等深度模型壓縮到非常小,在嵌入式的低端arm系統(tǒng)上也能夠非常實時的,不依賴于GPU來工作。

就當我們可以給閱面科技這家做圖像識別的軟件公司下定論之時,竟發(fā)現(xiàn),他們已經(jīng)開始做硬件了。產(chǎn)品名字叫RoboEye(技術員取名思維),看一眼就能猜到是什么產(chǎn)品:攝像頭。

視覺是一個復雜的系統(tǒng),想要獲取到更多的環(huán)境信息時就可能需要更好的傳感設備。為什么會去做硬件,對次趙京雷給出的解釋是,自己去做硬件的話,能知道什么樣的設備能提供給我們更多的信息(深度信息),更快的計算能力與更小的能耗。另一方面,在人臉檢測里面,有很多待機的功能,就以檢測為例,就要求機器能時刻檢測在場景里面有沒有出現(xiàn)人臉,有沒有出現(xiàn)手勢,有沒有出現(xiàn)人體框,甚至還有檢測周邊的環(huán)境有沒有發(fā)生變化。降低功耗與進一步增強計算的效率就可以通過攝像頭的硬件配置與自己的軟件部分緊密結(jié)合,一體化操作才能實現(xiàn)最優(yōu)解決。比如通過雙目攝像頭,能夠增加對距離的感知,更好的進行路徑規(guī)劃和導航。

閱面的產(chǎn)品目前分為兩大塊,一個是算法層的,一個是硬件層的。算法層的可以完全基于軟件層出發(fā),它只需要集成。如果只需要軟件層的產(chǎn)品的話,比如你的相聲機器人現(xiàn)在需要一個人臉識別或者手勢識別,那么只集成SDK就可以了。而硬件層主要針對的是需要深入建模,對計算等方面有非常高的性能要求的情況下,閱面給出的一個優(yōu)化好的方案。

“ROKID, 公子小白等主要使用的也就是相關的視覺算法SDK產(chǎn)品,包括ReadFace, ReadHand等產(chǎn)品?!?br/>

計算機視覺和深度學習這塊需要有人才的積累以及海量的數(shù)據(jù)疊加,人工智能算法又是一個需要長時間的優(yōu)化過程,所以在市場上閱面面對的對手都還很強大,沒有自己的優(yōu)勢則可能分分鐘被秒殺下去。

趙京雷說,嵌入式深度學習模型與深度學習模型壓縮和加速技術是他們現(xiàn)在最大的技術優(yōu)勢,另外在表情識別、手勢識別和行為識別方面具有一定的優(yōu)勢,而高效的FPGA加速技術則手中的利刃。

勝,不驕;敗,不餒。閱,不盡;面,俱到。

趙京雷就想成為視覺識別行業(yè)的科大訊飛,讓智能機器人除了會說單口相聲外,還能看到這個世界。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關文章

編輯

雷鋒網(wǎng)上海新聞中心,編輯。關注智能硬件、汽車科技,致力創(chuàng)業(yè)者服務,微信號:OI23432。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說