0
本文作者: 李雨晨 | 2017-11-21 10:25 |
雷鋒網(wǎng)消息,11月初,觸景無限科技(北京)有限公司(下簡稱觸景無限)在深圳安博會(huì)上發(fā)布全球首款基于Intel-Movidius芯片開發(fā)的嵌入式人臉抓拍系統(tǒng)——“瞬視”,以前端、動(dòng)態(tài)、實(shí)時(shí)人臉檢測、人臉識別幫助安防企業(yè)在人工智能與大數(shù)據(jù)時(shí)代的應(yīng)用落地,讓視頻結(jié)構(gòu)化數(shù)據(jù)價(jià)值得到更多挖掘。
雷鋒網(wǎng)了解到,觸景無限是一家通用化 AI 感知模塊的方案提供商,目前專注于攝像頭和無人機(jī)方向。
感知智能
在算法模型還沒有那么高級、可以支撐起機(jī)器視覺功能的現(xiàn)況下,前端硬件傳感器的感知能力變得尤為重要。機(jī)器感知能力,大多指的是安裝各種不同種類滿足不同需求的傳感器,然后數(shù)據(jù)傳輸?shù)皆贫诉M(jìn)行處理,這就出現(xiàn)了一個(gè)時(shí)效性問題。
觸景無限CEO肖洪波向雷鋒網(wǎng)表示,區(qū)別于基于云的中心計(jì)算,觸景無限的嵌入式人工智能是一種邊緣計(jì)算,推出的一系列嵌入式智能感知模組,最大的特點(diǎn)是感和知的融合,本身具備了可以定制的多種傳感器和數(shù)據(jù)處理平臺,數(shù)據(jù)的處理和運(yùn)算不是經(jīng)由互聯(lián)網(wǎng)傳輸?shù)椒?wù)器上,而是在本地設(shè)備上進(jìn)行,讓處于互聯(lián)網(wǎng)邊緣的個(gè)體發(fā)揮更大的作用。
“邊緣計(jì)算和中心計(jì)算是有一個(gè)邏輯上的匹配的。大型的人臉識別算法還是在云數(shù)據(jù)庫上來訓(xùn)練,但訓(xùn)練完這個(gè)結(jié)果,去執(zhí)行的時(shí)候,還一定需要在云上嗎?這就不合理了?!?/p>
嵌入式 AI 到底能做到什么?與云端 AI 相比,更適合應(yīng)用到哪些場景里?
受到計(jì)算資源的限制,嵌入式端很難實(shí)現(xiàn)模型訓(xùn)練的過程。而在推斷環(huán)節(jié),云端推斷和嵌入式推斷,二者訴求不同,因此也在不同的應(yīng)用場景能夠發(fā)揮自己的優(yōu)勢:前者的好處是,能夠承受高吞吐量并滿足復(fù)雜計(jì)算對資源的要求,因此多用于深度學(xué)習(xí)模型和計(jì)算較復(fù)雜的情況;而后者,則更多的應(yīng)用于對“實(shí)時(shí)處理”有更高要求的場景中。
在接受雷鋒網(wǎng)采訪時(shí),肖洪波表示,很多時(shí)候我們都把視覺問題簡化成了一個(gè)分類或者一個(gè)識別的問題,但實(shí)際上視覺里面涉及到非常多的細(xì)節(jié)問題,它主要涉及5個(gè)大的領(lǐng)域,包括顏色、光照、形狀、移動(dòng),還有距離。這幾個(gè)處理在視覺皮層中是同時(shí)并行的處理。
在肖洪波看來,人工智能更像一個(gè)統(tǒng)計(jì)學(xué)工具,通過統(tǒng)計(jì)的方式幫我們?nèi)プ鲆恍?shù)值上的模擬和處理?!耙虼艘曈X感知就變得更加重要,因?yàn)橐曈X是我們很多傳感器里面非常重要的一個(gè),我甚至覺得是最重要的傳感器,就像眼睛對于我們?nèi)祟惖闹匾潭纫粯??!?/p>
但肖洪波也表示,嵌入式智能感知芯片也面臨著幾個(gè)問題:
不同傳感器獲取數(shù)據(jù)后的深度融合
一個(gè)設(shè)備通常要配備非常多的傳感器,比如激光雷達(dá)、超聲波雷達(dá)、IMU、壓力傳感器、GPS、TOF等,這些傳感器在不同的情況下要滿足用戶的不同需求,數(shù)據(jù)要做深度的融合。這些傳感器怎么樣能夠把數(shù)據(jù)進(jìn)行很好的過濾和融合,是前端和后端處理都要考慮的問題。
計(jì)算能力更低,實(shí)時(shí)性要求卻更高
實(shí)時(shí)性要求可能比后端服務(wù)器還要高,否則這個(gè)設(shè)計(jì)就是沒有意義的。但前端不適合做非常深層的算法模型,相同配置下,前端處理的計(jì)算能力其實(shí)比較低的,怎樣在前端嵌入式系統(tǒng)里對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行踩點(diǎn)和壓縮,是嵌入式智能感知面臨的非常大的課題。它需要把對數(shù)據(jù)的裁減和壓縮轉(zhuǎn)化成在模型上的優(yōu)化問題,以最小的計(jì)算資源代價(jià),跑最大規(guī)模的神經(jīng)網(wǎng)絡(luò),從而保證識別率。
資源有限
在智能感知的解決方案里面,深度學(xué)習(xí)是在前端來運(yùn)行的。肖洪波就表示,“以前大家在做深度學(xué)習(xí)的過程中,傾向于把網(wǎng)絡(luò)做得越深越好,因?yàn)檫@樣的話,可能能夠識別更多的圖片,比如說有做上千層的深度學(xué)習(xí)網(wǎng)絡(luò),但是在嵌入式上面臨的一個(gè)挑戰(zhàn),就是說我們的資源是有限的,沒有辦法去跑特別大的這些模型?!?/p>
“嵌入式的視覺感知中,怎樣能夠把更多的傳感器與圖像傳感器前面看到的數(shù)據(jù)做深度的融合。比如視覺傳感器,它在白天的時(shí)候可能很好,但是晚上根本沒有辦法使用。比如TOF在室內(nèi)可能很好,但是在室外光線的影響下可能什么東西都不能識別。嵌入式實(shí)時(shí)性要求很高。如果放在服務(wù)器上處理,時(shí)間是非常慢的,沒有辦法在前端做實(shí)時(shí)的反饋和處理。所以感和知這兩個(gè)事情本身來講,它是同一個(gè)命題,如果是同一個(gè)命題它將帶來哪些技術(shù)上的挑戰(zhàn)?”
據(jù)雷鋒網(wǎng)了解,觸景無限在安博會(huì)上發(fā)布的瞬視人臉抓拍系統(tǒng)在軟硬件處理上為全嵌入式,將智能分析處理服務(wù)器即VPU模塊嵌入到攝像機(jī)里,無需再配置后端服務(wù)器。也就是說不同于傳統(tǒng)人臉抓拍機(jī)在前端抓拍圖片、后端服務(wù)器分析比對,運(yùn)用瞬視系統(tǒng)可在前端實(shí)時(shí)做智能分析,從而使得攝像機(jī)整體更加簡潔高效。
針對上述的成像問題,肖洪波表示,瞬視系統(tǒng)可以通過前端進(jìn)行底層ISP調(diào)節(jié),進(jìn)行智能處理后,區(qū)分光線變化,進(jìn)而實(shí)現(xiàn)清晰的成像質(zhì)量。
此外,傳統(tǒng)人臉抓拍機(jī)還存在檢測準(zhǔn)確率不高、漏抓誤報(bào)較多、人臉抓拍不清晰、圖像質(zhì)量不理想等局限。據(jù)肖洪波介紹,目前,瞬視系統(tǒng)人臉檢測視頻分辨率達(dá)到了1080P,檢測幀率為30幀/秒,每幀最大人臉檢測數(shù)超過100人(人臉像素:40),正臉檢出率>99%,誤檢率<1%,“我們是想讓前端能夠看懂每一幀的像素?!?/p>
在嵌入式芯片基礎(chǔ)上,觸景無限還開發(fā)了一個(gè)智能感知的平臺?!拔覀兿M谡麄€(gè)產(chǎn)業(yè)鏈里面可以幫助到很多終端的產(chǎn)品公司。以前這些公司都要做端到端的產(chǎn)品解決方案,從芯片選型開始到算法的移植,再到整合傳感器,到最后產(chǎn)品成型。我們希望提供一個(gè)軟硬件的中間平臺可以提供給產(chǎn)品的開發(fā)商,讓他們比較簡單地就把傳感器的功能嵌入到產(chǎn)品里去?!?/p>
此外,觸景無限還在線上提供算法庫的支持,既有自主研發(fā)的算法,也有和科研機(jī)構(gòu)聯(lián)合產(chǎn)出的成果。此前,觸景無限和中科院深圳先進(jìn)技術(shù)研究院成立了“嵌入式人工智能與機(jī)器視覺”聯(lián)合實(shí)驗(yàn)室,還聯(lián)合了Intel、UIUC及視覺研究機(jī)構(gòu)推出了“點(diǎn)睛計(jì)劃”。
在采訪中,肖洪波向雷鋒網(wǎng)表示,觸景無限已經(jīng)嘗試將視覺卡運(yùn)用于安防領(lǐng)域,例如安防槍機(jī)、人證合一的閘機(jī)、手持終端、可穿戴設(shè)備、卡口、智能門禁、公交車的人臉檢測、人臉識別等。
通過一個(gè)微型攝像頭和手機(jī)大小的設(shè)備來幫助警察實(shí)現(xiàn)個(gè)人身份信息的快速比對,設(shè)備可以讀取身份證信息,通過攝像頭采集的圖像信息進(jìn)行人證合一的比對,同時(shí)還可以篩查出是否為在逃犯罪嫌疑人,結(jié)果會(huì)顯示在設(shè)備的屏幕上?!吧踔烈院笪覀兙桶阉釉谘坨R上,這個(gè)人到底是不是嫌疑犯,結(jié)果會(huì)顯示在眼鏡上?!?br/>
肖洪波認(rèn)為,隨著人工智能的發(fā)展,會(huì)出現(xiàn)非常大的產(chǎn)業(yè)分工,大家專注到自己的領(lǐng)域,提供不同的解決方案,把各自擅長的東西融合在一起,將為用戶提供更加有效的解決方案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。