0
五到十年前,要問科技圈什么產品最火,肯定是「智能手機」,給手機賦予「智能」的概念是從功能機過度的一個結果,經過多年發(fā)展,漸漸手機已經擺脫了「智能」的名號,在大眾的印象中,「智能」已經成為了手機的標配。
「智能手機」到「手機」的蛻變,正是科技發(fā)展中所有技術的一個縮影,當一個技術真正普及,不再是一個稀罕物,成為一個無所不在的東西,那么這項技術就變成了水、電一樣的基礎設施。目前火熱的人工智能,也正在這個蛻變的過程之中,然而如何更快的轉變,也是業(yè)界正在探討的問題。
我們的目標就是AI計算機視覺技術成為水和電一樣的生活必需品。
這是閱面科技CEO趙京雷在剛剛舉辦的發(fā)布會上所說的話。
11月1日上午,閱面科技在深圳大中華舉辦了一場發(fā)布會攜手英特爾 Movidius,推出了跨模態(tài)人臉識別引擎 Uniface、繁星 AI 芯片視覺模塊。這次發(fā)布會的主題,簡明扼要來說,就是閱面想用極低的門檻和成本,把計算機視覺推向大眾。
隨著人工智能行業(yè)的日益火爆,市場也正在逐漸轉變,比如最近大熱的iPhone X也讓業(yè)界產生了對人臉識別的濃厚興趣,目前業(yè)界也有不少巨頭和技術團隊在進行人臉識別技術的研發(fā),從媒體曝光度來看,人臉識別應用十分廣泛,市場火熱,但從技術層面來說,人臉識別技術依舊存在著許多難以攻克技術難題與門檻,核心算法就是其中之一。
今年7月份,雷鋒網(wǎng)專訪了閱面科技算法總監(jiān)童志軍,對今年閱面科技獲得FDDB和LFW兩個人臉識別比賽雙料冠軍所公布的技術突破進行了討論,雷鋒網(wǎng)在專訪中了解到,閱面科技在FDDB上提交的全新檢測算法突破了小尺寸、模糊和動態(tài)人臉檢測的極限,而在LFW數(shù)據(jù)集也達到了99.82%±0.0007人臉驗證精度的高水平。
在深度學習、計算機視覺核心算法領域,閱面科技此前的技術積累還是不錯的。通過長時間在核心算法領域的探索,閱面在此次發(fā)布會上推出了其自主研發(fā)的業(yè)內首個跨模態(tài)人臉識別引擎 UniFace。
據(jù)趙京雷介紹,與目前主流算法不同的是,UniFace打破了不同Sensor,不同環(huán)境,不同場景,不同領域人臉特征表達的限制,例如同一張注冊照片能在可見光、紅外、3D三種不同的Sensor中進行識別,做到真正以FaceID為連通的人臉識別體系。
具體來說,大部分的人臉識別引擎都是基于可見光進行人臉的識別監(jiān)測,而UniFace做了「跨傳感器集成」,除了可見光之外,還能夠兼容紅外、3D識別,這種多傳感器組合除了能夠大大的提高準確率,還能擴展不同場景的應用。
昨天雷鋒網(wǎng)在報道中提到了「邊緣計算」的火熱,計算力向終端靠近似乎是目前AI落地到大眾應用的一個趨勢,趙京雷說,UniFace 跨模態(tài)人臉識別引擎能夠憑借卷積神經網(wǎng)絡讓前端方案擁有更加強大的處理能力,執(zhí)行圖像的計算和分析任務,并實現(xiàn)前端和云端的聯(lián)動以及知識的遷移,提高整體的識別效率,真正做到以 FaceID 為連通的人臉識別體系。
「無硬件,不AI」
趙京雷在發(fā)布會現(xiàn)場幾乎吼一般的強調了他的這一觀點。
趙京雷表示,硬件是人工智能的重要載體,而在AI要想成為水和電一樣的基礎設施的過程中,推廣和普及需要滿足成本低、功耗低等條件才行。
為了解決這些問題,閱面科技將其核心算法成果UniFace集成了一塊AI芯片視覺模塊,這就是開篇我們所說的那塊「繁星AI芯片」,這塊AI芯片視覺模塊由Sensor+ISP+VPU+嵌入式深度學習視覺算法組成,能從芯片端智能輸出結構化數(shù)據(jù)。在模塊設計上,閱面科技也使用了常規(guī)的38mmX38mm的尺寸,此舉也是為了保障模塊能夠做到即插即用、方便便攜,模塊還支持多種數(shù)據(jù)輸出接口,方便集成,能夠降低開發(fā)智能視覺產品的技術成本。
為了能夠搭載適用于不同場景算法的應用,閱面科技的這塊AI芯片視覺模塊能夠支持不同場景的算法IP:包括人臉識別模塊、數(shù)據(jù)采集模塊、人機交互模塊。
雷鋒網(wǎng)也向閱面科技了解了三個模塊的能力:
人臉識別模塊:通過寬動態(tài)Sensor獲取圖像或視頻流,分析圖像或視頻流中的人臉圖像進行檢測和識別,輸出結構化數(shù)據(jù),可同時追蹤和抓拍30人,抓取最清晰、角度最好的人臉,抓拍率99%,誤檢率小于0.5%,抓拍重復率低于10%。同時,支持2萬人內的完全本地人臉識別。支持本地特征提取后傳云端,滿足大于2萬人的人臉識別場景。
數(shù)據(jù)采集模塊:獲取并分析圖像或視頻流中的人頭和人臉信息,進行人數(shù)、人群屬性以及軌跡分析??蓪崟r記錄15人運動軌跡及運動方向,可進行進出指定區(qū)域的人數(shù)統(tǒng)計,準確率達95%。在本次發(fā)布會現(xiàn)場,閱面科技還發(fā)布了其基于數(shù)據(jù)采集模塊研發(fā)的智能客群分析攝像機——閱客。利用繁星的本地計算能力,閱客可以輕松進行實時客流計數(shù)、會員/熟客管理、軌跡管理等功能,商家能實時掌握顧客屬性和行為。
閱客
人機交互模塊:檢測識別圖像或視頻流中的手勢、人臉、人體,并轉化為指令使得機器做出正確響應。毫秒級檢測及追蹤速度,響應迅速,支持掌、拳、V字手型、伸掌、握拳、揮手等多種手勢操控,高魯棒性的人臉及人體檢測追蹤運算。
值得關注的是,閱面科技的AI芯片視覺模塊還在功耗上進行了一定的優(yōu)化,本地深度學習處理功耗僅為 0.5W,整體高峰功耗小于 2.5W。
「實時動態(tài)」、「低功耗」和「低成本」是閱面科技在推廣自己AI技術時的理念,而這些特點正是AI在普通消費品上賦能所需要的。
在發(fā)布會后的采訪中,趙京雷也談及選擇消費級產品市場作為切入點的原因:基于公有云的AI開放服務市場,未來是BAT等巨頭的展出,在這個領域創(chuàng)業(yè)公司優(yōu)勢不大,而視覺在垂直領域的應用,盡管前景廣闊,但是在數(shù)據(jù)采集等方面已經不是技術能夠解決的事情,目前也有很多大公司在做。而視覺算法在消費級市場的應用目前看起來空間更廣闊,未來會有爆發(fā)性的增長。
這次的視覺模塊也是在這一市場的進發(fā),未來借助低成本的AI技術,助力行業(yè)的成熟,這也是閱面科技在其中的考量。
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。