0
本文作者: 老王 | 2017-11-09 20:29 |
就在林元慶離職創(chuàng)業(yè)之際,曾經(jīng)與林同門的NEC Labs系師弟、前Snap資深科學(xué)家、Snap研究院創(chuàng)始人之一王孝宇博士,于近日宣布加入深耕安防領(lǐng)域的人工智能公司云天勵(lì)飛,出任首席科學(xué)家兼AI副總裁。
如果說MSRA是軍風(fēng)統(tǒng)一的黃埔軍校,那NEC Labs無疑是百花齊放的西南聯(lián)大。
前者低調(diào)、務(wù)實(shí)的風(fēng)格貫穿整個(gè)人工智能研究圈,后者雷厲風(fēng)行的行事風(fēng)格為AI創(chuàng)業(yè)注入了源源不斷的活力,掀起多股AI浪潮。
MSRA的影響力毋庸贅言,而很多人較為陌生的NEC Labs所培養(yǎng)出的余凱、周曦等人已經(jīng)成為細(xì)分領(lǐng)域的領(lǐng)頭人之一,剛剛從百度離職的林元慶也投入到創(chuàng)業(yè)大潮,書寫自己AI歷程的下一篇章。
而今,王孝宇的歸國無疑讓智能安防江湖的角逐更加激烈。
“非??臁!?br/>
在問到回國后的第一感覺時(shí),王孝宇不假思索的說出這三個(gè)字。
“國內(nèi)人工智能圈的節(jié)奏,無論是技術(shù)迭代還是業(yè)務(wù)推進(jìn)速度都遠(yuǎn)超硅谷,這很讓我興奮?!?/p>
連續(xù)六個(gè)月KITTI無人駕駛數(shù)據(jù)庫識別任務(wù)冠軍;2013年ImageNet美國第一,全球第二;美國國家標(biāo)準(zhǔn)局性別識別第一和年齡識別第二;大規(guī)模細(xì)粒度圖像識別研究中,二十萬張圖像數(shù)據(jù)集中識別600多種差異較小的車型,準(zhǔn)確率高達(dá)96%。
這便是作為團(tuán)隊(duì)一份子的王孝宇在NEC Labs任職期間交出的成績。
在NEC Labs打下了結(jié)實(shí)的算法基礎(chǔ)后,2015年,王孝宇加入了當(dāng)時(shí)僅有一百多人的Snapchat,并與李佳一同創(chuàng)辦Snap研究院,主導(dǎo)Snap計(jì)算機(jī)視覺研發(fā),研究云端的視覺解決方案和手機(jī)端的人臉檢測、識別、分割方案,AR,商業(yè)圖像智能等,尤其在模型壓縮上取得了非常優(yōu)秀的成果。
當(dāng)時(shí)王孝宇團(tuán)隊(duì)把運(yùn)行在2億手機(jī)終端的神經(jīng)網(wǎng)絡(luò)壓縮到2MB,超過Google研究團(tuán)隊(duì)的壓縮性能。
在NEC Labs專攻計(jì)算機(jī)視覺基礎(chǔ)技術(shù)研究,在Snap研究手機(jī)端的消費(fèi)級AI功能,雖然兩個(gè)地方做的事兒都讓王孝宇充滿干勁,但他明白,這并不是自己內(nèi)心真正想要的。
“這次我回國加入云天勵(lì)飛,就是想讓AI更直接地為傳統(tǒng)行業(yè)賦能,這里我需要強(qiáng)調(diào)下‘ 更直接’?!?/p>
“我選擇人工智能公司的標(biāo)準(zhǔn)是,在業(yè)務(wù)上腳踏實(shí)地,在服務(wù)模式上和行業(yè)結(jié)合緊密。這家公司要懂得如何做行業(yè)解決方案,而不是單純的人工智能技術(shù)提供商,只做人工智能這一單點(diǎn)技術(shù)?!?br/>
云天勵(lì)飛是一家很To B、更加注重實(shí)際落地的智能安防解決方案商,相反,王孝宇的基礎(chǔ)研究和消費(fèi)級AI研究背景,與新東家所做的事有些不同,這時(shí)候往往會(huì)遇到水土不服的問題。
此前筆者與美的人工智能研究所所長俞大海交流時(shí),安防出身的他談到消費(fèi)級和企業(yè)級人臉識別產(chǎn)品的算法、軟硬件方案,幾乎可以用“完全不同”四字形容。消費(fèi)級產(chǎn)品是以用戶體驗(yàn)為主,而企業(yè)級產(chǎn)品更多講究的是功能實(shí)現(xiàn)。
在研究側(cè)重點(diǎn)和客戶需求迥異的情況下,王孝宇卻并不擔(dān)心。
“05年到08年期間,我本人就已經(jīng)在安防領(lǐng)域創(chuàng)業(yè),公司叫創(chuàng)世科技。這三年間,我不僅熟悉了安防業(yè)務(wù)的流程,也深諳行業(yè)痛點(diǎn),所以基本上不存在行業(yè)水土不服的問題?!?/p>
隨后,他繼續(xù)補(bǔ)充道,過去由于智能攝像頭架設(shè)數(shù)量有限,客戶方往往看重安防解決方案的準(zhǔn)確性,對速度的要求并不嚴(yán)格。但近兩年隨著各家頂尖供應(yīng)商識別精度差異越來越小,智能攝像頭覆蓋數(shù)呈指數(shù)級增多,前端設(shè)備的處理速度成為了重要的比拼點(diǎn)。
目前云天勵(lì)飛在深圳龍崗區(qū)架設(shè)了3000多路智能攝像頭,在全國有6500+多路部署,這些攝像頭都需要大量的視頻處理能力,如果未來當(dāng)規(guī)模達(dá)到數(shù)萬甚至幾十萬路級時(shí),更需要強(qiáng)大的前端強(qiáng)大的分析能力,快速反饋結(jié)果,并降低服務(wù)器端的壓力。
“過去大家都在拼性能,但算法的壁壘會(huì)越來越低,到那個(gè)時(shí)候相差百分之幾的數(shù)字比拼本質(zhì)上并沒多大差別,真正的差別在于誰的算法能在嵌入式端和大規(guī)模數(shù)據(jù)中實(shí)時(shí)運(yùn)行?!?/p>
“15年我們創(chuàng)立Snap研究院時(shí),Google等巨頭都把App的AI功能放在云端處理,但是云端成本太高且速度較慢,于是我們決定把它放在手機(jī)端。當(dāng)時(shí)團(tuán)隊(duì)做了世界上唯一個(gè)運(yùn)行在兩億手機(jī)設(shè)備上的神經(jīng)網(wǎng)絡(luò)系統(tǒng),這套系統(tǒng)可以在幾十毫秒內(nèi)把人臉檢測、識別、分割全部完成,而且功耗很小。其實(shí)這些手機(jī)端的CV研究經(jīng)驗(yàn),很多都可以沿用在攝像頭前端?!?/p>
加入云天勵(lì)飛后,王孝宇的第一要?jiǎng)?wù)是對公司的算法和大數(shù)據(jù)進(jìn)行進(jìn)一步的規(guī)劃。
“在大數(shù)據(jù)上,我們計(jì)劃積攢超過千萬人的數(shù)據(jù)系統(tǒng),增強(qiáng)訓(xùn)練。算法創(chuàng)新上,我們想讓自己的算法在千萬和億級數(shù)據(jù)集上得到更好的效果,開發(fā)算法自動(dòng)化系統(tǒng),縮短研發(fā)周期?!?/p>
在人人都談人臉識別率可達(dá)99%以上時(shí),某安防集成商高管告訴雷鋒網(wǎng),他們曾使用了兩家計(jì)算機(jī)視覺公司的人臉識別方案,最終在某個(gè)場景中的實(shí)戰(zhàn)準(zhǔn)確率分別為30%-40%和70%左右,準(zhǔn)確率相差百分之四十之多,后者已經(jīng)是行業(yè)頂級水平。
王孝宇指出,這個(gè)現(xiàn)象其實(shí)就能反映出AI實(shí)戰(zhàn)的重要性。
由于實(shí)驗(yàn)室?guī)熘械臄?shù)據(jù)量較小,產(chǎn)品單一,模型訓(xùn)練相對簡單,因此能夠達(dá)到很高的精度。研究者們能夠輕而易舉在LFW中取得非??捎^的成績,主要因?yàn)長FW僅有一萬數(shù)據(jù)量。但在實(shí)際應(yīng)用場景下,方案商面臨的底庫完全能夠達(dá)到幾百萬、幾千甚至上億人級,精度會(huì)立馬下降。
而且在安防實(shí)戰(zhàn)動(dòng)態(tài)底庫數(shù)據(jù)比拼當(dāng)中,各家公司完全不在同一起跑線上。
除了底庫外,復(fù)雜的應(yīng)用場景,如遠(yuǎn)距離、夜晚、側(cè)臉、逆光等環(huán)境都會(huì)對識別影響很大。
“我認(rèn)為半年到一年以后,絕大部分公司的算法和性能都可能處于同一條起跑線上。但技術(shù)領(lǐng)域有個(gè)規(guī)律,當(dāng)A條件成熟之后,就會(huì)對B條件產(chǎn)生新的要求。”
如馬斯洛需求理論把人類的需求,像階梯一樣從低到高按層次分為五種并層層遞進(jìn)一樣,科技這一行,客戶對供應(yīng)商的技術(shù)要求也會(huì)隨著低層需求的滿足,從而對其他條件提出更高的要求。
“性能和速度之后,就是智能攝像頭硬件的比拼,尤其是硬件價(jià)格的比拼。”
“同樣的算法、同樣的精度、同樣強(qiáng)大的處理能力,有人只需要1萬塊的硬件就能架設(shè)完,而有人可能得花費(fèi)10萬。雖然近些年算法方案的價(jià)格戰(zhàn)屢見不鮮,但更殘酷的硬件價(jià)格戰(zhàn)正在來臨?!?/p>
寒冬將至之際,云天勵(lì)飛也在這個(gè)關(guān)鍵節(jié)點(diǎn)發(fā)布全新產(chǎn)品IFBOX V3.0,可應(yīng)用于傳統(tǒng)攝像頭改造,硬件產(chǎn)品二次開發(fā)等。該產(chǎn)品采用嵌入式設(shè)計(jì)CPU+DSP架構(gòu),提供較高性價(jià)比的視頻圖像處理及人臉識別解決方案,最高支持到每秒50+人臉抓拍,15+個(gè)人臉特征值提取;數(shù)據(jù)庫最高可以支持超過20W,并實(shí)現(xiàn)每秒15+個(gè)人臉的數(shù)據(jù)庫對比。
目前云天勵(lì)飛也已聚集了一個(gè)40多人的團(tuán)隊(duì)研發(fā)AI芯片,并將于明年生產(chǎn)投片,為客戶提供“芯片+算法+數(shù)據(jù)+應(yīng)用+服務(wù)”端到端的整體解決方案,全面進(jìn)入備戰(zhàn)狀態(tài)。
一邊為安防“硬”戰(zhàn)籌備糧草,云天勵(lì)飛一邊也在探索安防之外的場景。
安防中可以標(biāo)識人身份的有兩種重要信息:人臉和車。
王孝宇談到,為了更全面的掌握“人”的信息,除了老本行對“人”的檢測和識別外,云天勵(lì)飛接下來最有可能做的事情將圍繞車來展開,完成在各種復(fù)雜環(huán)境下對每一輛車的識別等。
“但我們也不得不考慮另外一個(gè)問題,當(dāng)無人車普及后,私家車更多會(huì)以共享的形式出現(xiàn),這時(shí)候車輛信息在人身份中扮演的角色權(quán)重就會(huì)下降。因此我們需要提前預(yù)判新的場景,并籌備新的解決方案:當(dāng)用戶進(jìn)入共享無人車時(shí),這時(shí)需要攝像頭來捕捉到進(jìn)入車的人是誰,汽車端的監(jiān)控方案會(huì)成為必需品。"
做解決方案得隨時(shí)考慮未來可能發(fā)生的狀態(tài),隨著場景的改變,很多應(yīng)用也會(huì)隨之改變,王孝宇總結(jié)到。
隨后他又談到基于監(jiān)控?cái)z像頭的新應(yīng)用。
眾所周知,互聯(lián)網(wǎng)是收集用戶線上行為數(shù)據(jù)、構(gòu)建人用戶畫像的重要平臺(tái),而用戶線下的行為數(shù)據(jù)卻很難采集。
這時(shí)候,安裝在城市中的億萬個(gè)攝像頭將會(huì)成為構(gòu)建人線下用戶畫像的新平臺(tái)。
云天勵(lì)飛希望通過對城市用戶畫像,挖掘這中間的數(shù)據(jù)附加值。
“我在Snap也有做過相關(guān)的研究,我們在這方面的技術(shù)能力全球領(lǐng)先?!?/p>
除此之外,云天勵(lì)飛的新研究團(tuán)隊(duì)具有廣泛的AI技術(shù)研發(fā)實(shí)力,如醫(yī)學(xué)影像和無人車等,但有些傳統(tǒng)行業(yè)的數(shù)據(jù)壁壘和商業(yè)壁壘比技術(shù)壁壘更高,還處于戰(zhàn)略調(diào)研階段。
“云天勵(lì)飛選擇進(jìn)入某個(gè)行業(yè)比較慎重,得深入調(diào)研我們團(tuán)隊(duì)對這個(gè)行業(yè)有沒有一個(gè)好的思路,好的積累。等到對商業(yè)模式有充分把握后,再去用技術(shù)實(shí)現(xiàn)?!?/p>
確實(shí),過去人工智能企業(yè)野蠻生長時(shí)期,商業(yè)模式很容易被技術(shù)誤導(dǎo)。
微軟亞洲研究院副院長張益肇曾告訴雷鋒網(wǎng),很多AI創(chuàng)業(yè)者們在切入某個(gè)場景時(shí),既沒捋順流程,也沒想清模式。單純覺得我有AI技術(shù),有幾個(gè)合作伙伴,就能大干一場。
于是技術(shù)先行,在沒認(rèn)清自己,想好業(yè)務(wù)時(shí),直接用人工智能去撬動(dòng)整個(gè)行業(yè)。
好者,在碰的鼻青臉腫后吸取經(jīng)驗(yàn)不斷保持商業(yè)模式和產(chǎn)品的迭代,最終走對路;壞者,一蹶不振。
雖然前者“精益創(chuàng)業(yè)”式的產(chǎn)品開發(fā)手段在移動(dòng)互聯(lián)網(wǎng)時(shí)代被互聯(lián)網(wǎng)界熱捧,但在企業(yè)級產(chǎn)品中,這種方式并不是所有公司、投資方和員工能承受得起的。
“我們相對屬于保守派吧,AI技術(shù)的擁有者得對傳統(tǒng)行業(yè)抱有敬畏之心?!蓖跣⒂钚χf道。
作為有著優(yōu)秀實(shí)驗(yàn)室背景的研究者,王孝宇還有一項(xiàng)重要任務(wù)是在美國西雅圖建立AI Lab,專注做更加前沿的工作。
過去云天勵(lì)飛圍繞業(yè)務(wù)創(chuàng)立了應(yīng)用機(jī)器學(xué)習(xí)組和機(jī)器學(xué)習(xí)框架組,探討如何搭建更好的框架,更高效地做訓(xùn)練,更高效地采集數(shù)據(jù),更直觀地做可視化,滿足公司幾個(gè)月內(nèi)的技術(shù)需求。
“AI Lab主要聚焦在6個(gè)月到2年內(nèi)的前瞻性研究,很多時(shí)候,當(dāng)你鉆進(jìn)一個(gè)很細(xì)的應(yīng)用之后,不站在外面看問題,很難看到更多改進(jìn)的空間,我們非常需要有這樣一群人去看6個(gè)月到2年后的技術(shù)走向?!?span style="color: #FFFFFF;">雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。