0
本文作者: 奕欣 | 2017-07-28 17:30 | 專(zhuān)題:CVPR 2017 |
雷鋒網(wǎng) AI 科技評(píng)論按:在 CVPR 2017 ,雷鋒網(wǎng) AI 科技評(píng)論看到了非常多的工業(yè)界人士來(lái)到現(xiàn)場(chǎng)。這個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域的學(xué)術(shù)會(huì)議吸引了如此多的企業(yè)研究院大牛,他們對(duì)工業(yè)界與學(xué)術(shù)界的融合有何看法?又是如何理解自家業(yè)務(wù)在視覺(jué)領(lǐng)域的地位和創(chuàng)新點(diǎn)的?為此,雷鋒網(wǎng) AI 科技評(píng)論與阿里 iDST 視覺(jué)計(jì)算組負(fù)責(zé)人華先勝在 CVPR 的現(xiàn)場(chǎng)進(jìn)行了一次交流。
華先勝,北京大學(xué)應(yīng)用數(shù)學(xué)博士、IEEE Fellow、ACM 2015 年度杰出科學(xué)家、MIT TR 全球 35 位 35 歲以下的杰出青年創(chuàng)新人物,曾擔(dān)任 ACM Multimedia 等大會(huì)程序委員會(huì)主席,是視覺(jué)識(shí)別和搜索領(lǐng)域的國(guó)際級(jí)權(quán)威學(xué)者。于 2016 年 7 月加入阿里人工智能研究機(jī)構(gòu)iDST科學(xué)家團(tuán)隊(duì),帶領(lǐng)視覺(jué)計(jì)算團(tuán)隊(duì)的研發(fā)工作。
華先勝認(rèn)為,CVPR 這個(gè)會(huì)議整體上還是非常成功的。計(jì)算機(jī)視覺(jué)領(lǐng)域的研究大多傾向于實(shí)用,與工業(yè)界的聯(lián)系也比較緊密,企業(yè)參與到學(xué)術(shù)會(huì)議中,實(shí)際上也能了解學(xué)術(shù)研究的整體發(fā)展?fàn)顩r。就像 SIGGRAPH 一樣,當(dāng)工業(yè)界的參與程度非常高的時(shí)候,這個(gè)會(huì)議也變得越來(lái)越紅火。「這類(lèi)會(huì)議成功與否的一個(gè)重要標(biāo)準(zhǔn)在于,它能不能對(duì)工業(yè)界產(chǎn)生影響力。如果只是學(xué)術(shù)圈自己在推進(jìn),這個(gè)領(lǐng)域可能會(huì)變得越來(lái)越封閉?!?/p>
雷鋒網(wǎng) AI 科技評(píng)論也發(fā)現(xiàn),不論是贊助商日趨增加的 AAAI 2017,或是應(yīng)用研究開(kāi)始嶄露頭角的 ACM 計(jì)算經(jīng)濟(jì)學(xué)會(huì)議,與工業(yè)界的融合和溝通已經(jīng)越來(lái)越頻繁,而尤其是在計(jì)算機(jī)視覺(jué)這個(gè)領(lǐng)域,學(xué)術(shù)界和工業(yè)界的界限也變得模糊起來(lái),很多文章可能都是高校與企業(yè)研究院一同合作的課題。
以本次被 CVPR 錄用的論文《Video2Shop: Exact Matching Clothes in Videos to Online Shopping Images》為例,第一作者是西南交通大學(xué)的博士生程治淇,他在阿里實(shí)習(xí)期間與視覺(jué)計(jì)算組負(fù)責(zé)人華先勝、高級(jí)算法專(zhuān)家劉揚(yáng)及他的導(dǎo)師、西南交通大學(xué)的吳曉教授合作完成了這一論文。論文提出了一個(gè)名為 AsymNet 的深度神經(jīng)網(wǎng)絡(luò),通過(guò)學(xué)習(xí)衣物序列特征并對(duì)其進(jìn)行編碼,能夠檢測(cè)并追蹤衣物,用戶(hù)在觀看視頻的時(shí)候,便可以輕松地選購(gòu)明星同款服裝。
這一研究自然是著眼于阿里的老本行——電商領(lǐng)域,華先勝最初的工作也一直關(guān)注的是像「拍立淘」這樣的產(chǎn)品系統(tǒng)。而目前,華先勝作為阿里 iDST 視覺(jué)計(jì)算組的負(fù)責(zé)人,目前所負(fù)責(zé)的城市大腦項(xiàng)目,也同樣有著視覺(jué)的需求。
在本次 CVPR 的 workshop 環(huán)節(jié),華先勝作為 Target Re-Identification and Multi-Target Multi-Camera Tracking 的特邀演講嘉賓之一,發(fā)表了《Practices of Large-Scale Target Re-Identification》的演講。
華先勝告訴雷鋒網(wǎng) AI 科技評(píng)論,這一主題和電商的商品搜索及城市大腦項(xiàng)目都有著緊密的聯(lián)系,因此將阿里整個(gè)集團(tuán)與目標(biāo)重識(shí)別的業(yè)務(wù)綜合地做了一個(gè)介紹。搜索(search)的范圍相對(duì)寬泛一些,只需要找到符合要求的內(nèi)容,甚至是相似的內(nèi)容就可以了,比如以圖搜圖,可能會(huì)有很多相近的結(jié)果;而重新識(shí)別(Re-Identification)則需要精準(zhǔn)匹配,比如在整個(gè)城市里找到某輛車(chē),目標(biāo)就非常明確了(只有一個(gè))。不過(guò),商品的搜索與城市大腦項(xiàng)目所涉及到的幾個(gè)關(guān)鍵步驟是很相似的,本質(zhì)上也就是做一個(gè)視覺(jué)搜索系統(tǒng)(visual search system)?!高@與拍立淘的系統(tǒng)其實(shí)是很像的,只不過(guò)關(guān)鍵點(diǎn)的差別是在 feature 上。對(duì)于電商而言,要找的就是同一個(gè)商品或是相似的商品;而對(duì)于城市大腦的話(huà),我們目前要找的主要集中于三種對(duì)象:車(chē)、人,和騎車(chē)的人?!?/p>
阿里從淘寶起家,后來(lái)也投身支付寶和菜鳥(niǎo)的業(yè)務(wù),但實(shí)際上并沒(méi)有跳脫出電商的本質(zhì)。目前,城市大腦項(xiàng)目組的推行,則讓很多人看到了阿里的另一個(gè)野心:云計(jì)算?!赴⒗锿菩谐鞘写竽X項(xiàng)目最關(guān)鍵的地方在于,希望能通過(guò)大計(jì)算去挖掘大數(shù)據(jù)背后的價(jià)值?!谷A先勝告訴雷鋒網(wǎng) AI 科技評(píng)論,不論是交通或是安全,城市是一個(gè)非常大的數(shù)據(jù)載體,或者說(shuō)是聚合體。包括視頻信號(hào)、GPS 信號(hào)、微波信號(hào)等多種類(lèi)型的數(shù)據(jù)每天都在積累,但其中的價(jià)值還遠(yuǎn)遠(yuǎn)沒(méi)有充分挖掘出來(lái)?!赴⒗锍鞘写竽X中很關(guān)鍵的一個(gè)任務(wù)就是要解決視覺(jué)信號(hào)的問(wèn)題,這實(shí)際上是對(duì)城市的智能感知?!?/p>
城市在沒(méi)有攝像頭的時(shí)候,一開(kāi)始可以說(shuō)是處于一個(gè)「無(wú)感無(wú)知」的情況;后來(lái)城市里有了攝像頭,但缺乏這些數(shù)據(jù)的分析和研究,這個(gè)狀態(tài)就是所謂的「感而不知」;而在??低暋⒋笕A為代表的公司在攝像端算法上發(fā)力,逐漸往「感而略知」發(fā)展;如今以阿里等企業(yè)牽頭所做的城市大腦項(xiàng)目,則是希望做到「感而全知」。
「全面知、全局知、全時(shí)知,」華先勝以這三個(gè)詞概括了城市大腦的主要特點(diǎn)。全面知指的是除了車(chē)和車(chē)牌之外,我們可以了解城市中包括人與非機(jī)動(dòng)車(chē)的一些情況;全局知指的是整個(gè)系統(tǒng)有強(qiáng)大的計(jì)算能力,得以從多個(gè)方面宏觀了解城市的情況;全時(shí)知?jiǎng)t是實(shí)時(shí)、及時(shí)地把握城市在交通、安全等方面的情況。
此前華先勝在接受雷鋒網(wǎng)采訪的時(shí)候也提及,自己并不認(rèn)可企業(yè)只關(guān)注算法的商業(yè)模式,「城市大腦項(xiàng)目的推進(jìn)得益于強(qiáng)大的計(jì)算能力和 AI 技術(shù)的發(fā)展,阿里在做的其實(shí)是一個(gè)平臺(tái)、一個(gè)生態(tài),歡迎各個(gè)企業(yè)也能夠加入其中,這樣一來(lái),數(shù)據(jù)的價(jià)值也能更好地體現(xiàn)?!?/p>
而在 CVPR 2017 交流期間,華先勝也了解到,比起學(xué)術(shù)界,工業(yè)界能接觸到的數(shù)據(jù)量確實(shí)有著質(zhì)的差距?!肝易蛱炜吹揭粋€(gè) poster,用了大概 20 個(gè)攝像頭、上百個(gè)人的數(shù)據(jù),就算得上是大數(shù)據(jù)的研究了(large-scale),但阿里在算法研發(fā)中自測(cè)數(shù)據(jù)集基本上是上千個(gè)攝像頭,上萬(wàn)個(gè)人的體量,這個(gè)數(shù)字在學(xué)術(shù)界可能是無(wú)法想象的?!共贿^(guò),華先勝也指出了工業(yè)界的上線壓力和快節(jié)奏的特點(diǎn),這也常常導(dǎo)致很多研究難以做得更加深入,需要學(xué)術(shù)界的自由度和前瞻性來(lái)彌補(bǔ)。
華先勝也告訴雷鋒網(wǎng) AI 科技評(píng)論,他在參會(huì)時(shí)感受一個(gè)明顯的需求,就是提升深度學(xué)習(xí) inference 的計(jì)算效率。不管是 embedded device 上的需求,還是云上大規(guī)模計(jì)算的場(chǎng)景,如何降低計(jì)算成本成為了一個(gè)熱點(diǎn)?!敢园⒗锇桶偷某鞘写竽X項(xiàng)目為例,需要處理的數(shù)據(jù)量非常大,從成本的角度出發(fā),對(duì)效率也提出了更高的要求。阿里 iDST 同樣在做相關(guān)的優(yōu)化工作,也希望從本次 CVPR 上獲取一些效率提升的研究靈感。
此外,阿里這次來(lái)到 CVPR 現(xiàn)場(chǎng),同樣有著不小的招人需求。正像雷鋒網(wǎng) AI 科技評(píng)論在此前報(bào)道中所提及的,本次的贊助商達(dá)到了 127 家,總贊助費(fèi)超過(guò) 85.9 萬(wàn)美金。與其他工業(yè)界展商一樣,阿里一方面是為了介紹自己的研究成果,另一方面也著眼于在人才濟(jì)濟(jì)的學(xué)術(shù)會(huì)議上招攬優(yōu)秀的老師和同學(xué)們加入阿里 iDST 。我們也期待,阿里 iDST 在未來(lái)能夠給我們帶來(lái)更多的城市大腦應(yīng)用,將數(shù)據(jù)的價(jià)值體現(xiàn)得淋漓盡致。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章