丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給周翔
發(fā)送

0

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(三)

本文作者: 周翔 編輯:谷磊 2017-04-12 18:07
導(dǎo)語:“在創(chuàng)業(yè)公司是否能做好研究?”我的結(jié)論是,可以做最好的研究。

雷鋒網(wǎng)按:本文為曠視科技首席科學(xué)家孫劍日前在 CCF 與 KDD China 聯(lián)合主辦的ADL上做的題為《如何在大公司和創(chuàng)業(yè)公司做好計算機視覺研究》的分享,雷鋒網(wǎng)進(jìn)行了全文整理。以下是最后一部分。

傳送門:曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺研究(一)

            曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺研究(二)

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(三)

孫劍博士(攝影:劉芳平)

孫劍,博士,曠視科技(Face++)首席科學(xué)家、研究負(fù)責(zé)人。2003年畢業(yè)于西安交通大學(xué)人工智能與機器人研究所,畢業(yè)后加入微軟亞洲研究院(Microsoft Research Asia),任至首席研究員。其主要研究方向是計算攝影學(xué)(computational photography)、人臉識別(face recognition)和基于深度學(xué)習(xí)的圖像理解(deep learning based image understanding)。自2002年以來在CVPR、ICCV、ECCV、SIGGRAPH、PAMI五個頂級學(xué)術(shù)會議和期刊上發(fā)表學(xué)術(shù)論文100+篇,Google Scholar 引用 20,000+次,H-index58,兩次獲得CVPR Best Paper Award (2009, 2016)。孫劍博士于2010年被美國權(quán)威技術(shù)期刊Technology Review評選為“全球35歲以下杰出青年創(chuàng)新者”。孫劍博士帶領(lǐng)的團隊于2015年獲得圖像識別國際大賽五項冠軍(ImageNet分類,檢測和定位,MS COCO檢測和分割),其團隊開發(fā)出來的“深度殘差網(wǎng)絡(luò)”和“基于區(qū)域的快速物體檢測”技術(shù)已經(jīng)被廣泛應(yīng)用在學(xué)術(shù)和工業(yè)界。同時孫劍帶領(lǐng)的團隊的研究成果也廣泛被應(yīng)用在微軟Windows, Office, Bing, Azure, Surface, Xbox等多條產(chǎn)品線上。目前孫劍博士正在帶領(lǐng)曠視科技的研究團隊推進(jìn)計算機視覺技術(shù)的進(jìn)步和探索其在工業(yè)和商業(yè)上的實踐。

以下為演講內(nèi)容,主要介紹了近期計算機視覺的發(fā)展現(xiàn)狀,ResNet基本原理和設(shè)計,曠視科技在計算機視覺的研究進(jìn)展等。最后他還分享了一些“如何在大公司和創(chuàng)業(yè)公司做好研究?”的心得。

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(三)

如何在大公司和創(chuàng)業(yè)公司做好研究?

最后,我想分享下如何大公司和創(chuàng)業(yè)公司做好研究,這些都是個人的一些感悟。我經(jīng)常被問到以下幾個問題:

在創(chuàng)業(yè)公司還能否做研究?

在創(chuàng)業(yè)公司能否做好研究?

是不是會完全被產(chǎn)品導(dǎo)向?

研究是不是只有用paper來衡量?

研究成果被友商抄去了怎么辦?

(雷鋒網(wǎng)注:孫劍在演講最后給出了自己的回答。)

大公司和創(chuàng)業(yè)公司的研發(fā)部門的異同

任何一個研發(fā)部門,不管是大公司還是小公司,在我看來,其共同的部分是這三個要素:

部門的定位是怎樣的?

部門的人員組成是怎樣的?

研發(fā)方式是怎樣的?

這些對應(yīng)的就是柳傳志先生的“定戰(zhàn)略、搭班子、帶隊伍”管理三要素。

我自己比較了一下大公司和小公司,特別是微軟研究院和曠視研究院:

我們的使命定位是類似的,但是我們的目標(biāo)范圍是更小的。我們現(xiàn)在只關(guān)心的研究最好的深度學(xué)習(xí)和計算機視覺技術(shù),讓最好的技術(shù)落地,推動公司的快速發(fā)展。

在人員組成上,我們也是非常類似的。唯一不同的是,我們只有一個人不寫code。我們曠視研究院員工的平均年齡也非常小,而且管理是非常扁平化的。

研發(fā)方式方面,因為規(guī)模不同,所以有些不同。我們的范圍更小,更聚焦,我們每個小組的動態(tài)性也更強,可以短到3個月,也可以長期下去。

創(chuàng)業(yè)公司如何招募人才?

有了以上三個方向之后,接下來就需要招募人才。

大家可以看到,一般的創(chuàng)業(yè)公司都是通過什么方式來招募人才,其實最重要的還是第一條:people bring people(口口相傳)。你可以通過通過個人關(guān)系,把最聰明的人引進(jìn)來。 

當(dāng)然,公開發(fā)表論文這件事情也很重要。因為不管是做深度學(xué)習(xí)還是人工智能,最優(yōu)秀的人才是希望他的成果能夠讓大家看得見的。所以在曠視研究院,我們鼓勵大家發(fā)表公開論文。

我們的人才培養(yǎng)大致有這幾個方向:科學(xué)家、系統(tǒng)架構(gòu)師、以及我們自創(chuàng)的全棧人工智能工程師。

雖然人工智能很復(fù)雜,但是做應(yīng)用的話還是相對來說沒那么高的門檻,因為深度學(xué)習(xí)在一定程度上把這個過程縮短了。所以對系統(tǒng)能力強、工程能力強,同時又想做好研究的人,我們設(shè)立了全棧人工智能工程師這個職位。他們既是人工智能科學(xué)家,也是一個很強的工程師,有很強的解決問題的能力。

創(chuàng)業(yè)公司如何做好研究?

我們認(rèn)為組織建設(shè)最重要的是:正直、對自己誠實;平等;安全感、鼓勵嘗試;學(xué)習(xí)型組織。

曠視公司的使命是“power human with AI”。一個組織要想真正運行下去,運行好,隨著規(guī)模的增大,公司的使命是非常重要的。我們目前的愿景是:做最好的人工智能的云平臺和最好的智能感知網(wǎng)絡(luò)。我們的價值觀是:追求極致、簡單、可靠。

有了人,有了環(huán)境之后,要做好研究有三個非常重要的元素:需要有清晰的目標(biāo),需要motivate每個人,最后把事情貫徹下去。

關(guān)于目標(biāo)設(shè)定,大家可能都有自己的標(biāo)準(zhǔn),我們認(rèn)為應(yīng)該要分別設(shè)立終極目標(biāo)、績效目標(biāo)、以及過程目標(biāo)。我們希望這些目標(biāo)是能實現(xiàn)的,但是同時又是有挑戰(zhàn)性的,而且是大家都agree的。一般的話,我們會為2-4個人的組來制定長期和短期的課題。

有了目標(biāo)之后,最重要的是怎樣讓大家為這個目標(biāo)投入最大的精力。首先,我們相信任何人都是有巨大的潛能的。當(dāng)然,每個人都有選擇的自由,也需要他們的專注、以及想贏的心態(tài)。這些是我們認(rèn)為能提高大家士氣的方法。

我們在深度學(xué)習(xí)訓(xùn)練平臺、數(shù)據(jù)標(biāo)注上的投入是不遺余力的,希望能夠為研究員、實習(xí)生創(chuàng)造最好的訓(xùn)練環(huán)境。

在創(chuàng)業(yè)公司到底能不能做好研究?

最后,回到之前的問題:“在創(chuàng)業(yè)公司是否能做好研究?”

我的結(jié)論是,可以做最好的研究。我們可以在產(chǎn)品和學(xué)術(shù)之間找到很好的平衡點,我們的研究既可以用paper來衡量,也可以用研究在產(chǎn)品中的落地和給你帶來的成就感來衡量。當(dāng)然,我們會選擇性地發(fā)布我們的一些學(xué)術(shù)性成果。

Q&A環(huán)節(jié)

Q:在面部識別中,有些惡意攻擊能夠繞過活體檢測,現(xiàn)在的技術(shù)可以解決這個問題嗎?

A:這實際上是一個安全問題,我之前寫過一篇文章來回答這個問題。任何安全問題,絕對意義的百分之百的解是沒有的,它只能是說比原來的系統(tǒng)更安全。此外我們也有非常多的防止這種攻擊的方式,包括客戶端的、云端的等等。

客戶對安全問題的承受力是不一樣的:有些客戶希望盡可能獲取更多的用戶,因此安全性較低是可以承受的,比如信用卡欺詐。信用卡簽字每年有很多欺詐案件,但是總體來看,發(fā)卡公司是能夠承受的,因為其帶來的利益遠(yuǎn)大于損失,因此可以接受這樣的交易方式。

從大的方面來說,這是非常有效的方式,非常多的客戶對現(xiàn)有的安全程度是認(rèn)可的。另一方面,從技術(shù)上方面來說,會有不斷的新的防活體攻擊的技術(shù)研發(fā)出來。

Q:目前大多數(shù)的活體檢測需要用戶的配合(比如眨眼、張嘴等),未來是否可以不再需要用戶配合,在用戶沒有感覺的情況下,判斷他是不是假體?

A:大家可能已經(jīng)聽說,iPhone 8要推出前置3D紅外攝像頭,這就是一個非常好的新的發(fā)展方向,提供了有著最好用戶體驗的檢測活體攻擊的新思路。

Q:用紅外或者三維這樣的方式,可以解決平面型的,比如打印、視屏的攻擊。但是對于以后可能出現(xiàn)的3D打印的,或者頭套之類的攻擊,這種方法是否還有效?

A:對于頭套攻擊,在業(yè)界,包括我們客戶都認(rèn)為,這種假面具、假頭套超過了現(xiàn)在要考慮的范圍?

Q:您剛才在演講中提到,“深度是決定一個模型學(xué)習(xí)能力最重要的因素”。那么這個深度到底有沒有一個上限?對于一般的檢測和識別任務(wù)來講,什么樣的深度就夠了?

因為最近有個技術(shù)叫模型蒸餾,有一些可能用了一個50層或者100層的模型,但是最后通過模型蒸餾可以用一個10~20層的模型來表達(dá)。那就是說,我們在原始設(shè)計這個任務(wù)的時候,已經(jīng)增加了很多的冗余量進(jìn)去了,您是怎樣看待模型蒸餾的呢?

A:深度到底要多深跟很多因素有關(guān)的。深度最重要的是有很多假設(shè)的,當(dāng)然,跟你的數(shù)據(jù)量的大小有關(guān),還跟其他因素有關(guān),如果不考慮這些,基本上只要能夠匹配好數(shù)據(jù)大小,越深越好。

關(guān)于模型蒸餾,它實際上是個優(yōu)化問題。因為模型蒸餾還是需要一個大的模型來帶著小模型的,那么這個大模型是哪來的?大模型怎樣才能訓(xùn)練好?這些都是要考慮的,因為大模型訓(xùn)練好之后才有小模型。蒸餾是一個很好的方法,但是有時候管用有時候不管用。有些數(shù)據(jù)有關(guān)系,包括我剛才介紹的模型簡化,也是去除模型冗余的方式之一。大模型為什么能夠被“蒸餾”,其實是因為小模型非常難訓(xùn)練,而大模型給了充分的自由度,因此可以訓(xùn)的很好。這意味著,首先需要有一個能訓(xùn)的很好的系統(tǒng),才能誘導(dǎo)這個不好訓(xùn)的系統(tǒng)。如果你直接切換成小模型,以現(xiàn)在的技術(shù)來說是很難訓(xùn)出來的。所以說,至少對訓(xùn)練來說,深度還是非常重要的。

Q:您在做公共區(qū)域的視頻分析的時候,是基于圖像做的,還是訓(xùn)練數(shù)據(jù)用一小段視頻去做的?

A:基于圖像做的。

Q:您之前提到的一個檢測region proposals的方法,請問能詳細(xì)的解釋一下Faster R-CNN的基本思想嗎?

A:以前的檢測方法是sliding window,每個位置都會去檢查,幾萬個、幾十萬個都有可能,region proposals用一些方法把這個數(shù)字降到幾千,這樣就可以很快做evaluation。

Faster R-CNN的思想:以前是在圖像上做sliding window,現(xiàn)在是在feature map上做sliding window,去預(yù)測物體可能在哪里,其實也可以認(rèn)為它是一種sliding window。

Q:您剛才提到公司產(chǎn)品FaceID可以再云端實現(xiàn),也可以在客戶端實現(xiàn)。那么它在客戶端實現(xiàn)的硬件平臺和主要思路是什么?

A:我們開發(fā)Brian++的一個目的是:一個模型可能需要支持很多平臺,包括自己內(nèi)部給產(chǎn)品做的SDK同時要支持20多種平臺,包括手機、嵌入式、ARM7、ARM8,甚至包括安卓、Windows等等。我們需要支持非常多的平臺,不同平臺的計算不同,比如手機或者平板上精度model size是一定要比云端小很多的,主要是看具體業(yè)務(wù)需要做到什么地步,然后再去平衡計算復(fù)雜度和精度。

Q:關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí),以我的了解,現(xiàn)在的網(wǎng)絡(luò)學(xué)習(xí)一般都是在學(xué)習(xí)好之后,然后通過剪枝的方式來優(yōu)化這個網(wǎng)絡(luò)結(jié)構(gòu),使得這個網(wǎng)絡(luò)結(jié)構(gòu)更加精簡。那么是不是能通過不斷地數(shù)據(jù)流入,網(wǎng)絡(luò)結(jié)構(gòu)不斷學(xué)習(xí),實現(xiàn)生長式的學(xué)習(xí)過程?

A:這方面的文獻(xiàn)目前很少。實際上,通過增強學(xué)習(xí)方法來不斷調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)目前不是非常成功。目前來說,訓(xùn)練一個非常有效的網(wǎng)絡(luò),周期非常長,因此整個周期也降不下來,所以目前沒有非常好的方式來自動學(xué)好網(wǎng)絡(luò)結(jié)構(gòu)。我自己也不是非常確信能夠?qū)W得好。

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(三)

【招聘】雷鋒網(wǎng)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時間提供海外科技動態(tài)與資訊。我們需要若干關(guān)注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。 

簡歷投遞至 wudexin@leiphone.com,工作地 北京。

相關(guān)文章:

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺研究(一)

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(二)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

曠視科技孫劍:如何在大公司和創(chuàng)業(yè)公司做好計算機視覺的研究(三)

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說