丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
智慧安防 正文
發(fā)私信給張瑞
發(fā)送

0

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

本文作者: 張瑞 2019-07-18 15:54 專題:CCF-GAIR 2019
導(dǎo)語:AI視覺企業(yè)應(yīng)該用“最有效的算法+最經(jīng)濟(jì)的軟硬體”解決客戶的剛需。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

7月12日-7月14日,2019第四屆全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR 2019)于深圳正式召開。峰會(huì)由中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,深圳市人工智能與機(jī)器人研究院協(xié)辦,得到了深圳市政府的大力指導(dǎo),是國內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級交流博覽盛會(huì),旨在打造國內(nèi)人工智能領(lǐng)域極具實(shí)力的跨界交流合作平臺。

7月14日下午,在「智慧城市·視覺智能」專場上,澎思科技首席科學(xué)家、新加坡研究院院長申省梅進(jìn)行了題為「后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地」的演講。

作為人工智能領(lǐng)域嶄露頭角的公司,申省梅介紹道,澎思科技從傳感器-圖像處理到3D幾何,從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)、增強(qiáng)學(xué)習(xí),從監(jiān)督學(xué)習(xí)到半監(jiān)督、無監(jiān)督學(xué)習(xí)都有布局,澎思擁有計(jì)算機(jī)視覺全棧技術(shù),并在人臉識別、行人檢測,目標(biāo)跟蹤、行人再識別、車輛異常行為檢測、自動(dòng)駕駛、移動(dòng)操作機(jī)器人等多項(xiàng)大賽中拿到冠軍。

在限制條件下的人臉識別已經(jīng)取得了很好的成績,但對于如何提高非受限條件下的動(dòng)態(tài)人臉識別效率,申省梅認(rèn)為除了在人臉識別技術(shù)上不斷提高外,還要從源端著手,以及采用圖像增強(qiáng)的方法,比如超分辨,去除運(yùn)動(dòng)模糊、降噪、去抖動(dòng)、去霧、去雨、去雪等。

另外,在視覺的落地上,申省梅認(rèn)為應(yīng)該堅(jiān)持“以商業(yè)價(jià)值為導(dǎo)向的算法開發(fā)”。用“最有效的算法+最經(jīng)濟(jì)的軟硬體”解決客戶的剛需,更重要的是,算法-軟硬件變動(dòng)更新速度,要快速對接客戶的不同需求,形成敏捷而有價(jià)值的運(yùn)營模式。

獲得最佳視覺模型最簡單的規(guī)則是,足夠多的平衡數(shù)據(jù)、足夠好的數(shù)據(jù)標(biāo)注、足夠深的網(wǎng)絡(luò)。

隨著大量數(shù)據(jù)的生成,半監(jiān)督無監(jiān)督的探討有所突破,計(jì)算機(jī)視覺的未來發(fā)展十分樂觀。

隨著工業(yè)界對計(jì)算機(jī)視覺的持續(xù)青睞,眾多企業(yè)將結(jié)合實(shí)際應(yīng)用場景來剪枝優(yōu)化遷移,不斷開拓新的應(yīng)用領(lǐng)域,人工智能行業(yè)的發(fā)展還遠(yuǎn)沒有到巔峰,還有眾多的落地機(jī)會(huì)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

澎思科技首席科學(xué)家申省梅

以下是申省梅大會(huì)現(xiàn)場全部演講內(nèi)容,雷鋒網(wǎng)作了不改變原意的整理及編輯:

大家好,我是澎思科技的申省梅,我今天跟大家分享的是課題是“后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地——商業(yè)價(jià)值為導(dǎo)向的技術(shù)研發(fā)”。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

今天的內(nèi)容分為三個(gè)部分,第一部分是計(jì)算機(jī)視覺澎思科技的全棧技術(shù);第二,有這樣的技術(shù)之后,商業(yè)價(jià)值在哪里?我們要講的是以商業(yè)價(jià)值為導(dǎo)向的算法開發(fā)。第三部分,分享一下人工智能行業(yè)的發(fā)展前瞻。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

計(jì)算機(jī)視覺澎思科技的全棧技術(shù)

澎思的計(jì)算機(jī)視覺全棧技術(shù)包含兩個(gè)方面,首先是澎思有一支全球頂尖的算法團(tuán)隊(duì),有國際前沿的算法研發(fā)能力。計(jì)算機(jī)視覺包含了對周圍世界的描述-幾何學(xué),和計(jì)算機(jī)模仿大腦對看到的世界的學(xué)習(xí)建模。以前的學(xué)習(xí)是機(jī)器學(xué)習(xí),現(xiàn)在深度學(xué)習(xí)逐步代替了機(jī)器學(xué)習(xí),并且我們也看到了很多幾何學(xué)方面出現(xiàn)的問題和局限,大家用深度學(xué)習(xí)把它解決得很好。我們從傳感器(包括普通相機(jī)、高清相機(jī)、ToF 傳感器,Imaging LiDAR),我們從它的底層的研究、圖像的處理到3D融合、3D重建,從機(jī)器學(xué)習(xí)到深度學(xué)習(xí),從深度學(xué)習(xí)到強(qiáng)化學(xué)習(xí),從監(jiān)督學(xué)習(xí)到半監(jiān)督、無監(jiān)督學(xué)習(xí),橫跨了所有的計(jì)算機(jī)視覺領(lǐng)域。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

另一方面,我們團(tuán)隊(duì)也參與了很多產(chǎn)品、解決方案的研發(fā),擁有豐富的經(jīng)驗(yàn)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

這里跟大家分享一下我們在計(jì)算機(jī)視覺領(lǐng)域展現(xiàn)的成果。我們曾參加過多項(xiàng)國際比賽,并拿到冠軍,包括人臉方面的,如人臉識別。目標(biāo)檢測、圖像分類、圖像分割方面的獎(jiǎng)項(xiàng),也包括情感、目標(biāo)跟蹤,及智能交通方面,還有機(jī)器人、自動(dòng)駕駛方面的比賽。去年我們在IROS的操作機(jī)器人當(dāng)中拿到冠軍,還有NeurIPS里面的自動(dòng)駕駛也拿到了冠軍,這個(gè)自動(dòng)駕駛牽涉的技術(shù)面是非常廣的,有機(jī)器視覺,還有導(dǎo)航、控制。剛才大家提到了很多機(jī)器人跟別的學(xué)科的不同,就是因?yàn)樗粌H僅是看到了、理解了,還要做決策,做決策的過程實(shí)際上是一個(gè)交互的過程。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

人臉識別方面,我們參加了美國NIST人臉識別比賽,獲得了冠軍,包括1:1、1:N、N:M的應(yīng)用。為什么我們重視這個(gè)比賽,是因?yàn)樗菬o約束人臉的比賽,無約束人臉就是人臉拍的時(shí)候沒辦法控制它的角度,有各種各樣的姿態(tài),有很多遮擋,還有光線不同,反光、光線不均勻,還有各種表情,以及有時(shí)候像素非常低,這個(gè)比賽也是動(dòng)態(tài)和靜態(tài)混合的比賽。在這個(gè)比賽當(dāng)中,我們應(yīng)用了遷移學(xué)習(xí),也應(yīng)用了異構(gòu)多模融合和雙模態(tài)的對抗性生成網(wǎng)絡(luò)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

還有一個(gè)比賽是微軟的百萬人臉大比賽,我們也是獲得了雙項(xiàng)競賽冠軍。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

在做人臉識別的過程中,我們也用了深層對抗網(wǎng)絡(luò)GAN,使得數(shù)據(jù)的不平衡性得到改善,從數(shù)據(jù)的結(jié)果可以看到,大家有用3D的方式來增加訓(xùn)練數(shù)據(jù),但相比之下,我們用GAN來做的,效果會(huì)更好。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

大家說人臉識別到目前已經(jīng)解決了很多的問題,已達(dá)到99.9%,但我們需要考慮是在什么條件下,在限制條件下拍攝的人臉,比如說人證合一,這方面已經(jīng)做出了很好的成績,但是對于非限制條件下拍攝的人臉,甚至是在動(dòng)態(tài)監(jiān)控下拍攝的人臉,人臉非常模糊,連人都很難認(rèn)出來的情況下,到底怎么辦?是不是達(dá)到很好的水平?實(shí)際上,并沒有。

這樣一個(gè)挑戰(zhàn)性的人臉問題,我們不僅要從人臉識別的角度讓它提高,還要從源端做起,在各種各樣條件下做到捕捉到清晰的人臉。如果攝像機(jī)沒辦法自己達(dá)到這種效果,用普通的相機(jī),再加上圖像增強(qiáng)是不是可以幫忙。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

這就談到圖像增強(qiáng),右邊這個(gè)圖是經(jīng)常發(fā)生的事情,當(dāng)太陽光照過來的時(shí)候,有一部分非常暗,有一部分像素都飽和了,大部分人用的HDR的方法,就是寬動(dòng)態(tài)范圍攝像,這種方法在一定程度上可以解決問題,可以看到HDR的圖已經(jīng)比原始的要好很多,當(dāng)我們這個(gè)場景中出現(xiàn)了運(yùn)動(dòng)的人或車,或運(yùn)動(dòng)的一些東西的時(shí)候,你用這種方法產(chǎn)生的效果就是左下角這種圖,那個(gè)火車在動(dòng),它上面的字都看不清了,如果是一輛汽車,它的車牌就沒辦法識別了。我們用了智能化動(dòng)態(tài)信息補(bǔ)償?shù)姆椒?,生成右邊這種清晰的圖像。當(dāng)我們用在CCTV(閉路電視)的相機(jī)上,就可以看到左邊和右邊的區(qū)別。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

這個(gè)圖像增強(qiáng)包括了怎么去噪聲,前面的演講嘉賓也談到了,過去有很多很著名的方法,比如有一個(gè)很好的去噪聲方法BM3D,它去高斯噪聲非常有效。但泊松噪聲圖像下的去噪是非常難的,因?yàn)樗脑肼暦讲钍歉肼曄袼氐膹?qiáng)度相關(guān),所以過去的方法沒辦法得到很好的效果。最近我們用深度學(xué)習(xí)CNN和LSTM的方法拿到好的效果,通過主觀和客觀的比較,它在特別嚴(yán)重的噪聲條件下有很強(qiáng)的競爭力,可以看到最后這個(gè)是我們的結(jié)果。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

在AI圖像增強(qiáng)方面,我們的相機(jī)有去抖動(dòng)、去霧、去雨、去雪的效果,我在這里就不一一詳細(xì)介紹了。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

以商業(yè)價(jià)值為導(dǎo)向的算法開發(fā)

第二方面就是以商業(yè)價(jià)值為導(dǎo)向的算法開發(fā)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

澎思的立場——應(yīng)用驅(qū)動(dòng)的解決方案、商業(yè)驅(qū)動(dòng)的算法研究。當(dāng)我們知道了一個(gè)應(yīng)用的需求、客戶的需求的時(shí)候,我們會(huì)一起分析,這個(gè)需求需要怎樣的解決方案。作為算法來說,我們會(huì)分析什么樣的算法適合這個(gè)解決方案。我們的計(jì)算機(jī)視覺全棧技術(shù)都有,但并不是每個(gè)技術(shù)都適合作為解決方案的。商業(yè)上最有價(jià)值的方法就是用最有效的算法、最經(jīng)濟(jì)的軟硬件來滿足客戶的剛需。

你看到這個(gè)“算法池”的意思是有可選性。這個(gè)算法池不像過去那樣做出來是一成不變的,因?yàn)楝F(xiàn)在的深度學(xué)習(xí)日新月異。所以這就要求算法人員以及把算法放進(jìn)軟硬件的人員要非常敏感、快速反應(yīng)。我們的硬件是可編程的,可以把一個(gè)很大的算法濃縮在這個(gè)小盒子里面。同樣的盒子,如果覺得成本貴了,我們還可以用低成本的硬件,用比較輕便的算法交給客戶。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

剛才講到了,因?yàn)榕焖嫉臓I銷團(tuán)隊(duì)是在前線工作,了解To B、To G客戶的剛需,所以有一個(gè)團(tuán)隊(duì)可以把剛需反饋回來,我們的軟硬件算法人員一起討論方案,研究出來最經(jīng)濟(jì)、最靈活的軟硬件平臺,更重要的是我們的人要非??焖俜磻?yīng)。

現(xiàn)在的大環(huán)境跟過去不同,尤其是做解決方案的,即使是同樣的領(lǐng)域的客戶,但他的要求是不同的。另外,深度學(xué)習(xí)每天有新的東西出現(xiàn),去年和今年比,今年的模型就可以比去年快20倍,所以這就要求我們的軟硬件團(tuán)隊(duì)要設(shè)計(jì)靈活,以適應(yīng)快速的更新。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

這是我們最近的人臉動(dòng)態(tài)識別,給到客戶那邊,他們做了很多的比較,他們認(rèn)為我們比友商的性能提高了很多。我們最新的人臉?biāo)惴ǎㄝp量級、標(biāo)準(zhǔn)級的,已經(jīng)交付于我們的軟硬件團(tuán)隊(duì),融入軟件平臺、硬件設(shè)備里。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

另外一個(gè)技術(shù)我們做的是跨攝像機(jī)空間的ReID技術(shù),也叫做行人再識別。當(dāng)攝像機(jī)看不到人臉的時(shí)候,我們能看到人的身體,所以會(huì)用人身體的特征來進(jìn)行再識別。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

在上周我們的再識別在Market1501、DukeMTMC、CUHK03等三個(gè)數(shù)據(jù)庫上的比賽都拿到了第一。這個(gè)競爭蠻激烈的,因?yàn)楹芏嗟墓径荚谒⑦@個(gè)榜。ReID支持以圖搜圖,一個(gè)相機(jī)看到一個(gè)可疑的人,拍下來了,就可以用這個(gè)圖去搜這個(gè)人跑到哪里了,臨近的相機(jī)調(diào)動(dòng)起來,馬上就可以找到這個(gè)人。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

另外一個(gè)以商業(yè)價(jià)值為導(dǎo)向的算法研發(fā)是行人屬性。行人屬性和ReID不一樣,它沒有圖可以搜,但它可以輸入特征,如“短頭發(fā),穿著白色上衣、藍(lán)色牛仔褲、白色運(yùn)動(dòng)鞋,背著書包的男子”,我們輸入這些特征,可以從視頻里面搜索出來,最近我們這方面也獲得了很好的成績。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

關(guān)于智能交通方面,我們有車輛、車牌的檢測和識別,不光是在白天,也在晚上達(dá)到了很好的精度。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

再談一下超分辨率。很多人做超分辨率可能是為了讓多媒體內(nèi)容或視頻的噪聲減少,看得更清晰,對于人臉識別,一定的噪聲、一定的清晰還是可以識別出來的。

但對于非常小的人臉,比如說已經(jīng)小于20×20了,在現(xiàn)在的人臉識別當(dāng)中就是放棄的,因?yàn)樘×?。但是我們用了高分辨率,我們可以做?2×12這么小的像素,也就是說一個(gè)相機(jī)拍得很遠(yuǎn)的一張人臉,我們用了高分辨率的網(wǎng)絡(luò),大家可以看到最右邊的就是輸入,中間就是我們高分辨率網(wǎng)絡(luò)的輸出,最右邊是理想的希望達(dá)到的水平,也就是真實(shí)的樣本。我們進(jìn)行了大量的實(shí)驗(yàn),把人臉識別率從75%提升到97%。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

還有3D重建,在這個(gè)當(dāng)中,我們的關(guān)鍵技術(shù)就是視覺SLAM。我們有做這個(gè)的基因,一旦有客戶對我們提出這方面的要求,就能很快把它做出來。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

現(xiàn)在談到視頻結(jié)構(gòu)化,剛才也有人談到這一點(diǎn),視頻也好,語音也好,要在上面進(jìn)行數(shù)據(jù)處理是不可能的,所以一定要視頻結(jié)構(gòu)化。但對我們來講,視頻結(jié)構(gòu)化的優(yōu)先順序是不一樣的,因?yàn)槲覀冇腥说目凇④嚨目?,所以對人和車是?yōu)先做的。

關(guān)于行人,可以看到人有基本的特征(性別、年齡、頭部是怎么樣的,有沒有戴眼鏡,他的上裝、下裝是什么樣的,他的攜帶物,以及行為),我們看到一個(gè)視頻,就會(huì)把它描述下來,生成這個(gè)視頻的Metadata,回頭搜尋的時(shí)候就可以做邏輯推理,應(yīng)用到不同的場景。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

對車輛也是如此?,F(xiàn)在學(xué)術(shù)上都是針對一個(gè)任務(wù)就有一個(gè)模型,多個(gè)任務(wù)就有多個(gè)模型,我們現(xiàn)在要設(shè)計(jì)一個(gè)單一的模型,輸出不同的任務(wù),最重要的是保證性能不下降,還要把這樣的東西放在一個(gè)小盒子里,而不是放在服務(wù)器上,所以這也是我們的挑戰(zhàn)。正是因?yàn)槲覀冏约涸O(shè)計(jì)算法和軟硬件,所以我們可以做的到。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

除了人、車以外,要做城市規(guī)劃,做其他方面應(yīng)用,對場景也非常重視。場景的視頻結(jié)構(gòu)化、時(shí)間、地點(diǎn),這些都是視頻的Metadata,有了它之后你就可以做各種邏輯推理,完成各種任務(wù)。澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

人工智能行業(yè)的發(fā)展前瞻

最后這個(gè)部分是跟大家一起探討人工智能行業(yè)的發(fā)展前瞻,也有很多人在擔(dān)心人工智能是不是已經(jīng)到頂峰了、是不是已經(jīng)開始停滯了。因?yàn)橛?jì)算機(jī)資源消耗很多的電能、數(shù)據(jù)難以獲取,會(huì)存在很多障礙。我們一起來探討一下,從2010年以來,計(jì)算機(jī)視覺取得了飛躍的發(fā)展,離不開三大要素。

這三大要素可能很多人都知道,也有人說是四大要素,因?yàn)橥顿Y的大量的涌入非常重要。

這三大要素,第一是數(shù)據(jù)-大數(shù)據(jù)-超大數(shù)據(jù)。

第二是計(jì)算資源,大家看到英偉達(dá)的GPU每半年都會(huì)更新?lián)Q代,速度越來越快,顯存越來越大,而且價(jià)錢越來越便宜。在昨天的AI芯片會(huì)場我們也看到了很多公司在做落地的AI芯片。

第三方面是人工智能開拓者、領(lǐng)頭人,以及在研發(fā)行業(yè)中耕耘的人員的努力。今年6月份的CVPR上,李飛飛團(tuán)隊(duì)的ImageNet的文章獲得PAMI獎(jiǎng),得到了非常好的肯定,沒有這樣的數(shù)據(jù)就沒有今天的AlexNet,VGG、GoogleNet、ResNet,我相信每個(gè)人都會(huì)同意這一點(diǎn),這樣超大的數(shù)據(jù)庫訓(xùn)練的模型,不但用在拍照的圖像上,也可以將它用到醫(yī)學(xué)圖像。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

今年大家也看到了開拓人工智能的三位先驅(qū)者都獲得了圖靈獎(jiǎng),肯定了他們對今天的人工智能的飛躍發(fā)展起到的作用。

要得到一個(gè)很好的視覺模型,不但是視覺的,甚至說語音也是可以的,但它的基本原則是什么呢?我們認(rèn)為:一要有足夠的數(shù)據(jù),這個(gè)數(shù)據(jù)要平衡。二要有很好的標(biāo)注,標(biāo)注中不要有很多噪聲。三是要用足夠深的網(wǎng)絡(luò),這樣就可以訓(xùn)練出一個(gè)魯棒性很好、泛化性很好的模型。

但問題是從哪兒來數(shù)據(jù)呢?這個(gè)數(shù)據(jù)的標(biāo)注牽涉到很多的人力、物力和時(shí)間,要用很深的網(wǎng)絡(luò),越深的網(wǎng)絡(luò)牽涉的計(jì)算機(jī)資源就越大。剛才我們看到曠視有一個(gè)很大的GPU資源來做訓(xùn)練,這都是問題。計(jì)算機(jī)資源這一塊我就不談了,大家也知道很多,也在不斷地改進(jìn)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

我就談?wù)剶?shù)據(jù)的限制。因?yàn)閿?shù)據(jù)的有限性,如果數(shù)據(jù)不夠,帶來的問題就是魯棒性、泛化性不好,在這個(gè)數(shù)據(jù)上訓(xùn)練的東西不可以輕易地用在另外的場景,或者用在上面的性能會(huì)大幅地下降。但是我們想一下,傅里葉變換這個(gè)無限的表達(dá)公式是完美的,但是當(dāng)它用在硬件的時(shí)候,我們的硬件是有限的,所以也需要有限的東西來表達(dá)無限的。比如說用8×8DCT來做圖像跟視頻的壓縮,也會(huì)發(fā)現(xiàn)它在很多場合下產(chǎn)生類似魯棒性的問題,所以這應(yīng)該不是一個(gè)問題。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

如何解決大量數(shù)據(jù)的生成和標(biāo)注,以及數(shù)據(jù)的長尾問題呢?除了我們每個(gè)人都知道的數(shù)據(jù)采集、人工標(biāo)注,當(dāng)然現(xiàn)在又出現(xiàn)了很多很好的標(biāo)注工具輔助我們。最近我們也看到了很多人用GAN來生成數(shù)據(jù),如做ReID、人群估計(jì),有很多的場景可以用GAN來生成。

有人也用虛擬模擬軟件Simulator,我們知道做自動(dòng)駕駛的,沒辦法去采集一些數(shù)據(jù)。比如要采集下雨的數(shù)據(jù),要等到雨天開車出去;要采集下雪的數(shù)據(jù),要等到冬天下雪的時(shí)候出去;要采集危險(xiǎn)的數(shù)據(jù),怎么去采集呢?用虛擬的模擬軟件Simulator,采集不同場合下、不同情形下的數(shù)據(jù)。但是有人會(huì)問,采集下來的數(shù)據(jù)與現(xiàn)實(shí)的差別很遠(yuǎn),有人也會(huì)用GAN來把虛擬的數(shù)據(jù)轉(zhuǎn)成更接近現(xiàn)實(shí)的數(shù)據(jù)。也有人用環(huán)境互動(dòng)的方式、強(qiáng)化學(xué)習(xí)的方式生成數(shù)據(jù),有的會(huì)用多種模型、多種模態(tài)來半自動(dòng)地生產(chǎn)數(shù)據(jù)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

隨著大量數(shù)據(jù)的生成,半監(jiān)督、無監(jiān)督學(xué)習(xí)的方法有所突破,我相信計(jì)算機(jī)視覺的未來發(fā)展是非常樂觀的。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

人工智能行業(yè)的發(fā)展,我個(gè)人認(rèn)為還沒到巔峰,我相信大部分在座的人也會(huì)同意這個(gè)觀點(diǎn),尤其是還有很多的落地機(jī)會(huì),我們的學(xué)術(shù)總是走在前面的,落地還有很長的時(shí)間。

作為工業(yè)界的我們,就要考慮實(shí)際情況,怎么樣來做遷移學(xué)習(xí),怎么樣剪枝優(yōu)化壓縮。還有更重要的就是在現(xiàn)有環(huán)境中去思考、去開拓新的AI應(yīng)用,多去想一想、嘗試一下AI能為我們做什么。剛才也有很多人談到了這個(gè)時(shí)代。我覺得IoT時(shí)代,從互聯(lián)網(wǎng)時(shí)代開始,給我們帶來了很多游戲規(guī)則的變化,比如一個(gè)公司不擁有酒店,但它可以做酒店的生意,那是什么公司呢?Airbnb。你沒有車,可以做車輛有關(guān)的業(yè)務(wù),那就是Uber、滴滴,在新加坡是Grab,你沒有商店,可以賣東西,早上我聽了阿里的介紹,我也是很有感觸。IoT的時(shí)代造就了那么多的公司,游戲規(guī)則的變化?,F(xiàn)在是人工智能的時(shí)代,再加上IoT,還會(huì)讓更多這樣的公司出現(xiàn)。

所以大家都帶著這種思考,嘗試一下AI能為我們做什么。還有就是你們可以在自己的環(huán)境當(dāng)中搜集、建立數(shù)據(jù)集,因?yàn)楹芏嗟默F(xiàn)象,過去有人嘗試用公式把它表達(dá)出來,但是很多現(xiàn)象是沒有辦法用公式表達(dá)的。但是你有數(shù)據(jù)集,可以收集數(shù)據(jù),標(biāo)注、訓(xùn)練模型,從而發(fā)現(xiàn)它們內(nèi)在的關(guān)系,然后可以制定決策,這ye包括經(jīng)濟(jì)的決策、金融的決策,DNA方面的研發(fā),這些都可以去探討,從你挖掘數(shù)據(jù)中探討它們的內(nèi)在關(guān)系。

另一方面可以建立強(qiáng)化學(xué)習(xí)、遞增學(xué)習(xí)的商業(yè)環(huán)境去訓(xùn)練挖掘。

在人工智能方面還有很多的空間可以做,比如我們說到監(jiān)控相機(jī)對物體的檢測或識別是要理解看到了什么,,但是研究機(jī)器人就不僅僅要知道看到了什么,它還要采取行動(dòng)。所以不僅僅是理解,還有決策,反饋再?zèng)Q策。所以這個(gè)強(qiáng)化學(xué)習(xí)是很重要的。DeepMind很成功,你看到他們很多的人工智能的開發(fā)都在游戲方面,真正把它用在機(jī)器人的實(shí)際操作方面,你會(huì)發(fā)現(xiàn)還有很多的問題,這里面有很多的空白大家可以做。你在機(jī)器人的大會(huì)上,看到那些疊衣服的機(jī)器人,你看了以后覺得不錯(cuò),但是那個(gè)速度超慢,你不會(huì)覺得它能代替人。因?yàn)樯虡I(yè)價(jià)值不在那里,這就是人工智能的空缺,我們還有很多東西可以去做。最后一點(diǎn)就是我們要打造靈活的軟硬件、AI平臺,讓它的落地做得更好。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

最后講一下澎思新加坡研究院,它在澎思科技主要承擔(dān)兩方面的任務(wù),第一是做垂直領(lǐng)域技術(shù)的開發(fā),最重要強(qiáng)調(diào)快速,能夠有工業(yè)級研發(fā)的交付能力,結(jié)合公司的發(fā)展方向做創(chuàng)新。第二是要做前沿科技的探索和儲備。我們在新加坡這個(gè)窗口,直接接軌全世界,我們又帶著全球的視角來探索前沿科技,并且我們要非常敏感,要很快在我們這邊研發(fā)一些突破性的技術(shù),讓我們公司在新的領(lǐng)域、新的業(yè)務(wù)當(dāng)中有一些大展手腳的機(jī)會(huì)。

澎思科技申省梅:后深度學(xué)習(xí)時(shí)代的智能視覺技術(shù)落地 | CCF-GAIR 2019

今天我就分享到這里,謝謝大家。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

“關(guān)注'AI+安防',(微信號:ainia8811)”
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說