0
本文作者: camel | 2019-11-02 21:58 | 專題:CNCC 2019 |
雷鋒網(wǎng) AI 科技評(píng)論按:由 CCF 主辦的 CNCC 2019 學(xué)術(shù)會(huì)議于10.17—10.19 日在蘇州成功舉辦。本屆大會(huì)以“智能+引領(lǐng)社會(huì)發(fā)展”為主題,進(jìn)行了15場(chǎng)特邀報(bào)告,3場(chǎng)大會(huì)主題論壇、78場(chǎng)技術(shù)論壇、22場(chǎng)特色活動(dòng),1000家機(jī)構(gòu)代表、8000余人參展參會(huì)。
在大會(huì)第三天舉辦的“計(jì)算機(jī)視覺(jué)技術(shù)賦能智慧城市”分論壇中商湯科技副總裁勞世竑發(fā)表了主題為《中日計(jì)算機(jī)視覺(jué)技術(shù):從人臉識(shí)別到自動(dòng)駕駛的產(chǎn)業(yè)化歷程》的演講。
勞世竑:湯科技副總裁,車載事業(yè)總經(jīng)理兼日本公司CEO,他在人臉識(shí)別技術(shù)產(chǎn)業(yè)應(yīng)用上有著突出貢獻(xiàn),在國(guó)際會(huì)議和期刊上共發(fā)表論文90多篇,并擁有多項(xiàng)國(guó)際專利。
以下為勞世竑演講的全文,雷鋒網(wǎng)AI科技評(píng)論進(jìn)行了不改變?cè)獾木庉?,?nèi)容未經(jīng)本人確認(rèn)。
本次報(bào)告重點(diǎn)講兩個(gè)階段。第一個(gè)階段講我們是怎么樣把美國(guó)的技術(shù)拿來(lái)用上,第二個(gè)階段講我們中國(guó)的技術(shù)是怎么超越美國(guó)的技術(shù),日本和中國(guó)的合作,亦或是中國(guó)和日本的合作,次序不一樣,含義完全不同。
首先我要講一個(gè)例子,我們當(dāng)時(shí)把CMU的人臉檢測(cè)的技術(shù)做了一個(gè)產(chǎn)業(yè)應(yīng)用。我們有一個(gè)客戶,他的公司在世界范圍內(nèi)沒(méi)有那么有名,但是在日本也是一個(gè)非常著名的公司。這個(gè)公司只做一件產(chǎn)品,主要就是給柯達(dá)做洗照片的機(jī)器。這個(gè)機(jī)器當(dāng)時(shí)是完成由沖膠卷到印刷一系列的工作,完全可以用一臺(tái)機(jī)器進(jìn)行全部流程的自動(dòng)化操作,這臺(tái)機(jī)器需要具備一個(gè)功能,就是在印刷照片的時(shí)候能盡可能把照片印得好一點(diǎn),當(dāng)照片是在背光拍攝的情況下,能夠調(diào)整照片的曝光時(shí)間,然后把照片印得更漂亮。
當(dāng)時(shí)他們找到了我們,說(shuō)能不能幫忙做這個(gè)工作。正好我們當(dāng)時(shí)剛剛拿到了神經(jīng)網(wǎng)絡(luò)的識(shí)別器,然后我們把這個(gè)識(shí)別器進(jìn)行改進(jìn),大概加速了10倍到50倍這樣的速度,將這個(gè)功能提交給了這個(gè)公司,成為了一個(gè)產(chǎn)品。
后來(lái)我們就發(fā)現(xiàn)原始速度還是趕不上當(dāng)前應(yīng)用的需求,我們?cè)谙朐趺崔k?分析我們?cè)谏弦粋€(gè)事例中成功的原因,我后來(lái)思考了一下,上一次成功的原因并不是說(shuō)在我們的公司里面有很多的能人,恰恰是因?yàn)槲覀兊墓纠锩鏇](méi)有能人,沒(méi)有博士,所以我們只能到全世界各地去找,能夠幫助我們解決問(wèn)題的合作對(duì)象。在這個(gè)過(guò)程中,我們就找到了清華的艾海舟老師,他在我們行業(yè)里面做出了非常大的貢獻(xiàn)。我和他開(kāi)始了多年的合作,這是我們?cè)?003年,當(dāng)時(shí)主要的一個(gè)成員是艾海舟老師的一個(gè)四年級(jí)學(xué)生黃暢,他和我們一塊把芯片開(kāi)發(fā)出來(lái)了。
注:
艾海舟老師:清華大學(xué)計(jì)算機(jī)系教授,主要從事與人臉人體相關(guān)的計(jì)算機(jī)視覺(jué)方面的研究,在人臉及人體圖像理解領(lǐng)域提出了一系列性能優(yōu)越的算法,具有重要的學(xué)術(shù)價(jià)值和明顯的應(yīng)用價(jià)值。發(fā)表論文80余篇,授權(quán)國(guó)際專利1項(xiàng),國(guó)際專利申請(qǐng)4項(xiàng)。
黃暢:地平線機(jī)器人技術(shù)聯(lián)合創(chuàng)始人以及算法副總裁,深度學(xué)習(xí)專家、前百度主任架構(gòu)師(T10),長(zhǎng)期從事計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、模式識(shí)別和信息檢索方面的研究。創(chuàng)立地平線機(jī)器人,致力于提供高性能、低功耗、低成本、完整開(kāi)放的嵌入式人工智能解決方案。
當(dāng)時(shí)大概是35萬(wàn)注冊(cè)了一個(gè)芯片,這個(gè)芯片后來(lái)被日本的各個(gè)照相機(jī)廠商采用,直到現(xiàn)在為止,依然是世界上占用率最大的一個(gè)人臉檢測(cè)的芯片。這個(gè)芯片可以幫助照相機(jī)在對(duì)焦的時(shí)候,實(shí)現(xiàn)準(zhǔn)確的把焦點(diǎn)聚焦到人上,而不是到后面的背景上。
在我們完成了人臉檢測(cè)的芯片以后,我們把一些精力放在人臉識(shí)別上面,當(dāng)時(shí)應(yīng)該是世界上第一款商用的手機(jī),上面使用了人臉識(shí)別的功能,用戶可以通過(guò)人臉識(shí)別技術(shù)直接解鎖手機(jī)。后來(lái)因?yàn)檫@種手機(jī)也在市場(chǎng)上消失了,所以從商業(yè)角度來(lái)講這是一個(gè)失敗的案例?,F(xiàn)在來(lái)講人臉識(shí)別已經(jīng)變得非常普及了,蘋(píng)果的手機(jī)、安卓的手機(jī)上都有這樣的功能,在當(dāng)時(shí)在一個(gè)非常小的手機(jī)上面想要把人臉識(shí)別的功能做上去,遇到了非常多的困難,“怎么來(lái)減少使用量,怎么樣加快速度”,在這個(gè)方面耗費(fèi)了很多的精力。
具體我想講一下,在這些技術(shù)的實(shí)際應(yīng)用中我們究竟做了哪些工作。我們?cè)谧鋈四樧R(shí)別、人臉檢測(cè)的時(shí)候,我們需要驗(yàn)證角度的變化和識(shí)別性能的變化有什么關(guān)系,我們就設(shè)計(jì)了一個(gè)人臉數(shù)據(jù)采集的裝置,這個(gè)裝置由80臺(tái)攝像頭,這些攝像頭能夠采集同期人臉的圖像。依次的采集,就可以得到各種各樣角度的人臉圖像,通過(guò)這樣一個(gè)裝置,我們就可以搜集到很多不同角度的人臉圖像。雖然看上去是很基礎(chǔ)的工作,但是給我們帶來(lái)了后面能把性能做到極致的效果。在日本工程師是非常善于做很小的改進(jìn),然后把一個(gè)工作做到極致,,這一點(diǎn)就很值得我們學(xué)習(xí)。
在之后,我們做了一些其它的應(yīng)用,當(dāng)時(shí)也是一直在想,雖然人臉檢測(cè)能夠用在攝像頭上面,能夠做在數(shù)碼相機(jī)的上面,但是人臉識(shí)別對(duì)我們來(lái)講依然是很大的挑戰(zhàn)。因?yàn)樵谌毡疽矝](méi)有監(jiān)控的市場(chǎng),當(dāng)時(shí)我們想要在手機(jī)設(shè)置人臉識(shí)系統(tǒng)沒(méi)有成功。當(dāng)然這有可能也與當(dāng)時(shí)的時(shí)代和環(huán)境有關(guān)系,當(dāng)時(shí)如果能夠做成的話,那么到現(xiàn)在人臉檢測(cè)技術(shù)可能會(huì)發(fā)展的更不一樣。
我們后來(lái)回頭去想人臉的技術(shù)究竟還能用在哪些地方,當(dāng)時(shí)我們想到能夠給汽車行業(yè)提供這樣的一個(gè)技術(shù),它能夠監(jiān)控駕駛員的狀態(tài),使得駕駛的行為能夠更安全。這個(gè)理念也是非常先進(jìn)的,如果能夠做成我想這應(yīng)該是世界第一個(gè)駕駛監(jiān)控體系。在當(dāng)時(shí)還沒(méi)有DMS這個(gè)概念,我們就自己開(kāi)發(fā)出了芯片,把芯片裝到一個(gè)盒子里面,這個(gè)盒子還能做很多的工作,可以解決怎么能把圖像拍得更好的問(wèn)題。
其實(shí)現(xiàn)在國(guó)內(nèi)有很多人在做DMS的工作,在做的時(shí)候你會(huì)發(fā)現(xiàn)大家所做的工作都差不多,都是先用一個(gè)紅外的照明,然后用一個(gè)攝像頭來(lái)拍。當(dāng)遇到戴眼鏡的拍攝者的時(shí)候,眼鏡片會(huì)呈現(xiàn)出一定的反射,而且在不同的照明情況下性能也會(huì)降低,這些問(wèn)題該怎么來(lái)解決?我們就在盒子里面做了非常多的改進(jìn),得到好圖像,把效果做的更好。
這個(gè)工作當(dāng)時(shí)在2007年已經(jīng)得到了車廠的單子,很不幸的是發(fā)生了經(jīng)濟(jì)危機(jī),汽車行業(yè)就把新的項(xiàng)目全部砍掉了,我們這個(gè)項(xiàng)目雖然成了一個(gè)失敗的項(xiàng)目。但是這個(gè)大概過(guò)了十年,沉睡了十年以后我們又重新啟動(dòng)了這個(gè)項(xiàng)目,盡管它的技術(shù)看上去已經(jīng)被其它的公司超越。
接下來(lái)我要講的是,我后來(lái)到了商湯,原來(lái)我在那里做的的工作,準(zhǔn)確的說(shuō)應(yīng)該是在日本的公司所作的工作主要是向中國(guó)、美國(guó)一些大學(xué)的研究機(jī)構(gòu)提一些合作的方案,然后把這些成果帶回去進(jìn)行產(chǎn)品化。離開(kāi)了之后,我的工作轉(zhuǎn)變成了把一個(gè)中國(guó)公司的技術(shù)拿到日本進(jìn)行產(chǎn)業(yè)化,這是一個(gè)中國(guó)跟日本,或者說(shuō)中國(guó)跟先進(jìn)國(guó)家之間的一個(gè)位置的轉(zhuǎn)換,我覺(jué)得還是一個(gè)非常有意義的工作。
在這里,我做的一個(gè)比較能夠引以自豪的工作,就是把商湯的人工智能技術(shù)配給本田,促成了自動(dòng)駕駛的研發(fā)合作項(xiàng)目,這個(gè)項(xiàng)目如果說(shuō)我們當(dāng)時(shí)和清華老師合作是第一次把中國(guó)的高科技介紹給日本的公司,這次我們是把中國(guó)的高科技的企業(yè)介紹給日本的企業(yè),促成了一個(gè)平等的合作關(guān)系,這個(gè)是在中國(guó)的科技發(fā)展歷程中,也是一個(gè)比較少有的例子。
后來(lái)我在商湯成立了商湯(日本)公司,主要的業(yè)務(wù)就是現(xiàn)在和本田一起做的自動(dòng)駕駛的研發(fā)工作,當(dāng)前的研究工作,與百度或其它的一些公司的自動(dòng)駕駛會(huì)有一些不太一樣,我們更
注重的用攝像頭來(lái)實(shí)現(xiàn)非常廉價(jià)的,能夠提供給一般的用戶乘用車上面使用的自動(dòng)駕駛的技術(shù)。
右圖是我們?cè)谌毡窘艘粋€(gè)自動(dòng)駕駛的學(xué)校,原來(lái)是一個(gè)駕校,教人的駕校,現(xiàn)在變成了一個(gè)教計(jì)算機(jī)學(xué)習(xí)的一個(gè)自動(dòng)駕駛的學(xué)校。
我們和本田主要是做基于視覺(jué)的自動(dòng)駕駛技術(shù),這里包含了車道線的監(jiān)測(cè),在各種各樣的環(huán)境問(wèn)題下監(jiān)測(cè)出車道線。我們會(huì)挑戰(zhàn)各種各樣的環(huán)境,下雨天、晴天、早上、晚上,也在很多極端情況下檢測(cè)自動(dòng)駕駛,做一些道路的區(qū)分的學(xué)習(xí)和汽車的監(jiān)測(cè),這些功能是一些基礎(chǔ)的功能,我們可能會(huì)花很多的精力,追求將技術(shù)的可靠性做到極致。
我經(jīng)常被問(wèn)到,你們的自動(dòng)駕駛什么時(shí)候能夠用?什么時(shí)候能夠推向市場(chǎng)?
我覺(jué)得這個(gè)道路還是有一點(diǎn)漫長(zhǎng)的,我們現(xiàn)在的目標(biāo)是在2025年前后能夠?qū)⒆詣?dòng)駕駛技術(shù)推向市場(chǎng)。我覺(jué)得還有一點(diǎn)值得我們引起注意,日本的車廠在研發(fā)新的產(chǎn)品的時(shí)候會(huì)更注重驗(yàn)證技術(shù)的可靠性,以保證不出事故,這個(gè)是比較重要的,是一個(gè)更高的優(yōu)先級(jí)的工作。
將來(lái)我們?cè)谏虦萍家彩沁@樣的,希望能夠用AI來(lái)促進(jìn)自動(dòng)駕駛的研發(fā),在這個(gè)過(guò)程里,不光是物體的識(shí)別,還需要做一些行為的預(yù)測(cè),還包括車內(nèi)外環(huán)境的理解。另一方面還有一個(gè)比較重要的,需要把你做出來(lái)的系統(tǒng),它的一些判斷的結(jié)果,不光是得到一個(gè)結(jié)果,而是要能夠知道這個(gè)結(jié)果為什么是這個(gè)結(jié)果,深度學(xué)習(xí)的可說(shuō)明性這方面我們覺(jué)得是一個(gè)非常重要的研究課題。
雷鋒網(wǎng)報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章