0
本文作者: 栗峰 | 2019-10-11 11:21 | 專題:CNCC 2019 |
雷鋒網(wǎng)AI科技評論編者按:中國計算機大會CNCC 2019(10.17-19)即將在蘇州開幕。本次會議據(jù)估計將有8000+人次參會,會議包括十六位國內(nèi)外計算機領(lǐng)域知名專家、企業(yè)家的大會報告、三場大會主題論壇,七十余場前沿技術(shù)論壇,二十場特色活動,以及一百個科技成果展。
19日下午,為探索計算機視覺與智慧城市發(fā)展,申省梅等著名學(xué)者將共同從學(xué)術(shù)和產(chǎn)業(yè)角度探討計算機視覺的場景解譯、人臉識別、人體姿態(tài)、視覺內(nèi)容理解等前沿技術(shù),以及在智能安防、自動駕駛等智慧城市建設(shè)方面的研究成果、發(fā)展前景與技術(shù)應(yīng)用,值得期待!
作為AI領(lǐng)域最熱門的研究與應(yīng)用方向,目前計算機視覺技術(shù)在學(xué)術(shù)研究和產(chǎn)業(yè)落地方面都走在人工智能發(fā)展的最前沿。從前幾年的概念普及,到如今在智慧城市領(lǐng)域的落地,計算機視覺技術(shù)正在深刻改變著整個社會的信息資源使用觀念和方式。
一方面,隨著計算機視覺與模式識別理論、方法的研究進展,特別是以深度學(xué)習(xí)為代表的新一代人工智能理論在計算機視覺與模式識別研究中的巨大成功,學(xué)界不斷提出大量、各具特色、面向各種應(yīng)用的算法,極大地推動了相關(guān)技術(shù)的發(fā)展。另一方面,需求趨勢計算機視覺行業(yè)發(fā)展?jié)摿薮螅瑧?yīng)用場景拓展?jié)B透到各行業(yè),人們對生活安全以及生產(chǎn)效率追求兩大需求的提升,決定計算機視覺行業(yè)具有巨大發(fā)展空間。目前視覺智能技術(shù)已落地至金融、安防、零售、教育、醫(yī)療、自動駕駛等各個城市的場景和人們的生活當(dāng)中。
智慧城市寫入國家戰(zhàn)略,新型智慧城市建設(shè)進入快車道。計算機視覺技術(shù)可為智慧城市中的公共安全和城市治理、交通、社區(qū)、教育、健康醫(yī)療、工業(yè)互聯(lián)網(wǎng)等行業(yè)應(yīng)用和服務(wù)體系賦能,是整個智慧城市的感知體系。因此,如何讓計算機視覺技術(shù)的科研與智慧城市的建設(shè)有機結(jié)合,是一個需要學(xué)術(shù)界與產(chǎn)業(yè)界共同探討的話題。
為探討計算機視覺技術(shù)的研究成果和發(fā)展前景,加速前沿技術(shù)在智慧城市領(lǐng)域的落地,由中國計算機學(xué)會 (CCF)主辦、蘇州工業(yè)園區(qū)管委會承辦,于10月17-19日在蘇州金雞湖國際會議中心舉辦的2019中國計算機大會(CNCC 2019)特設(shè)了“計算機視覺技術(shù)賦能智慧城市”論壇,將圍繞當(dāng)前技術(shù)和行業(yè)最熱門的話題展開深入探討。
中國計算機大會創(chuàng)建于2003年,是中國計算領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、技術(shù)、產(chǎn)業(yè)交融互動的盛會,至今已成功舉辦了十五屆。
歷屆會議匯聚了圖靈獎獲得者,ACM、IEEE-CS、IPSJ、KIISE 等國際組織的專家和代表,以及國內(nèi)計算領(lǐng)域的權(quán)威專家、學(xué)者、知名企業(yè)技術(shù)專家,今年會議規(guī)模預(yù)計超過8000人。
今年,大會以「智能+引領(lǐng)社會發(fā)展(AI+ Leading the Development ofSociety)」為主題,結(jié)合現(xiàn)階段各領(lǐng)域發(fā)展的成就與挑戰(zhàn),將安排70余場前沿技術(shù)論壇,涉及人工智能、大數(shù)據(jù)、軟件工程、計算機教育、類腦計算、健康醫(yī)療大數(shù)據(jù)等前沿學(xué)術(shù)、技術(shù)、教育和產(chǎn)業(yè)話題,致力于推動我國計算機事業(yè)更好更快地發(fā)展。
CNCC2019 計算機視覺技術(shù)賦能智慧城技術(shù)論壇將圍繞計算機視覺技術(shù)的場景解譯、人臉識別、人體姿態(tài)、視覺內(nèi)容理解等前沿技術(shù)探討和在智能安防、自動駕駛等智慧城市建設(shè)方面的研究成果、發(fā)展前景與技術(shù)應(yīng)用展開,從學(xué)術(shù)與產(chǎn)業(yè)角度進行深入探討。
澎思科技首席科學(xué)家、新加坡研究院院長申省梅擔(dān)任論壇的主席,中科院計算技術(shù)研究所研究員、IEEE Fellow、IAPR Fellow、CCF會士陳熙霖擔(dān)任共同主席,與西安電子科技大學(xué)教授、博士生導(dǎo)師焦李成,西湖大學(xué)講席教授、IEEE Fellow李子青,阿里巴巴自動駕駛實驗室主任、首席科學(xué)家王剛,新加坡國立大學(xué)助理教授、新加坡國立大學(xué)機器學(xué)習(xí)與視覺實驗室負責(zé)人馮佳時,清華大學(xué)自動化系副教授魯繼文,商湯科技副總裁、智能駕駛業(yè)務(wù)總經(jīng)理、商湯日本總經(jīng)理勞世竑等共同探討計算機視覺技術(shù)的發(fā)展和應(yīng)用,精彩不容錯過(雷鋒網(wǎng))。
論壇主席
▼
申省梅
澎思科技首席科學(xué)家、新加坡研究院院長。西安電子科技大學(xué)電子工程系電子信息工程碩士。申省梅是人工智能和深度學(xué)習(xí)領(lǐng)域的帶頭人,前新加坡(松下)研究院副院長,領(lǐng)導(dǎo)超過40人的算法研究團隊,累計專利300余項。擁有計算機視覺的全棧技術(shù)能力,技術(shù)面橫跨多個應(yīng)用領(lǐng)域,在基于深度學(xué)習(xí)的人臉檢測和識別、行人檢測和跟蹤、行人再識別、車輛識別、自動駕駛、駕駛員行為檢測、移動操作機器人等領(lǐng)域均取得了世界頂級成果。2019年3月,宣布加入國內(nèi)人工智能公司澎思科技,任首席科學(xué)家、新加坡研究院院長,致力于監(jiān)控與安全、智慧城市、自動駕駛、智能機器人以及AI工廠自動化等領(lǐng)域的相關(guān)技術(shù)研究。
共同主席
▼
陳熙霖
中科院計算技術(shù)研究所研究員,IEEE Fellow, IAPR Fellow, CCF會士。近年來主要研究領(lǐng)域為計算機視覺、模式識別、多媒體技術(shù)以及多模式人機接口。目前是IEEE Trans. on Multimedia的Associate Editor、Journal of Visual Communication and Image Representation的Senior Associate Editor、計算機學(xué)報副主編、人工智能與模式識別副主編。先后獲得國家自然科學(xué)二等獎1項,國家科技進步二等獎4項,合作出版專著1本,在國內(nèi)外重要刊物和會議上發(fā)表論文300多篇。
講者和報告簡介
▼
01.
焦李成
基于深度學(xué)習(xí)的復(fù)雜場景解譯
▲ 焦李成
場景解譯是目前計算機視覺領(lǐng)域中較為重要的問題,在目前許多實際的圖像/影像處理應(yīng)用場景中,如無人駕駛、增強現(xiàn)實、戰(zhàn)場態(tài)勢感知等,都對場景解譯和目標識別的性能提出了較高的要求。傳統(tǒng)的基于“特征工程”的處理技術(shù)已難以滿足現(xiàn)有的需求。人腦信息處理的顯著注意、層次化感知和稀疏感知等機制,給復(fù)雜場景解譯和目標識別帶來了新的機遇。本報告圍繞深度學(xué)習(xí)技術(shù),分享團隊在場景解譯與目標識別方面的研究進展。
焦李成,西安電子科技大學(xué)教授、博士生導(dǎo)師。現(xiàn)任西安電子科技大學(xué)計算機科學(xué)與技術(shù)學(xué)部主任、智能感知與圖像理解教育部重點實驗室主任、智能感知與計算國際聯(lián)合研究中心主任、智能感知與計算國際合作聯(lián)合實驗室主任、“智能信息處理科學(xué)與技術(shù)”高等學(xué)校學(xué)科創(chuàng)新引智基地(“111計劃”)主任、教育部科技委學(xué)部委員、教育部人工智能科技創(chuàng)新專家組專家、中國人工智能學(xué)會副理事長、全國高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟副理事長、IET西安分會主席、IEEE西安分會獎勵委員會主席、IEEE計算智能協(xié)會西安分會主席、IEEE GRSS西安分會主席,IEEE TGRS副主編、教育部創(chuàng)新團隊首席專家,IEEE Fellow、IET Fellow、首批中國人工智能學(xué)會會士、CCF杰出會員,連續(xù)五年入選愛思唯爾高被引學(xué)者榜單。國務(wù)院學(xué)位委員會學(xué)科評議組成員,人社部博士后管委會評議組專家,曾任第八屆全國人大代表。1991年被批準為享受國務(wù)院政府津貼的專家,1996年首批入選國家“百千萬”人才工程(第一、二層次),陜西省首批“三五人才”第一層次。當(dāng)選為全國模范教師、陜西省突出貢獻專家和陜西省師德標兵。
02.
李子青
人臉識別的未決挑戰(zhàn)問題
▲ 李子青
報告摘要
深度學(xué)習(xí)技術(shù)將人臉識別性能提升了幾個數(shù)量級,使其獲得了廣泛應(yīng)用。但實際應(yīng)用中,人臉識別系統(tǒng)仍然遇到各種問題,使其性能顯著下降,達不到預(yù)期效果。本報告討論人臉識別尚未能很好解決的關(guān)鍵問題,分析原因,提出解決方向。
李子青,西湖大學(xué)講席教授,IEEE Fellow。曾任微軟亞洲研究院Research Lead,中科院自動化所模式識別國家重點實驗室資深研究員。發(fā)表論文400余篇,撰寫編寫著作9部,Google Scholar他引36000+次。曾任IEEE TPAMI等刊物副主編,擔(dān)任100余個國際學(xué)術(shù)會議大會主席、程序主席,或程序委員。作為人臉識別和智能視頻監(jiān)控專家,主持了多個國家科學(xué)研究項目和重大應(yīng)用工程項目,在相關(guān)領(lǐng)域獲準和申請專利20余項。在微軟研發(fā)的人臉識別系統(tǒng) EyeCU,比爾.蓋茨接受CNN采訪為之講解。負責(zé)多項國家項目和國際合作科研項目,研發(fā)的人臉識別系統(tǒng)和智能視頻監(jiān)控系統(tǒng),在多個國家重大安全項目中實施并發(fā)揮作用。李子青為SAC/TC100/SC2副主任委員;代表中國國家體撰寫了中國第一個ISO/SC37生物識別國際標準工作草案并獲采納,在年會全體會議上作了“Biometrics in China”(生物特征識別在中國)的主題演講。
03.
王剛
自動駕駛沒有免費的午餐
▲ 王剛
報告摘要
自動駕駛發(fā)展到今天,還面臨著很多困難。這個分享會討論如何將自動駕駛分解為簡單一點的問題,以及介紹阿里巴巴自動駕駛實驗室的平臺如何去高效地解決這些問題的。
王剛,阿里巴巴自動駕駛實驗室主任、首席科學(xué)家。在此之前,王剛為新加坡南洋理工大學(xué)終身教授。于2016和2017分別入選美國麻省理工大學(xué)技術(shù)評論雜志評選的亞洲區(qū)和全球的TR35獎。國家專家,人工智能頂尖期刊IEEE TPAMI的編委,頂尖會議如CVPR和ICCV等的領(lǐng)域主席。
04.
馮佳時
人體姿態(tài)估計技術(shù)進展及展望
▲ 馮佳時
報告摘要
人體姿態(tài)估計在很多領(lǐng)域都有著重要應(yīng)用,包括智能安防,自動駕駛,人機交互以及娛樂。本次報告將介紹基于深度學(xué)習(xí)的人體姿態(tài)估計的最新進展,包括單人、多人以及3D人體姿態(tài)估計。此外,本次報告將著重介紹面向解決實際應(yīng)用挑戰(zhàn)(例如復(fù)雜場景、計算資源有限)的最新人體姿態(tài)估計方法和模型,并將探討無監(jiān)督學(xué)習(xí)在大規(guī)模人體姿態(tài)估計上的應(yīng)用。
馮佳時,新加坡國立大學(xué)電子與計算機工程系助理教授,新加坡國立大學(xué)機器學(xué)習(xí)與視覺實驗室負責(zé)人。中國科學(xué)技術(shù)大學(xué)自動化系學(xué)士,新加坡國立大學(xué)電子與計算機工程系博士。2014-2015年在加州大學(xué)伯克利分校人工智能實驗室從事博士后研究。研究方向為圖像識別、深度學(xué)習(xí)及面向大數(shù)據(jù)的魯棒機器學(xué)習(xí)。曾獲 ICCV 2015 TASK-CV 最佳論文獎、2012年ACM多媒體會議最佳技術(shù)演示獎,擔(dān)任 ICMR 2017 技術(shù)委員會主席, JMLR 、 IEEE TPAMI 、 IJCAI 等國際知名期刊、會議審稿人,已在計算機視覺、機器學(xué)習(xí)領(lǐng)域發(fā)表論文60余篇。
05.
魯繼文
深度強化學(xué)習(xí)與視覺內(nèi)容理解
▲ 魯繼文
深度強化學(xué)習(xí)是人工智能領(lǐng)域的研究熱點,被認為是人類邁向通用人工智能的重要途徑之一。深度強化學(xué)習(xí)通過將深度學(xué)習(xí)的感知能力與強化學(xué)習(xí)的決策能力相結(jié)合,以端對端的方式實現(xiàn)從原始輸入到語義輸出的感知與決策,在許多視覺內(nèi)容理解任務(wù)中取得了重要突破。報告將分享清華大學(xué)自動化系智能視覺實驗室近年來提出的面向視覺內(nèi)容理解的多個深度強化學(xué)習(xí)方法,主要包括多智能體深度強化學(xué)習(xí)、圖深度強化學(xué)習(xí)、和結(jié)構(gòu)化深度強化學(xué)習(xí)等,以及它們在物體檢測與識別、目標跟蹤與檢索、行為預(yù)測與識別等多個視覺內(nèi)容理解任務(wù)中的應(yīng)用。
魯繼文,清華大學(xué)自動化系副教授、博士生導(dǎo)師,主要研究領(lǐng)域為計算機視覺、機器學(xué)習(xí)、智能機器人。發(fā)表IEEE匯刊論文70余篇, CVPR / ICCV / ECCV 論文50余篇,論文被引用8200余次。主持承擔(dān)國家自然科學(xué)基金聯(lián)合重點基金、國家重點研發(fā)計劃課題等科研項目10余項。擔(dān)任國際期刊 PR Letters 主編, T-IP 、 T-CSVT 、 T-BIOM 、 PR 和JVCI編委,國際會議 ICME 2020、AVSS 2020 和 DICTA 2019 程序委員會主席, CVPR 2020 、ICIP 2017 / 2018 / 2019 、 ICME 2015 / 2017 / 2018 / 2019 、 ICPR 2018 和 WACV 2016 / 2018 / 2020 領(lǐng)域主席。2015年入選中組部青年,2018年獲得國家優(yōu)秀青年基金項目。
06.
勞世竑
中日計算機視覺技術(shù):從人臉識別到自動駕駛的產(chǎn)業(yè)化歷程
▲ 勞世竑
計算機視覺技術(shù)的一大突破是人臉檢測的產(chǎn)業(yè)應(yīng)用。日本的照相機產(chǎn)業(yè)率先應(yīng)用了人臉檢測技術(shù),為日后人臉識別技術(shù)的發(fā)展除去了一道障礙。人臉識別技術(shù)的發(fā)展經(jīng)歷了半個世紀,直到深度學(xué)習(xí)的出現(xiàn)才實現(xiàn)產(chǎn)業(yè)應(yīng)用的突破。計算機視覺的另一大應(yīng)用領(lǐng)域是自動駕駛。深度學(xué)習(xí)的出現(xiàn)讓我們看到了用計算機視覺來實現(xiàn)自動駕駛的可能性。講者將分享20余年中日兩國的技術(shù)交流合作經(jīng)驗,人臉檢測及人臉識別的產(chǎn)業(yè)應(yīng)用及計算機視覺在自動駕駛領(lǐng)域的應(yīng)用。
勞世竑,商湯科技副總裁,智能駕駛業(yè)務(wù)總經(jīng)理,商湯日本總經(jīng)理。負責(zé)商湯科技的自動駕駛業(yè)務(wù)以及商湯科技在日本的業(yè)務(wù)。前日本歐姆龍公司的人臉技術(shù)負責(zé)人。在歐姆龍工作期間,他領(lǐng)導(dǎo)團隊和清華大學(xué)合作開發(fā)出了以“OKAO Vision”著稱的世界上第一塊商用人臉檢測芯片,被各大照相機及手機廠家采用;開發(fā)了嵌入式人臉識別技術(shù),被著名手機廠商采用成為世界上第一款有人臉驗證功能的智能手機;開發(fā)出了世界上第一款用性別年齡推斷技術(shù)向顧客自動推薦飲料的自動售貨機;最早用人臉識別技術(shù)實現(xiàn)美顏美白功能,并被主要打印機廠家采用;開發(fā)出了世界第一款駕駛員狀態(tài)識別芯片及系統(tǒng)(DMS)。2009年榮獲日本圖像處理領(lǐng)域中最權(quán)威的SSII”高木獎”。
07.
申省梅
視頻圖像智能化助力智慧安防建設(shè)
▲ 申省梅
預(yù)測到了2020年,世界會有超過10億個視頻監(jiān)控攝像機。如何存儲觀看大量的視頻流,快速理解海量的視頻內(nèi)容?當(dāng)年攝像機數(shù)字化之后,視頻圖像的壓縮(H.264, H.265)減少了傳輸量也壓縮了存儲空間;但隨著高清的出現(xiàn),清晰圖像的要求,攝像機數(shù)目的劇增,視頻流數(shù)據(jù)急劇擴大,帶來了全新的挑戰(zhàn)。人工智能是否有望進行視頻內(nèi)容上的壓縮,提供自動快速理解視頻內(nèi)容的手段,甚至可以做到事前預(yù)警,事中處置,事后分析?今天,以計算機視覺技術(shù)為主的視頻圖像智能化正在朝著這個方向發(fā)展。本報告將以澎思科技的解決方案為例,闡述視頻圖像智能化在智慧安防領(lǐng)域的應(yīng)用。
申省梅,澎思科技首席科學(xué)家、新加坡研究院院長。西安電子科技大學(xué)電子工程系電子信息工程碩士。申省梅是人工智能和深度學(xué)習(xí)領(lǐng)域的帶頭人,前新加坡(松下)研究院副院長,領(lǐng)導(dǎo)超過40人的算法研究團隊,累計專利300余項。擁有計算機視覺的全棧技術(shù)能力,技術(shù)面橫跨多個應(yīng)用領(lǐng)域,在基于深度學(xué)習(xí)的人臉檢測和識別、行人檢測和跟蹤、行人再識別、車輛識別、自動駕駛、駕駛員行為檢測、移動操作機器人等領(lǐng)域均取得了世界頂級成果。2019年3月,宣布加入國內(nèi)人工智能公司澎思科技,任首席科學(xué)家、新加坡研究院院長,致力于監(jiān)控與安全、智慧城市、自動駕駛、智能機器人以及AI工廠自動化等領(lǐng)域的相關(guān)技術(shù)研究。
圓桌Panel
后深度學(xué)習(xí)時代,計算機視覺技術(shù)的未來
主持人:陳熙霖
嘉賓:焦李成、李子青、王剛、馮佳時、魯繼文、勞世竑、申省梅
圓桌介紹
受邀嘉賓將就“后深度學(xué)習(xí)時代,計算機視覺技術(shù)的未來”這一主題,從人臉識別、視頻結(jié)構(gòu)化、視頻解析等技術(shù)和智能安防、自動駕駛等行業(yè)多角度切入,全方面探討學(xué)術(shù)研究成果、技術(shù)落地現(xiàn)狀、痛點與難點,并分享嘉賓對未來趨勢的觀點和見解(雷鋒網(wǎng))。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章