0
2019 年 12 月 20 日,由鵬城實驗室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟主辦的為期兩天的「新一代人工智能院士高峰論壇」在深圳開幕,本次論壇以「云腦匯智,鵬城先行」為主題,聚焦 AI 最前沿技術(shù)動態(tài),將重點關(guān)注人工智能在開源開放平臺、高端芯片、類腦研究、智能應用的動態(tài)。
延續(xù)去年強大的院士陣容,今年邀請了多達 10 位院士,匯聚一堂,現(xiàn)場點評、深度剖析人工智能領(lǐng)域的發(fā)展現(xiàn)狀和未來值得探索的方向。與此同時,來自學術(shù)界、企業(yè)界的國內(nèi)人工智能領(lǐng)域頂尖專家也分享了關(guān)于人工智能技術(shù)領(lǐng)域的行業(yè)變革與技術(shù)創(chuàng)新的見解,一起探尋 AI 的邊界。
關(guān)于首日上午的精彩報告,大家可回看《「新一代人工智能院士高峰論壇」開幕,五大院士鎮(zhèn)場、另有湯曉鷗、王海峰精彩報告》。
下午精彩繼續(xù)。
騰訊 AI Lab & Robotics X 主任,ACM、IEEE Fellow 張正友博士作為下午場的首位報告嘉賓,帶來了主題為《機器人的智能演進》的報告。
騰訊 AI Lab & Robotics X 主任,ACM、IEEE Fellow 張正友
正式進入報告前,他回憶起去年同樣是高文院士邀請他人工智能院士高峰論壇做報告,而今年高文院士再度邀請他時,還強調(diào)了一句話「一定要做最新的研究報告」。他笑著打趣:「我估計他是想來考考我,想看看我這一年多來到底有沒有取得一些研究進展?!?/p>
「人工智能目前還是初春,還不是非常智能,存在很多問題?!乖捖湎拢阋詳z像機無法識別遮擋鏡頭的假圖像為例指出目前人工智能還只是從大量標注數(shù)據(jù)學習,泛化能力較差。
他認為,隨著傳感器技術(shù)發(fā)展與充分應用,人與智能化機器人共存的時代必然會來臨,這也是他選擇回國加入騰訊創(chuàng)建 Robotics X 機器人實驗室的重要原因。
張正友博士接著介紹了機器人的 6 個組成部分,包括本體、感知、執(zhí)行器、動力系統(tǒng)、交互系統(tǒng)、決策。機器人的未來趨勢是自動化、智能化,要在不確定的環(huán)境中自主決策。針對機器人的自主決策,他提出了 SLAP 范式,即傳感器和執(zhí)行器要緊密結(jié)合,在學習和計劃模塊的幫助下提升能力、做出決策。
針對智能機器人技術(shù)未來的突破點,他再度提及去年分享過的「A2G 理論」,其中 ABC 是代表了機器人的基礎(chǔ)能力,A 是指機器人能看、說、聽以及理解,B 是機器人本體,C 是自動控制;而 DEF 是指更高一層的機器人能力,D 是進化學習,E 是情感理解,F(xiàn) 是靈活操控;最后一層——G 則是表示守護人類。這對更先進、更智慧的機器人提出了要求,而機器人的最終目標是要服務于人。
最后,張正友表達了對機器人發(fā)展的愿景,那就是人機共存、共創(chuàng)、共贏,為此,需要從「用機器人增強人的智力、關(guān)懷人的情感、發(fā)揮人類體能潛力、實現(xiàn)人機協(xié)作」四個方面來創(chuàng)建這種未來。
同樣是二次出席人工智能院士高峰論壇的報告嘉賓還有依圖科技首席技術(shù)官,IEEE、IAPR Fellow 顏水成博士。他在主題為《Transform AI into Affordable Intelligence》演講中,指出了讓人工智能變?yōu)椤窤ffordable Intelligence」所面臨的挑戰(zhàn),并從芯片和模型的角度分享了一些工作進展。
依圖科技首席技術(shù)官,IEEE、IAPR Fellow 顏水成
一開場,他提到,一個 AI 創(chuàng)業(yè)公司以及大廠 AI 實驗室的核心使命是實現(xiàn) AI 的真正落地,這就需要解決兩個方面的問題:
第一個是算法,一方面是要保證算法「可以用」,即精度足夠高,能夠真正解鎖一個場景;另一方則是算法要「足夠用」,因為現(xiàn)在很多場景僅憑單模態(tài)的算法已經(jīng)無法提供用戶滿意的解決方案。
第二是算力,一方面是要讓用戶「買得起」,比如用于支撐計算的 AI 芯片,它的并發(fā)性能要足夠高;另一方面是要讓用戶「用得起」,即這種算力要保證功耗足夠低,不然即便用戶買回家也可能因為數(shù)據(jù)中心的電費過高而無法使用。
隨著人工智能在越來越多的場景中得到使用,而隨著技術(shù)上已經(jīng)達到可以用的階段,現(xiàn)在除了對算力和算法的要求越來越高,也更多地從「Affordable」的角度去考量。
顏水成博士進一步指出,研究表明,訓練和測試人工智能模型所需要的算力,每三個半月就會翻一番,這個比摩爾定律已經(jīng)快了很多。正如今年剛開完的 NeurIPS 會議上,大家比較關(guān)注的一件事情就是:當 AI 應用得越來越多,其帶來的電力消費也越來越高,這會不會對環(huán)境產(chǎn)生影響呢?
所以要真正讓 AI 在一個場景落地,最關(guān)鍵的兩個引擎是:
第一個引擎是高效能的 AI 模型,這是算法的維度。要想獲得一個高效能的 AI 模型有兩種做法,一種是基于不同 Motivation 的模式,另一種是基于 NAS(神經(jīng)網(wǎng)絡架構(gòu)搜索)的模式。針對這一點,主要是希望能夠解決研究和應用中的「Affordable」問題。
第二個引擎是高效能的 AI 芯片,這是算力的維度。針對這一點,芯片廠商首先要遵循算法和芯片原則,確保芯片在足夠大的使用場景中達到很高的效能;其次要預測領(lǐng)域中最前沿的算法發(fā)展趨勢,確保接下來幾年時間這款芯片能「發(fā)揮所長」;最后要讓用戶的建設(shè)成本足夠低并用得起。
最后,他總結(jié)道,AI 在越來越多的場景得到應用,并且追求的精度和目標越來越高,這就對算法和算力提出了越來越高的要求。而這時,AI 的「Affordable」問題就會變得越來越重要。
并且,如果要把 AI 轉(zhuǎn)換成「Affordable Intelligence」的話,高性能的 AI 模型和高性能 AI 芯片則是推動這一轉(zhuǎn)換的雙引擎,只有這樣才能讓我們最終的用戶能夠「買得起」和「用得起」。
曠視首席科學家、何梁何利基金獎獲得者孫劍博士以《視覺計算的前沿進展》為題,重點從卷積神經(jīng)網(wǎng)絡和計算機視覺技術(shù)本身介紹了計算機視覺的研究歷程與進展。
曠視首席科學家、何梁何利基金獎獲得者孫劍
卷積神經(jīng)網(wǎng)絡開始得比較早,上世紀 80 年代日本就有教授提出這樣的概念,并得以發(fā)展。而后續(xù)針對卷積神經(jīng)網(wǎng)絡的研究工作,主要圍繞四個問題開展:
第一個是神經(jīng)網(wǎng)絡的卷積問題。現(xiàn)在大家用的比較多的是 3×3 或 5×5 的卷積,而卷積此前經(jīng)歷了 AlexNet 網(wǎng)絡、GoogleNet 網(wǎng)絡、Facebook 提出的 faster R-CNN、曠視科技提出的 ShuffleNet V1/V2 等等,當前最新的研究進展則是動態(tài)卷積/條件卷積。
第二個是神經(jīng)網(wǎng)絡的寬度問題。這是困惱神經(jīng)網(wǎng)絡多年的問題,當網(wǎng)絡的深度不夠大時,就很難實現(xiàn)網(wǎng)絡的訓練。神經(jīng)網(wǎng)絡最開始的深度是 8 層,過了兩年后增加到了 20 層,再之后微軟提出的深度殘差網(wǎng)絡將深度增加到了 152 層,其采用殘差網(wǎng)絡的思想能夠得到好的訓練結(jié)果。
第三個是神經(jīng)網(wǎng)絡的深度問題。當深度學習復雜度超過一個點時,模型越大,訓練和測試的錯誤率反而會同時下降,跟我們傳統(tǒng)機器學習的認知不同,這其實跟網(wǎng)絡的寬度有關(guān)。目前比較新的兩個方向:一個是從 Kernel 的角度著手,另一個是嘗試剪枝的方法,例如 MetaPruning。
第四個是神經(jīng)網(wǎng)絡的大小問題。一般來說,在訓練過程中神經(jīng)網(wǎng)絡的大小是不變的,然而研究發(fā)現(xiàn),當在訓練中讓神經(jīng)網(wǎng)絡的大小變化時,能夠?qū)崿F(xiàn)更好的網(wǎng)絡性能。
針對計算機視覺技術(shù)本身,孫劍博士則重點選擇了目標檢測這一方向,分享了目前研究中所存在的一些問題和進展:第一,當圖像中的物體隔得很近時,檢測技術(shù)就無法精確檢測到單個物體;第二,計算架構(gòu)的設(shè)計問題,對此,曠視提出了輕量級的兩階段目標檢測器——ThunderNet,設(shè)計了多尺度架構(gòu)的融合,在 ARM 設(shè)備上的運行速度非???。
最后,孫劍還指出了計算機視覺應用中的幾個最重要并且投入最多的關(guān)鍵問題:
第一,火災等特殊場景的數(shù)據(jù)非常難收集,并且很難通過數(shù)據(jù)增強的方式獲得;
第二,對于新的研究方法如自監(jiān)督方法的需求;
第三,遮擋問題,雖然現(xiàn)在對此也有一些工作進展,但是深度學習還無法完全解決這個問題;
第四,深度學習和計算機視覺技術(shù)還無法很好連續(xù)追蹤同時處于動態(tài)的多個物體;
第五,視覺控制問題,比如說現(xiàn)在還無法通過視覺反饋來連續(xù)控制機器人或機械臂;
第六,現(xiàn)實應用中要實現(xiàn)低成本、易部署以及安全面臨的挑戰(zhàn)還很大;
第七,現(xiàn)有方法還無法實現(xiàn)高精度的預測問題。
中科院計算所研究員,ACM、IEEE、IAPR Fellow 陳熙霖本次也作為報告嘉賓,帶來了主題為《邁向可理解的計算機視覺》的報告。他在報告中也從他的視角分享了計算機視覺領(lǐng)域存在的一些問題以及針對這些問題自己所做的一些探索工作,并對于計算機視覺的未來發(fā)展給出了自己的想法。
中科院計算所研究員,ACM、IEEE、IAPR Fellow 陳熙霖
他指出,計算機視覺從提出概念到現(xiàn)在已有差不多半個世紀,主要歷經(jīng)了馬爾計算視覺、主動和目的視覺、多視幾何與分層三維重建、基于學習的視覺這四個階段。該領(lǐng)域雖然取得的進展很明顯,然而也帶來了一些問題,就比如評測基準的出現(xiàn)。
「之前大家在研究上彼此之間沒有比較,即便發(fā)了論文,但是結(jié)果可能在原地踏步,于是后來有了評測基準,然而帶來的一個壞處就是,現(xiàn)在的研究者尤其是學生就只顧著去「刷榜」了,這其實并不是在做真正的研究。所以這是一個很大的問題?!?/p>
他認為,在做計算機視覺研究上,不僅要知道 What 和 Where,還需要知道 How、Why、When 等等。除了研究方法上的問題,當前計算機視覺研究還面臨著兩大嚴峻問題,一是研究處于一個「封閉的世界」,這既體現(xiàn)新數(shù)據(jù)無法得到及時更新,無法從其他領(lǐng)域借用知識,也無法真正理解物體之間的真正聯(lián)系;二是無法很好地處理開放世界的問題,比如說無法區(qū)分現(xiàn)實世界的語言和語義上的區(qū)別等。
針對這些問題,陳熙霖在可解釋性決策模式,概念空間、語義空間、可視空間之間的相似性,可遷移的對比學習以及利用上下文方面進行了一系列探索和工作。
最后他總結(jié)道,過去 50 多年時間里,計算機視覺在應用上實現(xiàn)了很多成功,那未來將如何呢?——未來計算機視覺研究會朝著可理解的方向發(fā)展,即技術(shù)背后的知識會扮演更加重要的作用。
國際歐亞科學院院士、深圳市人工智能與機器人研究院副院長、IEEE Fellow 李世鵬在題為《萬物互聯(lián),集智過人》的演講中,重點回顧了 IoT(智能物聯(lián)網(wǎng))到 AIoT(人工智能物聯(lián)網(wǎng))再到 IIoT(智物聯(lián)網(wǎng))的發(fā)展歷程。
國際歐亞科學院院士、深圳市人工智能與機器人研究院副院長、IEEE Fellow 李世鵬
他認為,拋開其他因素,現(xiàn)在的人工智能時代主要包括四個基本因素:AI、人、機器人和 IoT。其中,人是處于中心的因素,人跟智能的交互叫人機耦合或者是人機協(xié)作,人跟 IoT 結(jié)合在一起是物理的智能,人跟 AI 放在一起就是虛擬的場景。
而整個 IoT 的發(fā)展歷程可分為三個階段:
第一個階段是 IoT 最基本的階段。所有能連上網(wǎng)、能傳送數(shù)據(jù)的設(shè)備都叫 IoT 設(shè)備,主要是關(guān)注在設(shè)備之間的連接問題、數(shù)據(jù)的采集跟通訊的問題。人則主要通過指令命令或者遙控跟 IoT 設(shè)備進行交互。這個階段的智能程度很低,基本上只能做 IFDtt 這種類型的條件控制。
第二個階段叫做 AIoT,這個名詞并不是國際提出來的,是一個中國特色的概念。上一階段的 IoT 基本沒有智能,對數(shù)據(jù)的應用也很簡單或者只停留在表面,而這個階段則對 IoT 產(chǎn)生數(shù)據(jù)進行智能處理。一方面,用戶對 IoT 設(shè)備的交互變得越來越智能;另一方面,對采集的數(shù)據(jù)不僅僅停留在原始數(shù)據(jù)的解釋方面,而是把數(shù)據(jù)結(jié)合在一起,然后形成一些新的知識。在這個階段,AIoT 總有一個集中的控制器來控制所有的 IoT 設(shè)備,因為它需要這樣一個大腦來進行總體的控制。
第三個階段也就是 IIoT(智物聯(lián)網(wǎng))。在上個階段,獨立的智能物體本身有一定的智能,而且在很多時候可以獨立運作。而這個階段要探討怎樣把有智能和獨立的智能體之間的智能聯(lián)合起來以及聯(lián)合在一起又能形成什么智能呢?人和機器之間的關(guān)系成為了比較平等的合作關(guān)系。
李世鵬認為,IIoT 帶來的聚合智能的演變正在發(fā)生,這一趨勢可能會打破人工智能行業(yè)的一些現(xiàn)有障礙,并最后可能為未來基于因果關(guān)系的 AI 框架鋪平道路。
華為海思首席芯片規(guī)劃師、海思圖靈產(chǎn)品管理部部長夏勤以《云大為美——高性能計算芯片的現(xiàn)在和未來》為題,分享了關(guān)于高性能計算芯片的現(xiàn)在與未來的思考,并以華為的昇騰芯片和鯤鵬芯片為例,探討了高性能芯片設(shè)計方面的問題。
華為海思首席芯片規(guī)劃師、海思圖靈產(chǎn)品管理部部長夏勤
她表示,高性能計算芯片已成為芯片領(lǐng)域非常熱門的方向,這個領(lǐng)域也產(chǎn)生了很多新的理論和新的技術(shù),現(xiàn)在該領(lǐng)域的工程師無非在解一個三元方程,包括三個維度:性能、成本、易用性。如果從單一維度來看很容易解,但是如果要實現(xiàn)真正的量產(chǎn),則必須同時解決好以下三個問題:
第一,核設(shè)計問題,可以往提升主頻、多核以及微架構(gòu)(指令集)三個方向探索。比如在多核方向上,華為目前已經(jīng)推出了從 8 核到 16 核再到 64 核的芯片;在微架構(gòu)上,華為的鯤鵬 920 芯片對指令集做了一些像亂序、指令預取這樣的措施去提升性能,獲得了比較好的結(jié)果。
第二,片內(nèi)設(shè)計問題,對此,華為在芯片上做的優(yōu)化工作包括采用最新工藝減小芯片面積,提高良率,進而降低成本。
第三,外圍接口問題,在這個方面,華為在芯片的內(nèi)存通道接口,包括接口速率、多 IP 互聯(lián)、加速器上都做了非常多的創(chuàng)新。
除此之外,AI 芯片的設(shè)計在軟件方面也面臨著前所未有的挑戰(zhàn):首先,基于 AI 的計算要求更大的并行處理能力;其次,AI 芯片和 CPU 芯片非常大的差異點在于前者是真正意義上的異構(gòu)計算;最后在 AI 軟件棧的建設(shè)上也面臨很大挑戰(zhàn),例如華為鯤鵬軟件棧到昇騰軟件棧的開發(fā)過程,復雜度和難度就非常高。
她進一步總結(jié)了未來芯片設(shè)計的趨勢:
第一,未來單線程和單核性能會不斷提升,同時針對指令集會有更多的定義出現(xiàn),此外隨著 ARM 的蓬勃發(fā)展,也會為未來的用戶自定義提供了很大的空間,從而較大地改善芯片的整體性能;
第二,在記憶存儲上,雖然現(xiàn)在還沒有出現(xiàn)比較好的技術(shù),但在內(nèi)存接口以及整個內(nèi)存架構(gòu)的重新定義還有很多探索空間;
第三,新的標準和接口技術(shù)的突破,這個方面會有新的技術(shù)嘗試,但是成果會出來得慢一些;
第四,靈活的電源管理,未來隨著異構(gòu)計算的到來,低負載、低功耗的調(diào)優(yōu)技術(shù)會變得非常重要。
「AI 未來有很多可以發(fā)展的方向,并且不是單維度的發(fā)展方向,雖然現(xiàn)在我們還不知道真正的 AI 時代何時會到來,但是我認為算力、協(xié)同、應用是整個 AI 技術(shù)未來能夠走向全面商用的三個關(guān)鍵維度?!?/p>
第二場院士圓桌會在當日下午舉行,由中國工程院院士、同濟大學校長陳杰主持。
中國工程院院士、廣播電視技術(shù)專家丁文華,中國工程院院士、通信與信息系統(tǒng)專家王沙飛,中國科學院院士、激光與光電子技術(shù)專家王立軍,德國漢堡大學信息學科學系教授、德國漢堡科學院院士張建偉四位院士,結(jié)合當日主題演講內(nèi)容各抒對未來中國人工智能發(fā)展的展望與建議。
丁文華院士:此次大會內(nèi)容豐富,體現(xiàn)出中國人工智能在各領(lǐng)域都有了非常大的進展。今年的演講內(nèi)容涉及算法、應用、資源,大家都在各自研究方向上實現(xiàn)了突破。我相信通過鵬城實驗室這個平臺,能夠聚集全國乃至全球的人工智能領(lǐng)域的高端專家和人才共同交流和推進整個人工智能技術(shù)的發(fā)展。
王沙飛院士:我認為現(xiàn)在整個人工智能的發(fā)展還需要經(jīng)過一個漫長的階段,有這么幾個方面的挑戰(zhàn)和問題:
第一,現(xiàn)在人工智能的技術(shù)在落地應用場景時,在智能推理方面還存在很多問題,人工智能還很難像人一樣對未知的場景或者目標進行智能推理。
第二,可解釋性問題?,F(xiàn)在 AI 可以計算海量大數(shù)據(jù)并且能夠?qū)崿F(xiàn)一定的感知,但是得出的結(jié)果是否正確呢?或許未來我們可以通過加入人的經(jīng)驗來改善這個問題。
今天聽各位專家的報告很受啟發(fā),我認為通過各位同仁的努力,可以讓人工智能突破基礎(chǔ)研究上的難點并獲得更好的應用。
王立軍院士:我主要研究激光芯片,近幾年隨著人工智能、信息感知的發(fā)展,也向通訊和信息感知(光電集成芯片)開展研究。我研究激光芯片幾十年,有一些自己的體會。
國內(nèi)芯片這些年發(fā)展比較緩慢,并且還處于受限于人的階段,為什么會出現(xiàn)這樣的局面?有以下幾個原因:
第一,芯片在研制過程中需要的設(shè)備費非常巨大,一般單位承受不起;
第二,在時間上,做芯片需要踏踏實實幾年甚至是十幾年的功夫才能搞定的;
第三,我們最近幾年都追求盡快出成果,當然本意是好的,但是有些東西要尊重事實,像這種大投入、見效慢的,很多政府機關(guān)的官員在心里其實是不愿意投的;
第四,做芯片的研究者尤其是年輕人也更愿意去投入一些見效快,馬上能出成果、出文章的研究。
現(xiàn)在我們國家意識到這些問題,國家也組織了幾個部委聯(lián)合攻克芯片問題。我相信幾年后,我們國內(nèi)在芯片這一塊會有重大的突破。
另外針對信息感知,我個人認為下一步在光電、混合集成芯片方面是一個很重要的方向,它既把集成電路的技術(shù)和集成光學的技術(shù)進一步集成,還把感知的軟件和光學的東西集成到一起,進一步提高了可靠性,會對 AR 產(chǎn)業(yè)有很大的推動。
張建偉院士:首先熱烈祝賀鵬城實驗室在一年多內(nèi)取得這么大的成就,定義了未來幾個重要的方向之后,組織各方各業(yè)的研究者從交叉的角度來解決國際民生的重大問題,已經(jīng)成為了吸引產(chǎn)學研最高端人才聚集交流和頭腦碰撞的很重要的平臺。
今天聽了各位的報告后,我還想再強調(diào)幾點:
第一,打基礎(chǔ)。今天有專家談到了多模態(tài)的技術(shù),從腦科學多模態(tài)的處理、芯片多模態(tài)的處理、圖像識別、圖片理解等等,多模態(tài)信息處理成為人工智能一個核心技術(shù),也非常值得我們進一步開發(fā)和研究。我 5 年前組織的跨模態(tài)學習項目就是中、德之間最大的研究項目,從腦科學、心理學、人工智能、機器人等多方面來組織研究人的多模態(tài)學習機制,然后做新的算法,最后用機器人來實現(xiàn)。
第二,人工智能下一步如何落地。我認為除了提供人工智能基礎(chǔ)平臺之外,下一步要真正融入需求和垂直領(lǐng)域,深度融合,把加工鏈做深做長,做成世界級的知識產(chǎn)權(quán)和世界級的市場,使人工智能的價值更快產(chǎn)生。
第三,公共平臺交流、生態(tài)打造以及社會影響。現(xiàn)在地方政府也對開源和為企業(yè)提供平臺越來越重視,我認為在深圳這塊創(chuàng)業(yè)熱土上一定能作出新的世界級的人工智能 Demo 樣機。
雷鋒網(wǎng) AI 科技評論報道。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。