丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給camel
發(fā)送

0

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

本文作者: camel 2020-04-21 18:12
導語:在學術前沿,深度學習后續(xù)發(fā)展乏力,恐難支撐 AI 能力繼續(xù)升級。

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

雷鋒網 AI 科技評論按:曾被譽為人工智能的三駕馬車——算法、算力、數(shù)據,到了需要反思的時刻。特別是深度學習在學術前沿的后續(xù)發(fā)展乏力,恐難支撐AI能力繼續(xù)升級。

步入新的十年后,如今 AI 可能已經到了一個拐點時刻。

那么接下來,AI 技術將如何發(fā)展、應用?隨著國內疫情的結束,這逐漸成為領域內眾多研究者和從業(yè)者亟需回答的一個關鍵問題。

4 月 9 日,中國科協(xié)學會學術部、中國科學報聯(lián)合騰訊科協(xié)、騰訊發(fā)展研究辦公室舉辦了一場非常及時的線上論壇活動,主題為“人工智能:科技與經濟融合新引擎”。眾多學者專家紛紛回答了疫后人工智能科技與經濟融合發(fā)展的諸多問題。

雷鋒網 AI 科技評論本著對人工智能技術重點關注,選取中科院計算所研究員、中科視拓創(chuàng)始人山世光的報告內容做以整理,分享給大家。

山世光研究員的報告分為兩大部分,先是從研究的角度,他認為AI方法論將從「數(shù)據驅動」轉向「知識+數(shù)據聯(lián)合驅動」;在后一部分,他從行業(yè)發(fā)展的層面提出了五大觀點和建議。這些內容具有深刻的洞見性。


1、從學術前沿視角來看,深度學習已成強弩之末

在過去十年里,人工智能的研究從過去依靠規(guī)則、知識來設計人工智能算法這樣一套方法論,逐漸過渡到了以數(shù)據為主要驅動力的方法論。

在這個方法論的指導下,靠著“三駕馬車”——算法、大數(shù)據、強算力,支撐起了現(xiàn)在的AI能力。算法上主要以深度學習為主,數(shù)據則強調要足夠大(且是有監(jiān)督的標注數(shù)據),由于深度學習動輒需要通過訓練設定上億的參數(shù)也導致了非常依賴強大算力的支撐。

于是,只要滿足下面兩個條件的AI任務,都能夠得到好的解決:

1)專用AI任務(而非通用AI)。例如醫(yī)療影像中,看肺炎的AI就只能看肺炎,不能看肝炎;看CT的AI就只能看CT,不能看核磁。

2)“好”數(shù)據肥沃(通過商業(yè)模式大量獲取數(shù)據)。所謂好數(shù)據,一方面要有較大的規(guī)模,另一方面則是要有好的標注。

但這樣的AI,離我們所期望的相距甚遠。

微軟亞洲研究院院長洪小文博士曾提出如下的AI能力金字塔(黃色字體是山世光增加內容):

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

按照這種金字塔層次,目前的AI技術仍還停留在第二層的「感知和簡單推理」上面,也即相當于非人類靈長類動物的層次。

如何更進一步,向上做到認知、情感、創(chuàng)造,甚至智慧呢?

山世光認為我們至少需要做以下幾種能力的提升——

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

然而,現(xiàn)有的AI方法論并不足以支撐AI能力繼續(xù)升級。

首先,算法、算力、數(shù)據這三架馬車已略顯疲軟。算力提升和大數(shù)據收集都需要投入資源,但算法卻大多是一個模型對一個任務,現(xiàn)在是問題很多,方法卻有限。

其次,深度學習在工業(yè)界還在靠大數(shù)據和大算力進行應用研究,由于沒有強大的理論支撐,有些算力和數(shù)據會浪費在試錯上,這一點現(xiàn)在已經變得越來越明顯。

而另一方面,在學術前沿上,深度學習顯示出的潛力有限。為什么呢?因為它本身無法克服高度數(shù)據依賴問題,無法像人一樣基于“弱”、“小”數(shù)據進行精確而且魯棒的學習!現(xiàn)有研究還都寄希望于基于深度學習來解決數(shù)據依賴的問題,希望能夠賦予機器學習從弱監(jiān)督、小數(shù)據來學習的能力,但從原理上來說,如果沒有別的數(shù)據或知識做支撐,這幾乎是不可能的。我們必須找到全新的方法。


2、未來10年的AI方法論:知識+數(shù)據聯(lián)合驅動

AI 能力的升級,必須依賴AI 方法論的升級,而這歸結到本質,還是算法的革新。

山世光研究員提出如下幾種亟需發(fā)展的AI算法——

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展? 舉例來說,算法能否在數(shù)據量減小到原來10%甚至1%,同時還保持和原來相當?shù)哪芰δ??在現(xiàn)有的算法(純數(shù)據驅動)中,是否可以加入知識,或者已有的其他數(shù)據或模型,做到知識和數(shù)據聯(lián)合驅動?……事實上,已經有許多研究單位在做,也是當下AI算法上最值得探索的幾個研究方向之一。

針對以上內容,山世光從「數(shù)據依賴」的角度做了詳細說明。前面提到,當前人工智能的方法是強大 (強監(jiān)督、大規(guī)模) 數(shù)據依賴。但我們知道人類智能并不是如此,簡單舉幾例人類的能力:

  • 歸納和演繹推理:從個別到一般,再從一般到個別;

  •  舉一反三&觸類旁通:類似推演&遷移學習;

  • 吃一塹長一智:從少量錯誤中學習(修改模型);

  • 預測檢驗:時刻預測并修正誤差;自糾錯學習;

  • 元方法:道生一,一生二,二生三,三生萬物;

  • 融會貫通:多模態(tài)、多學科知識校驗和融合;

  • 想象力和創(chuàng)造力:無中生有,外插而非內插。

從這些能力中,我們可以看出,人類的智能本質上是一種知識+弱小(弱監(jiān)督、小樣本)數(shù)據驅動的方法。這種特性值得我們參考。

山世光研究員認為,人類能夠做到小數(shù)據的學習,原因在于有知識的積累。因此如何把知識融合到機器當中,對于AI算法非常重要。這里的知識既可能是人類總結出的知識,也可以是已有AI學到的知識,他把后面這種知識稱之為“機器知識”。

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

所謂“機器知識”,不同于“人類知識”,很可能不是人類可閱讀的,甚至不是人類可理解的。如山世光研究員所說,當我們已經用算法解決了N個任務(例如識別人臉、猴臉、馬臉、狗臉、牛臉等)后,機器就有可能從這些任務中總結出一些通用任務的規(guī)則,作為“元”模型。

有了“機器知識”,即使是小數(shù)據/無數(shù)據的任務,也能夠獲得好的性能。例如可以借助上述從人 / 猴、馬、狗、牛等學習到的臉部識別模型,得出一個關于臉的“元”模型,用來識別考拉臉、魚臉、熊貓臉等。

(現(xiàn)在的方法則往往是,識別一個動物,就要收集大量這個動物的臉部照片,換種動物就得重新收集和學習,既不高效,也不優(yōu)雅,甚至笨拙的有點可笑。)

事實上,這種研究本質上是多任務協(xié)同的問題,在2018年已經有人在做,CVPR 2018的最佳論文正是其中的代表,這個工作研究了26個不同任務之間的關系,以及如何可以互相支撐,從而減少對標注數(shù)據的需求。

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

基于以上的分析,山世光研究員認為,AI的方法論,在過去十年逐漸變?yōu)橐詮?、大?shù)據驅動為主,但接下來的十年或更長時間里,知識和數(shù)據聯(lián)合驅動將成為主流。當然這里的知識,并不僅僅指人類可以理解的知識,也可能是許多人類無法理解的“機器知識”。

3、五大觀點&建議

在報告的后半部分,山世光研究員針對目前我國的人工智能發(fā)展,提出了五大觀點和建議,如下:

1)AI應用研究方面差距不大

中美(歐)之間在應用研究上差距不大,但我們在各行業(yè)縱深應用(即在其他研究領域)上仍需努力。例如,AI在生物信息領域的應用,西方的積淀很多,深度學習也滲透了很多,而我國在這方面就需要努力趕超。

2)AI基礎研究方面差距不容小覷

中美(歐)差距在縮小,但中國加速度不夠。過去十年最具代表性的方法主要還是來自歐美大學或企業(yè),平起平坐恐怕至少還需要5-10年或更久。我們存在的問題在于,對基礎研究長期性的認知不足,缺乏起碼的耐心!重大基礎研究項目評估周期過短,甚至要求技術路線清晰,2年出成果。但基礎研究往往是“無心插柳柳成蔭,有心栽花花不開”。以深度卷積神經網絡(DCNN)為例,它是1980年代的產物,過了近20年才開始發(fā)揮出威力。

3)AI基礎設施方面差距不小

這包括三個方面,分別是硬件、軟件和智件。

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

國內在基礎硬件平臺上的投入很大,但存在重復建設,尚未形成合力,不能充分發(fā)揮效力;另外由于深度學習的理論基礎較為薄弱,無效試錯導致算力浪費的現(xiàn)象也存在。

而另一方面,在基礎軟件平臺上中國投入需要提升(相較北美至少落后4-8年),深度學習的主流底層框架(TensorFlow,Pytorch,MxNet)主要還是由北美國家建設,10年后,這方面可能會恰如今日之“芯片產業(yè)”,成為我們的“隱患”;最近中國有不少企業(yè)單位(百度,華為,曠視,清華,鵬城實驗室...)相繼發(fā)布或擬發(fā)布開源框架,希望能形成合力。山世光建議,針對低門檻的AI研發(fā)平臺和工具,我們需要盡快搶占先機。

此外,山世光建議,我們在基礎智件體系投入上要加大(包括基礎算法研究),建議加強基礎智件體系研究:從過去已有的計算中心和數(shù)據中心開始,如何建設算法中心,知識中心等,建議盡快建設國家級的“知識中心”,包括人類知識中心(通用知識+領域知識)和機器知識(成熟AI算法和模型)中心,做到已實現(xiàn)的AI算法可以像水、電、煤一樣取用,從而避免大量重復勞動。

4)AI人才培養(yǎng)的傾斜力度還不夠

盡管最近大家都說AI人才缺口很大,但實際上AI相關專業(yè)的研究生數(shù)量仍然不足,這種不足現(xiàn)在主要靠其他非AI專業(yè)的學生主動或被動AI化來緩解,這不是長久之計。國家如果真的認為人工智能是一個戰(zhàn)略方向,應該在AI人才的培養(yǎng)上多一些傾斜,例如分配更多的研究生名額給AI專業(yè)。

5)產學研各自定位仍需優(yōu)化

近些年,我們會注意到一個現(xiàn)象,就是企業(yè)大學化,大學和機構企業(yè)化。典型的表現(xiàn)就是,企業(yè)在發(fā)文章,而大學科研機構則在做短期的技術。背后的原因很多,包括對Long-term基礎研究究竟如何評估值得探討,帽子文化也催生了很多快餐式科研成果等。最近國家也不斷的提出要破“四唯”,但更建議不要采取“一刀切”的科研評價模式,應該根據不同的領域、不同的人才類型采取不同的評價方式。此外,對企業(yè)科技創(chuàng)新的支持導向性也值得商榷,企業(yè)該做什么樣子的創(chuàng)新,大學和科研機構應該做什么樣的創(chuàng)新,可能要有一個更加正確的分類。

雷鋒網報道。

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

計算所山世光:AI方法論需升級,疫后 AI 將如何發(fā)展?

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說