0
本文作者: camel | 2020-04-21 18:12 |
雷鋒網(wǎng) AI 科技評論按:曾被譽(yù)為人工智能的三駕馬車——算法、算力、數(shù)據(jù),到了需要反思的時(shí)刻。特別是深度學(xué)習(xí)在學(xué)術(shù)前沿的后續(xù)發(fā)展乏力,恐難支撐AI能力繼續(xù)升級。
步入新的十年后,如今 AI 可能已經(jīng)到了一個(gè)拐點(diǎn)時(shí)刻。
那么接下來,AI 技術(shù)將如何發(fā)展、應(yīng)用?隨著國內(nèi)疫情的結(jié)束,這逐漸成為領(lǐng)域內(nèi)眾多研究者和從業(yè)者亟需回答的一個(gè)關(guān)鍵問題。
4 月 9 日,中國科協(xié)學(xué)會學(xué)術(shù)部、中國科學(xué)報(bào)聯(lián)合騰訊科協(xié)、騰訊發(fā)展研究辦公室舉辦了一場非常及時(shí)的線上論壇活動,主題為“人工智能:科技與經(jīng)濟(jì)融合新引擎”。眾多學(xué)者專家紛紛回答了疫后人工智能科技與經(jīng)濟(jì)融合發(fā)展的諸多問題。
雷鋒網(wǎng) AI 科技評論本著對人工智能技術(shù)重點(diǎn)關(guān)注,選取中科院計(jì)算所研究員、中科視拓創(chuàng)始人山世光的報(bào)告內(nèi)容做以整理,分享給大家。
山世光研究員的報(bào)告分為兩大部分,先是從研究的角度,他認(rèn)為AI方法論將從「數(shù)據(jù)驅(qū)動」轉(zhuǎn)向「知識+數(shù)據(jù)聯(lián)合驅(qū)動」;在后一部分,他從行業(yè)發(fā)展的層面提出了五大觀點(diǎn)和建議。這些內(nèi)容具有深刻的洞見性。
在過去十年里,人工智能的研究從過去依靠規(guī)則、知識來設(shè)計(jì)人工智能算法這樣一套方法論,逐漸過渡到了以數(shù)據(jù)為主要驅(qū)動力的方法論。
在這個(gè)方法論的指導(dǎo)下,靠著“三駕馬車”——算法、大數(shù)據(jù)、強(qiáng)算力,支撐起了現(xiàn)在的AI能力。算法上主要以深度學(xué)習(xí)為主,數(shù)據(jù)則強(qiáng)調(diào)要足夠大(且是有監(jiān)督的標(biāo)注數(shù)據(jù)),由于深度學(xué)習(xí)動輒需要通過訓(xùn)練設(shè)定上億的參數(shù)也導(dǎo)致了非常依賴強(qiáng)大算力的支撐。
于是,只要滿足下面兩個(gè)條件的AI任務(wù),都能夠得到好的解決:
1)專用AI任務(wù)(而非通用AI)。例如醫(yī)療影像中,看肺炎的AI就只能看肺炎,不能看肝炎;看CT的AI就只能看CT,不能看核磁。
2)“好”數(shù)據(jù)肥沃(通過商業(yè)模式大量獲取數(shù)據(jù))。所謂好數(shù)據(jù),一方面要有較大的規(guī)模,另一方面則是要有好的標(biāo)注。
但這樣的AI,離我們所期望的相距甚遠(yuǎn)。
微軟亞洲研究院院長洪小文博士曾提出如下的AI能力金字塔(黃色字體是山世光增加內(nèi)容):
按照這種金字塔層次,目前的AI技術(shù)仍還停留在第二層的「感知和簡單推理」上面,也即相當(dāng)于非人類靈長類動物的層次。
如何更進(jìn)一步,向上做到認(rèn)知、情感、創(chuàng)造,甚至智慧呢?
山世光認(rèn)為我們至少需要做以下幾種能力的提升——
然而,現(xiàn)有的AI方法論并不足以支撐AI能力繼續(xù)升級。
首先,算法、算力、數(shù)據(jù)這三架馬車已略顯疲軟。算力提升和大數(shù)據(jù)收集都需要投入資源,但算法卻大多是一個(gè)模型對一個(gè)任務(wù),現(xiàn)在是問題很多,方法卻有限。
其次,深度學(xué)習(xí)在工業(yè)界還在靠大數(shù)據(jù)和大算力進(jìn)行應(yīng)用研究,由于沒有強(qiáng)大的理論支撐,有些算力和數(shù)據(jù)會浪費(fèi)在試錯(cuò)上,這一點(diǎn)現(xiàn)在已經(jīng)變得越來越明顯。
而另一方面,在學(xué)術(shù)前沿上,深度學(xué)習(xí)顯示出的潛力有限。為什么呢?因?yàn)樗旧頍o法克服高度數(shù)據(jù)依賴問題,無法像人一樣基于“弱”、“小”數(shù)據(jù)進(jìn)行精確而且魯棒的學(xué)習(xí)!現(xiàn)有研究還都寄希望于基于深度學(xué)習(xí)來解決數(shù)據(jù)依賴的問題,希望能夠賦予機(jī)器學(xué)習(xí)從弱監(jiān)督、小數(shù)據(jù)來學(xué)習(xí)的能力,但從原理上來說,如果沒有別的數(shù)據(jù)或知識做支撐,這幾乎是不可能的。我們必須找到全新的方法。
AI 能力的升級,必須依賴AI 方法論的升級,而這歸結(jié)到本質(zhì),還是算法的革新。
山世光研究員提出如下幾種亟需發(fā)展的AI算法——
舉例來說,算法能否在數(shù)據(jù)量減小到原來10%甚至1%,同時(shí)還保持和原來相當(dāng)?shù)哪芰δ??在現(xiàn)有的算法(純數(shù)據(jù)驅(qū)動)中,是否可以加入知識,或者已有的其他數(shù)據(jù)或模型,做到知識和數(shù)據(jù)聯(lián)合驅(qū)動?……事實(shí)上,已經(jīng)有許多研究單位在做,也是當(dāng)下AI算法上最值得探索的幾個(gè)研究方向之一。
針對以上內(nèi)容,山世光從「數(shù)據(jù)依賴」的角度做了詳細(xì)說明。前面提到,當(dāng)前人工智能的方法是強(qiáng)大 (強(qiáng)監(jiān)督、大規(guī)模) 數(shù)據(jù)依賴。但我們知道人類智能并不是如此,簡單舉幾例人類的能力:
歸納和演繹推理:從個(gè)別到一般,再從一般到個(gè)別;
舉一反三&觸類旁通:類似推演&遷移學(xué)習(xí);
吃一塹長一智:從少量錯(cuò)誤中學(xué)習(xí)(修改模型);
預(yù)測檢驗(yàn):時(shí)刻預(yù)測并修正誤差;自糾錯(cuò)學(xué)習(xí);
元方法:道生一,一生二,二生三,三生萬物;
融會貫通:多模態(tài)、多學(xué)科知識校驗(yàn)和融合;
想象力和創(chuàng)造力:無中生有,外插而非內(nèi)插。
從這些能力中,我們可以看出,人類的智能本質(zhì)上是一種知識+弱小(弱監(jiān)督、小樣本)數(shù)據(jù)驅(qū)動的方法。這種特性值得我們參考。
山世光研究員認(rèn)為,人類能夠做到小數(shù)據(jù)的學(xué)習(xí),原因在于有知識的積累。因此如何把知識融合到機(jī)器當(dāng)中,對于AI算法非常重要。這里的知識既可能是人類總結(jié)出的知識,也可以是已有AI學(xué)到的知識,他把后面這種知識稱之為“機(jī)器知識”。
所謂“機(jī)器知識”,不同于“人類知識”,很可能不是人類可閱讀的,甚至不是人類可理解的。如山世光研究員所說,當(dāng)我們已經(jīng)用算法解決了N個(gè)任務(wù)(例如識別人臉、猴臉、馬臉、狗臉、牛臉等)后,機(jī)器就有可能從這些任務(wù)中總結(jié)出一些通用任務(wù)的規(guī)則,作為“元”模型。
有了“機(jī)器知識”,即使是小數(shù)據(jù)/無數(shù)據(jù)的任務(wù),也能夠獲得好的性能。例如可以借助上述從人 / 猴、馬、狗、牛等學(xué)習(xí)到的臉部識別模型,得出一個(gè)關(guān)于臉的“元”模型,用來識別考拉臉、魚臉、熊貓臉等。
(現(xiàn)在的方法則往往是,識別一個(gè)動物,就要收集大量這個(gè)動物的臉部照片,換種動物就得重新收集和學(xué)習(xí),既不高效,也不優(yōu)雅,甚至笨拙的有點(diǎn)可笑。)
事實(shí)上,這種研究本質(zhì)上是多任務(wù)協(xié)同的問題,在2018年已經(jīng)有人在做,CVPR 2018的最佳論文正是其中的代表,這個(gè)工作研究了26個(gè)不同任務(wù)之間的關(guān)系,以及如何可以互相支撐,從而減少對標(biāo)注數(shù)據(jù)的需求。
基于以上的分析,山世光研究員認(rèn)為,AI的方法論,在過去十年逐漸變?yōu)橐詮?qiáng)、大數(shù)據(jù)驅(qū)動為主,但接下來的十年或更長時(shí)間里,知識和數(shù)據(jù)聯(lián)合驅(qū)動將成為主流。當(dāng)然這里的知識,并不僅僅指人類可以理解的知識,也可能是許多人類無法理解的“機(jī)器知識”。
在報(bào)告的后半部分,山世光研究員針對目前我國的人工智能發(fā)展,提出了五大觀點(diǎn)和建議,如下:
中美(歐)之間在應(yīng)用研究上差距不大,但我們在各行業(yè)縱深應(yīng)用(即在其他研究領(lǐng)域)上仍需努力。例如,AI在生物信息領(lǐng)域的應(yīng)用,西方的積淀很多,深度學(xué)習(xí)也滲透了很多,而我國在這方面就需要努力趕超。
中美(歐)差距在縮小,但中國加速度不夠。過去十年最具代表性的方法主要還是來自歐美大學(xué)或企業(yè),平起平坐恐怕至少還需要5-10年或更久。我們存在的問題在于,對基礎(chǔ)研究長期性的認(rèn)知不足,缺乏起碼的耐心!重大基礎(chǔ)研究項(xiàng)目評估周期過短,甚至要求技術(shù)路線清晰,2年出成果。但基礎(chǔ)研究往往是“無心插柳柳成蔭,有心栽花花不開”。以深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)為例,它是1980年代的產(chǎn)物,過了近20年才開始發(fā)揮出威力。
這包括三個(gè)方面,分別是硬件、軟件和智件。
國內(nèi)在基礎(chǔ)硬件平臺上的投入很大,但存在重復(fù)建設(shè),尚未形成合力,不能充分發(fā)揮效力;另外由于深度學(xué)習(xí)的理論基礎(chǔ)較為薄弱,無效試錯(cuò)導(dǎo)致算力浪費(fèi)的現(xiàn)象也存在。
而另一方面,在基礎(chǔ)軟件平臺上中國投入需要提升(相較北美至少落后4-8年),深度學(xué)習(xí)的主流底層框架(TensorFlow,Pytorch,MxNet)主要還是由北美國家建設(shè),10年后,這方面可能會恰如今日之“芯片產(chǎn)業(yè)”,成為我們的“隱患”;最近中國有不少企業(yè)單位(百度,華為,曠視,清華,鵬城實(shí)驗(yàn)室...)相繼發(fā)布或擬發(fā)布開源框架,希望能形成合力。山世光建議,針對低門檻的AI研發(fā)平臺和工具,我們需要盡快搶占先機(jī)。
此外,山世光建議,我們在基礎(chǔ)智件體系投入上要加大(包括基礎(chǔ)算法研究),建議加強(qiáng)基礎(chǔ)智件體系研究:從過去已有的計(jì)算中心和數(shù)據(jù)中心開始,如何建設(shè)算法中心,知識中心等,建議盡快建設(shè)國家級的“知識中心”,包括人類知識中心(通用知識+領(lǐng)域知識)和機(jī)器知識(成熟AI算法和模型)中心,做到已實(shí)現(xiàn)的AI算法可以像水、電、煤一樣取用,從而避免大量重復(fù)勞動。
盡管最近大家都說AI人才缺口很大,但實(shí)際上AI相關(guān)專業(yè)的研究生數(shù)量仍然不足,這種不足現(xiàn)在主要靠其他非AI專業(yè)的學(xué)生主動或被動AI化來緩解,這不是長久之計(jì)。國家如果真的認(rèn)為人工智能是一個(gè)戰(zhàn)略方向,應(yīng)該在AI人才的培養(yǎng)上多一些傾斜,例如分配更多的研究生名額給AI專業(yè)。
近些年,我們會注意到一個(gè)現(xiàn)象,就是企業(yè)大學(xué)化,大學(xué)和機(jī)構(gòu)企業(yè)化。典型的表現(xiàn)就是,企業(yè)在發(fā)文章,而大學(xué)科研機(jī)構(gòu)則在做短期的技術(shù)。背后的原因很多,包括對Long-term基礎(chǔ)研究究竟如何評估值得探討,帽子文化也催生了很多快餐式科研成果等。最近國家也不斷的提出要破“四唯”,但更建議不要采取“一刀切”的科研評價(jià)模式,應(yīng)該根據(jù)不同的領(lǐng)域、不同的人才類型采取不同的評價(jià)方式。此外,對企業(yè)科技創(chuàng)新的支持導(dǎo)向性也值得商榷,企業(yè)該做什么樣子的創(chuàng)新,大學(xué)和科研機(jī)構(gòu)應(yīng)該做什么樣的創(chuàng)新,可能要有一個(gè)更加正確的分類。
雷鋒網(wǎng)報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。