0
陳云霽,是一個80后,但卻是智能芯片研究的領(lǐng)軍人物。
在9月中旬,北京智源人工智能研究院曾舉辦“智能體系架構(gòu)與芯片”重大研究方向的發(fā)布會,發(fā)布會上宣布中科院計算所陳云霽研究員將擔(dān)任這個方面的首席科學(xué)家,帶領(lǐng) 9 位智源研究員(PI)與 6 位智源青年科學(xué)家共同探索面向未來的高效能、通用智能處理器。
在10 月 31 日北京智源人工智能研究院舉辦的首屆“智源大會”上,陳云霽再次就該重大研究方向接受雷鋒網(wǎng) AI 科技評論等媒體采訪。
陳云霽
陳云霽,中科院計算所智能處理器研究中心研究員,主任,博導(dǎo)。研究方向為機器學(xué)習(xí)處理器,在深度學(xué)習(xí)處理器領(lǐng)域獲得了突出成績。擁有30余項已授權(quán)的發(fā)明專利,發(fā)表或錄用學(xué)術(shù)論文100余篇,其中CCF A類頂級會議/期刊論文34篇(大部分為一作或通訊作者)。2016~2018的CCF A類會議ISCA平均有近1/4的論文引用他的論文從事深度學(xué)習(xí)處理器的研制。曾獲中國青年科技獎、國家萬人計劃“青年拔尖人才”、國家自然科學(xué)基金“優(yōu)秀青年基金”、中國計算機學(xué)會青年科學(xué)家獎、中國計算機學(xué)會科學(xué)技術(shù)一等獎(第一完成人)等榮譽。
陳云霽表示工業(yè)時代以發(fā)動機為時代發(fā)展的核心物質(zhì)載體,帶動社會進步;信息時代則是以CPU為核心物質(zhì)載體;我們即將進入一個智能的時代,那么我們必須去探索智能時代的核心物質(zhì)載體,即智能計算系統(tǒng)。
在他的帶領(lǐng)下,智源的9位研究員與6位青年科學(xué)家將去探索四個方向的研究,包括智能整機、編譯語言與編譯、智能芯片以及設(shè)計方法學(xué)。16位研究人員的研究規(guī)劃如下圖所示:
陳云霽是深度學(xué)習(xí)處理器的開拓者,但他表示深度學(xué)習(xí)處理器本身的科學(xué)問題已經(jīng)相對比較清晰,后面更多的是工程問題,而非科學(xué)問題;而他們所要做的是去發(fā)現(xiàn)更新的科學(xué)研究方向,解決新的科學(xué)問題。
此外談到類腦是否是馮諾依曼架構(gòu)這個問題時,陳云霽表示,我們應(yīng)當去閱讀馮諾依曼在1945年寫的那個報告原文,在原文中馮諾依曼曾花費十幾章來論證一個問題,即整個馮諾依曼機可以用神經(jīng)元來搭建。因此未來的類腦芯片是否是馮諾依曼架構(gòu),需要就事而論。
以下是陳云霽研究員的具體談話,AI 科技評論進行了不改變原意的編輯,內(nèi)容未經(jīng)本人確認——
(參與媒體:雷鋒網(wǎng) AI 科技評論、CSDN、財新網(wǎng)、智東西)
陳云霽:各位朋友好!我是中國科學(xué)院計算技術(shù)研究所的陳云霽。我們代表的方向是智源人工智能研究院成立的第三個重大研究方向——智能體系架構(gòu)與芯片。與其他幾個方向不太一樣的是,我們這個方向更多是偏向硬件和系統(tǒng),其他的方向相對來說更偏向算法、應(yīng)用層面。某種意義上來說,我們在智源研究體系里面是最底層、最基礎(chǔ)的。
事實上,智能計算系統(tǒng)對于整個人工智能發(fā)展來說都是非常關(guān)鍵的。我們可能都是唯物主義者,工業(yè)時代必須要有自己的核心物質(zhì)載體,就是發(fā)動機;信息時代需要有CPU作為核心物質(zhì)載體;智能時代也要有自己的核心物質(zhì)載體,我們認為智能計算系統(tǒng)就是智能時代的核心物質(zhì)載體。因此智源研究院設(shè)置這樣一個方向?qū)iT來做這塊研究,是非常有必要的。
我們這個方向大概有制定了四個層面的研究:
第一個是最上層的智能整機,相當于一個完整的智能計算機交付給大家;
第二層面是編程語言和編譯,我們怎么去寫智能程序,用什么樣的語言編寫這樣的智能程序,寫出來的智能程序又怎么編譯到智能芯片,讓智能芯片能理解;
第三個層面就是做各種各樣具體的智能芯片,我們大概布局了四種智能芯片的研究;
最底層是智能芯片的設(shè)計方法學(xué)的研究,說白了是研究怎么能夠快速用開源工具設(shè)計出新的智能芯片。
我們這個方向有10個PI,主要是來自于清華、北大、中科院;還有5位青年科學(xué)家,也是來自清華、北大和中科院??傮w情況就是這樣。
問:之前有記者采訪孫茂松教授,他提到現(xiàn)在“深度學(xué)習(xí)碰壁了,面臨一個困境”。您怎么看待這個觀點,以及這會對您在深度學(xué)習(xí)處理器的研究上有什么影響?
陳云霽: 孫老師講的是很有道理的,學(xué)術(shù)研究的角度上看,深度學(xué)習(xí)的邊界已經(jīng)相對比較清楚了,它能干什么,不能干什么,現(xiàn)在大家開始有一些感覺了。比如很多高級認知功能,推理、聯(lián)想、創(chuàng)造等,深度學(xué)習(xí)似乎都很難解決。當然不排除未來有變革,但目前深度學(xué)習(xí)方法都不能完全解決這些問題。
因此,智源研究院應(yīng)該去探索一些更新的東西,智源并不是一個企業(yè)的研究院或者說甚至并不像科技部。智源需要有更大的勇氣和決心去探索更前瞻的、對于我們整個人類來說都是未知的東西。在我們布局智能體系架構(gòu)與芯片的研究方向中,我們10個PI在4個層面上進行的研究,某種意義上來說沒有把深度學(xué)習(xí)處理器的研究當成主要的研究內(nèi)容。
在我看來深度學(xué)習(xí)處理器本身的科學(xué)問題相對已經(jīng)比較清晰了,后面更多的是工程上的問題。而我們智源要去做的事情,應(yīng)該是去發(fā)現(xiàn)新的科學(xué)問題、新的科學(xué)方向,解決新的科學(xué)問題。在這個層面上,我們希望探索的是未來十年,我們有沒有可能設(shè)計出新的類型的智能體系架構(gòu),不僅僅是能效比今天寒武紀或者其他的智能芯片高10倍、100倍,更重要的是它能解決更廣闊的人工智能應(yīng)用。它不僅僅是解決深度學(xué)習(xí)的任務(wù),還應(yīng)該解決更廣闊的其他機器學(xué)習(xí)方法,包括貝葉斯網(wǎng)絡(luò)、決策樹、深度學(xué)習(xí),甚至說它能夠更高效地去解決剛才我講的那些高級認知類的功能,推理、聯(lián)想、創(chuàng)造等。
只有把這樣的芯片做出來,我們才能說這個芯片是未來能夠在我們通往強人工智能道路上發(fā)揮關(guān)鍵作用的芯片。這也是我們這個方向里面10個PI一起討論凝練出來的目標,我們自己也覺得這樣的目標對于我們做基礎(chǔ)研究的人來說是比較激動人心的。
問:您提到布局了四種智能芯片的研究,能不能詳細解釋一下哪四種?
陳云霽:這里面有四個方面:
第一,類腦的智能芯片。大家都知道前段時間有一個非常有影響力的工作,清華大學(xué)施路平教授做的類腦芯片的工作,發(fā)表在Nature的封面上。這說明北京在這個方向,在國際上都是處于一個比較前列的地位。我們這里面四個方向中的第一個方向是類腦的智能芯片,希望我們的芯片能夠像接近我們大腦工作機理去運轉(zhuǎn)。
第二,機器學(xué)習(xí)處理器,我們過去對深度學(xué)習(xí)處理器(例如“寒武紀”芯片)有所了解,未來想做的機器學(xué)習(xí)處理器,不僅僅是深度學(xué)習(xí),還能夠進行貝葉斯、決策樹、線性回歸等更廣闊的機器學(xué)習(xí)方法,都能夠非常高效地處理。
第三,可重構(gòu)的智能芯片。我們想未來十年、二十年,智能算法還會快速發(fā)展,以后產(chǎn)生出來的智能算法可能是我們今天聞所未聞,甚至是想都沒有想到過的。如果我們未來的智能芯片不能支撐未來新的算法,業(yè)務(wù)面就會受限,我們想探索一種可重構(gòu)的智能芯片的方法。它可以根據(jù)我們的應(yīng)用需求,靈活地進行動態(tài)配置,去適配未來的算法。這樣的話,未來不管智能算法怎么演進,我們的芯片都能夠比較好地支撐。
第四,應(yīng)用驅(qū)動的芯片。我們在日常生活中得到的信息都是時序信息。我們從外界得到的信息,一般都是視頻序列和語音序列等。面向視頻序列和語音序列的應(yīng)用也非常多,我們想看看是否能夠發(fā)展一類專門去處理時間序列信息的芯片。這是一類以應(yīng)用為驅(qū)動的專門的芯片。
這四個方向要么是國際學(xué)術(shù)的前沿,要么就是未來很有潛力的學(xué)科增長點,要么是有非常實際的應(yīng)用需求。但有一個共同點,它們都是在學(xué)術(shù)上相對比較前瞻的。
當時張宏江博士(智源研究院理事長)和黃鐵軍教授(智源研究院院長)最開始在跟我們說設(shè)置這個方向的時候,給我們的建議就是,現(xiàn)在企業(yè)已經(jīng)能干的事情,已經(jīng)能往產(chǎn)品做的事情,我們智源就不要去做了;因為這些已經(jīng)有很多的投入,很多的人在做,我們要看更遠的東西。
問:您提到的可重構(gòu)智能計算架構(gòu)與機器學(xué)習(xí)處理器之間有什么區(qū)別?
陳云霽:我打一個不是很準確的比方。這兩者都是希望實現(xiàn)通用,都是希望實現(xiàn)靈活性。
機器學(xué)習(xí)處理器的思路是樂高積木這樣的思路,通過找到各種機器學(xué)習(xí)算法的最大公約數(shù),形成一個指令級,用指令的拼接組合(就像用很多樂高積木的即插件)就可以拼出一個機器學(xué)習(xí)的算法??赡苓@個算法我沒有見過,但是這個即插件只要設(shè)計的足夠好,就能夠拼出這個東西來??芍貥?gòu)的智能芯片類似橡皮泥這種模式,你根據(jù)自己的需求把這塊橡皮泥捏出你想要的形狀。
所以從某種角度上來說,機器學(xué)習(xí)處理器更像樂高積木,可重構(gòu)處理器更像橡皮泥。橡皮泥有很小的顆粒,樂高積木的顆粒相對比較大。最后達到的效果是類似的。
問:您剛才提到四種芯片,具體來說您比較看好哪個芯片?
陳云霽:這是很有意思的問題,這4個類型的芯片我覺得都挺有發(fā)展?jié)摿Φ摹6沂聦嵣?,我覺得未來智源如果不斷地發(fā)展,完全有可能再出現(xiàn)支持第五類、第六類?;A(chǔ)研究的模式可能跟純做大工程還不太一樣。大工程,比如做一個原子彈,最后就是一個原子彈。基礎(chǔ)研究要同時平行探索好幾條路徑,到底哪條路徑能成功,需要時間來檢驗,這個過程中路徑有可能分叉,也有可能有合并。
至于我看好哪一條,需要看長期還是短期。
長期來看,比如30年、40年或者50年,類腦這塊是有很大的潛力。今天它發(fā)展的并不成熟,但是我想肯定是我們這方面做科學(xué)研究的終極目標。
如果從比較實際的角度來看,能夠比較短期快速的從基礎(chǔ)研究變成應(yīng)用技術(shù)的,可能會是機器學(xué)習(xí)處理器。畢竟機器學(xué)習(xí)大家還是在廣闊地使用。
可重構(gòu)也非常有價值,包括時間序列的芯片,一定要我說哪一個最好,很難判斷。今天可能我們判斷這件事情為時太早,要有十年、二十年才能檢驗得出來。
問:您之前說芯片需要通用和靈活性兼具,包括您說的機器學(xué)習(xí)處理器,這些都是需要通用和靈活性兼具的。其實市場上有通用型的包括CPU、FPGA這種,您覺得未來更好的是哪個類型?
陳云霽:產(chǎn)業(yè)方面我不是特別好判斷。
從我們做基礎(chǔ)研究的角度來說,做研究有一個研究的品味,我們會比較希望去做一些相對更通用的東西。一方面它要能效很高,另外我們也希望它盡可能通用。
計算機領(lǐng)域最重要的兩個成果,一個是圖靈機,一個是馮·諾依曼機,這是整個計算機最重要的兩個成果。可能沒有之三了,就是這兩個。它們都有很明顯的特征,就是非常強調(diào)通用性。圖靈機的架構(gòu)本身就能夠適應(yīng)各種各樣的問題,用一個簡單的紙帶加上讀寫頭就可以解決各種各樣的問題。馮·諾依曼機更是如此。世界上第一臺計算機叫ENIAC,它很笨拙,解決完一個問題后,如果你想用它來解決另外一個問題,還需要吧各種各樣的硬件線路拆下來重新連接;馮·諾依曼就提出了馮·諾依曼機,其核心思想就是存儲程序,不用拆換線路,只要更換程序就可以達到同樣的效果。
對于我們做計算機人來說,重視通用性是一種基因。我們未來如果要發(fā)展智能處理器或者智能芯片,我們必然會強調(diào)通用性。
此外從做研究的角度來看,通用性越好的東西,受到的關(guān)注也就越多。
問:在我的理解中,您剛才提到馮諾依曼結(jié)構(gòu),其實類腦應(yīng)該是一種非馮結(jié)構(gòu),它未來能夠?qū)崿F(xiàn)這種通用性能嗎?
陳云霽:類腦是不是非馮諾依曼結(jié)構(gòu),還是存在爭議的。馮諾依曼結(jié)構(gòu)的核心思想在于存儲程序,在于我們換一個任務(wù)去做并不需要重新去把硬件給拆下來。類腦計算也希望存儲程序,也希望有比較強的靈活性。它到底會不會是馮諾依曼結(jié)構(gòu)呢?我覺得還要一事一議的看,并不是類腦的機器就一定不是馮諾依曼結(jié)構(gòu)。
如果我們仔細去看馮諾依曼報告,可能很多人沒有看過,我自己是有一天熬夜的時候很無聊,就把馮諾依曼1945年寫的那個報告下載下來看的。我一看就很震驚。那個報告十幾章,第一章、第二章是我們過去都知道的馮諾依曼機的介紹,一個馮諾依曼機應(yīng)該包括存儲器、控制器等東西。
后面十幾章講什么呢,他在論證整個馮諾依曼機可以用神經(jīng)元搭出來,還做了很多數(shù)據(jù)上的論證,控制器可以用神經(jīng)元搭出來,存儲機可以用神經(jīng)元搭出來,輸入輸出也可以用神經(jīng)元搭出來,然后最后的結(jié)論就是整個馮諾依曼其實都可以用神經(jīng)元搭出來。
所以從這個角度上來說,我不知道馮諾依曼心目中的馮諾依曼機跟我們大家心目中的馮諾依曼機是不是一個概念。但是如果我們指的是馮諾依曼自己說的馮諾依曼機,我覺得至少很多類腦芯片不一定就跳出他的范疇。
大家可能并不一定會看最原始的文件,看了第五手、第六手資料,可能理解和原作者就會有所偏差。但是我覺得馮諾依曼的理解,對于馮諾依曼機的理解應(yīng)該跟絕大部分的人想象的會不太一樣。
雷鋒網(wǎng)報道。
相關(guān)文章:
人大文繼榮教授:形散而神不散的“北京學(xué)派”決定了一個小目標
北大張平文院士:北大數(shù)學(xué)系的天才不是培養(yǎng)出來的,而是保護出來的
打造世界AI研究的中心?黃鐵軍:北京有資源,北京有責(zé)任,北京有希望
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。