0
本文作者: 集智 | 2016-11-20 09:48 |
雷鋒網(wǎng)按:本文來自北京集智俱樂部。作者張江,北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院副教授,集智俱樂部創(chuàng)始人、現(xiàn)任主席、集智科學(xué)家,騰訊公司騰云智庫成員。
盡管復(fù)雜性科學(xué)一直在追求一大類終極問題的答案,如生命的起源、復(fù)雜性的起源等。但其實(shí)它的發(fā)展完全是研究方法驅(qū)動(dòng)的。例如在計(jì)算機(jī)出現(xiàn)之前,人們是用哲學(xué)思辨和數(shù)學(xué)方程來研究復(fù)雜系統(tǒng);到了90年代,圣塔菲學(xué)派興起,多主體仿真、復(fù)雜自適應(yīng)系統(tǒng)方法席卷了各個(gè)研究領(lǐng)域;2000年以后,復(fù)雜網(wǎng)絡(luò)崛起,小世界和無標(biāo)度以及各式各樣的網(wǎng)絡(luò)分析滲透到了復(fù)雜性研究的各個(gè)角落;到了2010年以后,基于大數(shù)據(jù)的復(fù)雜性研究和計(jì)算社會(huì)科學(xué)(computational social science)開始興起。那么,站在2016年的末端展望未來,下一波的熱潮將會(huì)是什么呢?有沒有可能是引領(lǐng)工業(yè)界革命的深度學(xué)習(xí)技術(shù)呢?
實(shí)際上,將深度學(xué)習(xí)技術(shù)引入復(fù)雜性科學(xué)研究已經(jīng)有了大量的研究案例。例如,最近Science上發(fā)表了一篇“用遙感和衛(wèi)星數(shù)據(jù)結(jié)合來預(yù)測(cè)貧困”的研究就是一個(gè)很好的典范1。來自斯坦福大學(xué)的一個(gè)團(tuán)隊(duì)利用深度學(xué)習(xí)技術(shù)成功預(yù)測(cè)了非洲地區(qū)的貧困,這一研究不僅解決了困擾了社會(huì)學(xué)家們數(shù)十年的大問題,而且也打開了深度學(xué)習(xí)方法滲透進(jìn)社會(huì)復(fù)雜性研究的一個(gè)新窗口。
用深度學(xué)習(xí)和遙感數(shù)據(jù)預(yù)測(cè)非洲貧困的Science文章(左),以及同期刊登的評(píng)述文章
問題的背景是這樣的:非洲的貧困問題長(zhǎng)期得不到解決,這并不是因?yàn)槿狈碜园l(fā)達(dá)地區(qū)的資助,而是因?yàn)闆]有精確的貧困數(shù)據(jù)。這就使得對(duì)非洲的大量投資沒有達(dá)到需要救助的地區(qū),而全部落入了富人和貪官的腰包里,從而導(dǎo)致了更大規(guī)模的貧富差距。于是,人們想到了利用衛(wèi)星拍攝到的夜光數(shù)據(jù)來預(yù)測(cè)地區(qū)的貧困,因?yàn)樵礁挥械牡貐^(qū),通常夜間燈光的亮度也越高。
但是,這個(gè)結(jié)論反過來卻不成立,并不是說越貧窮的地區(qū)燈光越暗。事實(shí)上,研究人員從一片黑色區(qū)域中完全區(qū)分不出無人居住的沙漠,還是貧困得連燈都用不起的村莊。怎么辦呢?
圖1 復(fù)雜的訓(xùn)練管道,上面的流程為輸入一塊區(qū)域的衛(wèi)星遙感數(shù)據(jù),來預(yù)測(cè)同一區(qū)域的夜光明亮度,從而訓(xùn)練一個(gè)卷積神經(jīng)網(wǎng)絡(luò)以獲得遙感數(shù)據(jù)中的特征。下圖所示為:將卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行遷移,再配合上少量的貧困調(diào)查數(shù)據(jù)作為標(biāo)簽,訓(xùn)練一個(gè)普通的神經(jīng)網(wǎng)絡(luò)。最終卷積神經(jīng)網(wǎng)絡(luò)+普通網(wǎng)絡(luò)就可以根據(jù)輸入圖片來預(yù)測(cè)地區(qū)貧困。摘自:文獻(xiàn)2
斯坦福的這個(gè)研究團(tuán)隊(duì)巧妙地將另一種高精度、高質(zhì)量的衛(wèi)星遙感圖像數(shù)據(jù)訓(xùn)練一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)(Convoluational Neural Network, CNN),以預(yù)測(cè)同區(qū)域的夜光數(shù)值大小。但這樣做的目標(biāo)并不真的為了預(yù)測(cè)夜光,而是為了提取遙感圖像數(shù)據(jù)中的特征(例如街道、屋頂?shù)龋H缓?,再利用這些特征作為輸入,以及少數(shù)采樣點(diǎn)的貧困調(diào)查數(shù)據(jù)作為標(biāo)簽,一起來訓(xùn)練一個(gè)普通的神經(jīng)網(wǎng)絡(luò)。最終,喂給這個(gè)網(wǎng)絡(luò)一張街景地圖,它就可以高精度地預(yù)測(cè)該地區(qū)的貧困程度。就這樣,這個(gè)組使用了非常先進(jìn)的遷移學(xué)習(xí)技術(shù),以及復(fù)雜的機(jī)器學(xué)習(xí)訓(xùn)練管道(pipeline),對(duì)局部貧困程度進(jìn)行了較高精度的預(yù)估(如圖1)。
多主體建模是復(fù)雜系統(tǒng)一種非常普遍而有效的研究方式。我們將系統(tǒng)理解為大量個(gè)體遵循簡(jiǎn)單的相互作用規(guī)則而形成的整體。例如,當(dāng)我們分析人群的集體行為時(shí),可以對(duì)每一個(gè)個(gè)體人建立模型,并假設(shè)它們都遵循極其簡(jiǎn)單的相互作用規(guī)則(如社會(huì)力模型3)。然后,我們?cè)谟?jì)算機(jī)中再造這群人的計(jì)算機(jī)仿真程序,從而模擬出人群的運(yùn)動(dòng)軌跡。
社會(huì)力模型的模擬程序
盡管這種思路的確可以逼真地模擬復(fù)雜系統(tǒng),但是所有的模型規(guī)則和參數(shù)幾乎全部是模型構(gòu)建者拍腦袋決定的。這就使得模型的準(zhǔn)確性和可信賴程度大打折扣。
我們知道,實(shí)際上,現(xiàn)在的城市公共空間裝滿了各種各樣的攝像頭。大量的人群運(yùn)動(dòng)軌跡被記錄在了視頻里。那么,我們能不能自動(dòng)地將視頻中的個(gè)體人的運(yùn)動(dòng)軌跡提取出來,訓(xùn)練我們的主體模型,從而得到極其逼真的人群運(yùn)動(dòng)模擬呢?
來自清華大學(xué)自然語言處理和深度學(xué)習(xí)的一個(gè)團(tuán)隊(duì)就做了這樣的嘗試。他們?yōu)槿巳哼\(yùn)動(dòng)視頻中的每一個(gè)人構(gòu)建了一個(gè)LSTM模型(long short time memory,一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN模型,被人們大量地用于自然語言處理和機(jī)器翻譯),通過自動(dòng)提取視頻中每一個(gè)人的運(yùn)動(dòng)軌跡作為訓(xùn)練數(shù)據(jù),構(gòu)建了能夠準(zhǔn)群預(yù)測(cè)人群運(yùn)動(dòng)狀態(tài)的深度學(xué)習(xí)模型4。
每一個(gè)Agent的LSTM模型,該圖引自:參考文獻(xiàn)4
該模型不僅可以預(yù)測(cè)每個(gè)人的運(yùn)動(dòng)軌跡,同時(shí),它還可以自動(dòng)為人群的集體運(yùn)動(dòng)狀態(tài)進(jìn)行分類和識(shí)別,以便預(yù)警人群的恐慌狀態(tài),防止踩踏的發(fā)生。也可以用來快速識(shí)別突發(fā)事件。
類似的,來自英國(guó)Sheffield大學(xué)和美國(guó)哈佛大學(xué)的一個(gè)團(tuán)隊(duì)嘗試用對(duì)抗式機(jī)器學(xué)習(xí)的方法,讓機(jī)器通過模仿自動(dòng)建立多主體模型5。他們將自制的小機(jī)器人分成了三組,一組是被模仿對(duì)象,它們會(huì)按照事先指定的規(guī)則進(jìn)行復(fù)雜的運(yùn)動(dòng);一組是模仿者,它們會(huì)混到第一組機(jī)器人之中模仿它們的運(yùn)動(dòng)行為,從而盡可能地騙過辨別者的法眼;第三組是辨別者,它的任務(wù)就是區(qū)分這些機(jī)器人誰是模仿者,誰是被模仿對(duì)象。最終的效果是,隨著辨別者識(shí)別準(zhǔn)確度的提高,模仿者的模仿行為也會(huì)越來越逼近被模仿者。于是,我們便可以利用訓(xùn)練好的模仿者搭建一個(gè)逼真的多主體模型,來對(duì)被模仿者群體進(jìn)行模擬。
盡管這些研究仍處于實(shí)驗(yàn)室階段,但是我們不難想象,未來的人工智能將可能通過深度學(xué)習(xí)自動(dòng)提取主體的運(yùn)行規(guī)則,從而構(gòu)造大規(guī)模的模擬程序。那個(gè)時(shí)候,我們將有可能更加逼真地模擬多個(gè)體的復(fù)雜系統(tǒng),并在其上進(jìn)行規(guī)劃或政策仿真。
為什么深度學(xué)習(xí)如此厲害?不同的人會(huì)給出不同的答案。
因?yàn)樗泻苌畹纳窠?jīng)網(wǎng)絡(luò)層次——一個(gè)初學(xué)者大概會(huì)如是說;
因?yàn)樗梢詫W(xué)習(xí)超大規(guī)模數(shù)據(jù)——一個(gè)了解深度學(xué)習(xí)的行業(yè)從業(yè)人員大概會(huì)這么說;
因?yàn)樯疃葘W(xué)習(xí)技術(shù)可以自動(dòng)從數(shù)據(jù)中提取特征——一個(gè)深入理解深度學(xué)習(xí)的科研人員大概會(huì)這么回答。
沒錯(cuò),深度學(xué)習(xí)的本質(zhì)并不在層次有多深,數(shù)據(jù)規(guī)模有多大,而在于它自動(dòng)提取特征的能力。
什么是特征?長(zhǎng)度、寬度、顏色、質(zhì)料、形狀,等等都是特征。然而,它們?nèi)渴侨藶槎x的。假設(shè)一種生活在頻率世界之中的生物體,它大概很難看到一個(gè)物體的長(zhǎng)度和體積。所以面對(duì)超大規(guī)模的數(shù)據(jù),我們憑借肉眼已經(jīng)很難提煉特征了,必須把這種能力賦予機(jī)器,這才是深度學(xué)習(xí)的本質(zhì)。
在現(xiàn)代的復(fù)雜系統(tǒng)研究中,復(fù)雜網(wǎng)絡(luò)已經(jīng)成為了一種標(biāo)準(zhǔn)的通用描述語言。那么我們?cè)鯓佑蒙疃葘W(xué)習(xí)的方式自動(dòng)提取大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)特征呢?
我們知道,復(fù)雜網(wǎng)絡(luò)無非就是由點(diǎn)和連邊構(gòu)成的整體。節(jié)點(diǎn)或連邊的特征自然就是由它所在的網(wǎng)絡(luò)環(huán)境(上下文)所決定的。只要我們將每一個(gè)點(diǎn)賦予一個(gè)n維向量,就得到了整個(gè)網(wǎng)絡(luò)的嵌入(n維空間中的一團(tuán)點(diǎn)云)。
我們可以把語言中出現(xiàn)在同一句話的單詞彼此相連構(gòu)成一個(gè)所謂的“共現(xiàn)網(wǎng)絡(luò)”,這樣,每一個(gè)詞就是一個(gè)節(jié)點(diǎn),連邊就表示同時(shí)出現(xiàn)。對(duì)于這種網(wǎng)絡(luò),2013年,Google的Miklov開創(chuàng)性地提出了一種用向量表示英語單詞的做法,叫做Word2Vec6。通過掃描大量的文本數(shù)據(jù),Word2Vec可以快速、高效地為每一個(gè)單詞構(gòu)造一個(gè)向量,即n維空間中的一個(gè)點(diǎn)。
相似的單詞,例如紅與粉在空間中會(huì)彼此靠近。更有趣的是,同一種意思的單詞在不同語言的空間嵌入中具有相似的位置。例如,如果我們分別用英語和法語進(jìn)行訓(xùn)練,那么1,2,3……等數(shù)字會(huì)在兩套向量表示下具有相似的位置。如圖所示:
分別用純英文(左)和純法文(右)的語料訓(xùn)練Word2Vec得到的向量表示。我們會(huì)看到,英語的one,two,three……的位置以及對(duì)應(yīng)的法語單詞的位置非常相似。與此類似,哺乳類動(dòng)物在兩種語言的嵌入中也具有相似的位置(下面兩幅圖)。
Word2Vec中涌現(xiàn)的向量差關(guān)系:,其中藍(lán)色的向量(深藍(lán)和淺藍(lán))都表示用Word2Vec學(xué)習(xí)得到的單詞向量。它們彼此之間的差向量(紅色箭頭),表達(dá)了最高權(quán)力關(guān)系也近似相等。
更讓人震驚的是,單詞之間的關(guān)系也可以自動(dòng)地被Word2Vec學(xué)到,如上圖這個(gè)著名的公式:v(男人)-v(女人)=v(國(guó)王)-v(王后),其中v(x)表示x這個(gè)單詞的詞向量。也就是說,機(jī)器會(huì)自己學(xué)習(xí)到男人相對(duì)于國(guó)王相當(dāng)于女人相對(duì)于王后。所以,除了將每個(gè)單詞進(jìn)行向量表示以外,Word2Vec還可以隱式地學(xué)習(xí)到“最高權(quán)力”這種抽象關(guān)系。
與此類似,很多概念之間會(huì)存在著上下位的層級(jí)關(guān)系。例如,“動(dòng)物”就是“昆蟲”的上位詞,而“昆蟲”又是“蜻蜓”的上位詞。我們用這些單詞的向量表示分別做減法,就可以用差向量來表示這種抽象的關(guān)系9。如圖:
Word2Vec學(xué)習(xí)得到的詞語之間的層級(jí)關(guān)系:首先讓W(xué)ord2Vec學(xué)習(xí)大量的中文語料,這樣每個(gè)單詞會(huì)對(duì)應(yīng)一個(gè)表示(藍(lán)色的點(diǎn))。其次,我們尋找所有的上下位詞層級(jí)關(guān)系,比如工人與木匠,或者運(yùn)動(dòng)員與足球運(yùn)動(dòng)員,并將它們的向量表示分別相減得到了上下位詞的差向量。我們發(fā)現(xiàn),這些差向量如果是同一種類別的話,比如工人-木匠,以及工人-園丁,則非常相似。所以,Word2Vec學(xué)習(xí)得到的向量表示蘊(yùn)含了一種關(guān)系表示。該圖摘自:參考文獻(xiàn)9
然而,這種蘊(yùn)含的關(guān)系表示并不十分明確,存在著很大的誤差。于是,人們想出了各種方法來改進(jìn),其中一種比較徹底的方式是,將所有的名詞實(shí)體和各種關(guān)系(包括上下位、同義詞等)分別嵌入到不同的空間(即實(shí)體空間和關(guān)系空間),這樣可以更全面、更準(zhǔn)確地來表達(dá)它們10。
與此類似,我們還可以用這種方法處理其它的不同網(wǎng)絡(luò)。
利用與Word2Vect類似的DeepWalk算法10得到的“跆拳道俱樂部”(左側(cè))網(wǎng)絡(luò)的嵌入(右側(cè))。其中節(jié)點(diǎn)是人,連邊是好友關(guān)系。在這個(gè)俱樂部中,存在著4個(gè)相對(duì)獨(dú)立的社團(tuán),分別被標(biāo)注了不同的顏色。摘自參考文獻(xiàn)7
得到這些向量表示又有什么用呢?它的用途有很多,例如,通過向量表示可以發(fā)現(xiàn)節(jié)點(diǎn)之間的聚類,我們只要將表示空間中彼此靠近的節(jié)點(diǎn)劃分為一類就可以,如下圖:
該圖是將帶參數(shù)的網(wǎng)絡(luò)嵌入Node2Vec算法在兩種不同參數(shù)條件下用于同一個(gè)網(wǎng)絡(luò)(上、下),并根據(jù)向量表示做聚類分析后得到的可視化效果。其中同一種顏色對(duì)應(yīng)同一種聚類。上圖得到的聚類是網(wǎng)絡(luò)的社團(tuán)劃分。下圖的聚類得到的卻是生態(tài)位(葉子節(jié)點(diǎn)、橋接節(jié)點(diǎn)以及中心節(jié)點(diǎn))的劃分。摘自文獻(xiàn)8
更重要的是,這些花樣繁多的向量表示解決了每個(gè)節(jié)點(diǎn)的特征描述問題以作為節(jié)點(diǎn)分類和預(yù)測(cè)問題的基礎(chǔ)。一般情況下,節(jié)點(diǎn)的向量表示就是機(jī)器自發(fā)學(xué)習(xí)出來的節(jié)點(diǎn)特征,該特征反應(yīng)的是每一個(gè)節(jié)點(diǎn)所在整個(gè)網(wǎng)絡(luò)之中的生態(tài)地位。
于是,根據(jù)機(jī)器學(xué)習(xí)得到的特征,運(yùn)用神經(jīng)網(wǎng)絡(luò)技術(shù),我們便可以進(jìn)行節(jié)點(diǎn)的分類與預(yù)測(cè)了。我們可以通過社交網(wǎng)絡(luò)識(shí)別哪一個(gè)節(jié)點(diǎn)更可能是恐怖分子。我們也可以根據(jù)一篇文章在引文網(wǎng)中的地位預(yù)測(cè)它是否可以獲得諾貝爾獎(jiǎng)提名,等等。
我們知道,現(xiàn)在的深度學(xué)習(xí)技術(shù)最主要的突破其實(shí)都是在圖像識(shí)別領(lǐng)域和自然語言領(lǐng)域。從技術(shù)上講,圖像屬于一種靜態(tài)的二維數(shù)組,而自然語言實(shí)際上可以看做一種時(shí)間上的符號(hào)序列。它們都有非常標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)。
但是,網(wǎng)絡(luò)或者圖,卻是一種介于二維數(shù)組和一維序列之間的不規(guī)則數(shù)據(jù)類型。我們不能把網(wǎng)絡(luò)看做圖像,因?yàn)榫W(wǎng)絡(luò)的節(jié)點(diǎn)之間沒有圖像的像素之間那樣規(guī)整的鄰域關(guān)系。我們同樣不能把網(wǎng)絡(luò)看做是一維的節(jié)點(diǎn)和連邊序列,因?yàn)槲覀內(nèi)我忸嵉构?jié)點(diǎn)之間的順序,卻對(duì)應(yīng)的是同一張網(wǎng)絡(luò)。
于是,問題來了。既然深度學(xué)習(xí)可以在圖像識(shí)別以及自然語言處理中大展身手,那么是否也能在復(fù)雜網(wǎng)絡(luò)的相關(guān)任務(wù)中嶄露頭腳呢?
具體的,讓我們考慮這樣一種所謂的圖分類問題(Graph classification problem)。如果我給你一張網(wǎng)絡(luò),沒有任何其它輔助信息,你能不能告訴我它屬于哪一類?是社交網(wǎng)絡(luò)還是生物網(wǎng)絡(luò)?是無標(biāo)度網(wǎng)還是小世界網(wǎng)?這個(gè)問題有什么實(shí)際背景呢?我們知道,復(fù)雜網(wǎng)絡(luò)可以看做是復(fù)雜系統(tǒng)的骨架(backbone),那么當(dāng)我們處理不同的復(fù)雜系統(tǒng)時(shí),我們便可以通過它們的骨架來進(jìn)行識(shí)別、分類和預(yù)測(cè)。比如,我們可以將一個(gè)社群的社交網(wǎng)絡(luò)看做社群的骨架,那么我們就能否根據(jù)它預(yù)測(cè)網(wǎng)絡(luò)的運(yùn)行狀況;再比如,如果將一個(gè)國(guó)家的投入產(chǎn)出網(wǎng)看做是國(guó)家經(jīng)濟(jì)系統(tǒng)的骨架,那么我們就能給國(guó)家的產(chǎn)業(yè)結(jié)構(gòu)進(jìn)行“診脈”。
這些問題的背后需要一種新的突破,它在5年前剛剛開始萌芽,這就是圖卷積神經(jīng)網(wǎng)絡(luò)技術(shù)(Graph convolutional neural network,GNN)11。該套技術(shù)通過擴(kuò)展基于圖像的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN),來處理大量的網(wǎng)絡(luò)數(shù)據(jù)。并有可能達(dá)到和CNN同等的精確程度。
GNN模型的架構(gòu),類似于圖像處理中的CNN,GNN可以對(duì)一個(gè)網(wǎng)絡(luò)進(jìn)行卷積操作,并做粗?;?,從而實(shí)現(xiàn)多層信號(hào)處理,摘自文獻(xiàn)12
在很多文獻(xiàn)中,人們不僅用CNN來識(shí)別圖像,更多的是用它來提取圖片中物體的特征。例如在前面講述的用衛(wèi)星遙感圖像預(yù)測(cè)貧困的工作中,研究者用CNN的最主要目的是提取出圖像中屋頂、道路等特征。有了這些機(jī)器自動(dòng)學(xué)習(xí)得到的特征之后,我們便可以將學(xué)好的網(wǎng)絡(luò)用于各種領(lǐng)域。例如,我們可以將CNN和LSTM結(jié)合,從而實(shí)現(xiàn) “看圖說話”;將CNN配上強(qiáng)大的強(qiáng)化學(xué)習(xí),就能實(shí)現(xiàn)讓計(jì)算機(jī)和人類一樣看著視頻打游戲;將CNN配上強(qiáng)大的蒙特卡洛搜索,就能實(shí)現(xiàn)戰(zhàn)勝人類大師的AlphaGo。
與此類似,一旦GNN技術(shù)實(shí)現(xiàn)突破,那么我們就真的可以通過網(wǎng)絡(luò)來對(duì)宏觀復(fù)雜系統(tǒng)進(jìn)行診脈。城市的規(guī)劃很糟糕嗎?讓我們利用GNN掃描一下城市的道路網(wǎng)絡(luò),就能給城市規(guī)劃打分;美國(guó)和中國(guó)的金融市場(chǎng)哪一個(gè)更容易崩盤?讓GNN掃描一下它們各自的股票相關(guān)網(wǎng)絡(luò)就能給出答案;今天Facebook的心情如何?讓GNN掃描一下社交網(wǎng)絡(luò)就能給出類似這樣的描述:“今天的Facebook心情很糟,因?yàn)槲⑿庞滞谧吡宋迩f用戶……囧”。
復(fù)雜系統(tǒng)需要深度學(xué)習(xí)嗎?我的回答當(dāng)然是需要。這是因?yàn)樯疃葘W(xué)習(xí)可以自動(dòng)化提取對(duì)象中的隱藏特征,這將結(jié)束幾十年來復(fù)雜性科學(xué)家手工發(fā)明特征指標(biāo)的歷史。人類的智慧雖然閃爍著靈光,但面對(duì)龐大的數(shù)據(jù),人工智能還是更勝一籌。一旦GNN、網(wǎng)絡(luò)嵌入等技術(shù)獲得突破,所有的特征發(fā)現(xiàn)就全部變成了自動(dòng)化流水線,我們便可以站在一個(gè)更高的層次來理解復(fù)雜系統(tǒng)。
深度學(xué)習(xí)在圖像領(lǐng)域中的大量突破告訴我們,一旦機(jī)器可以學(xué)會(huì)自動(dòng)提取特征,我們就可以以一種人類難以想象的精準(zhǔn)度來進(jìn)行預(yù)測(cè)和識(shí)別。例如,現(xiàn)在深度學(xué)習(xí)在人臉識(shí)別的準(zhǔn)確率已經(jīng)高達(dá)99%了,而人類的準(zhǔn)確率也僅僅只有97%。所以,在未來,精確地認(rèn)識(shí)、調(diào)控復(fù)雜系統(tǒng)并非完全不可能。
而更有意思的是,當(dāng)我們把深度學(xué)習(xí)和傳統(tǒng)技術(shù),包括多主體模擬、系統(tǒng)動(dòng)力學(xué)相結(jié)合,就可能實(shí)現(xiàn)對(duì)復(fù)雜系統(tǒng)的自動(dòng)建模。我們可以設(shè)想這樣一種機(jī)器,你只要不斷地喂給它大量的數(shù)據(jù),它就有可能自動(dòng)吐出來一個(gè)多主體模型,并告訴你精確調(diào)控系統(tǒng)的方案。如果能實(shí)現(xiàn)這一步的話,人工智能就真的可以管理社會(huì)了。
然而,反對(duì)論者批評(píng)深度學(xué)習(xí)是一個(gè)黑箱模型:盡管它可以很好地工作,但我們?nèi)祟惾匀粺o法理解。這就好像中醫(yī)看病,完全憑借老醫(yī)師的個(gè)人經(jīng)驗(yàn)和感悟,無法給你一套符合西醫(yī)科學(xué)標(biāo)準(zhǔn)的解釋。但是,也許復(fù)雜系統(tǒng)就需要這種中醫(yī)式的思維方式。因?yàn)榫拖裥∥浵仧o法理解蟻群的行為一樣,超級(jí)復(fù)雜的相互作用關(guān)系也許壓根就不是我們?nèi)四X智慧可以處理得了的。我們只能借助更加強(qiáng)大的機(jī)器來應(yīng)付超大規(guī)模的復(fù)雜性。
反過來講,復(fù)雜性科學(xué)也可以幫助我們更好地理解深度學(xué)習(xí)模型。例如,最近的一批物理學(xué)家就在嘗試用變分重整化群(Variational renormalization group)的方法來理解深度學(xué)習(xí)網(wǎng)絡(luò)13,每增加一層神經(jīng)元節(jié)點(diǎn)就是在對(duì)原問題進(jìn)行更高層次的粗?;?。所以,層次的加深有助于我們從更高的尺度去把握數(shù)據(jù)中的規(guī)律。
總而言之,長(zhǎng)期以來復(fù)雜性科學(xué)就是一個(gè)非常具有包容性的學(xué)科。它是各種數(shù)理方法、工程技術(shù)的大熔爐。所以,將深度學(xué)習(xí)融入復(fù)雜系統(tǒng)是一個(gè)必然趨勢(shì)。
參考文獻(xiàn)
1.Jean N, Burke M, Xie M, et al. Combining satellite imagery and machine learning to predict poverty.[J]. Science, 2016, 353(6301):790-794.
2.Blumenstock J E. Fighting poverty with data[J]. Science, 2016, 353(6301):753-754.
3.Helbing D, Moln T. Social Force Model for Pedestrian Dynamics[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 1995, 51(5):4282-4286.
4.Hang Su, Yinpeng Dong, Jun Zhu, Haibin Ling, and Bo Zhang, Crowd Scene Understanding with Coherent Recurrent Neural Networks, Proceedings of the Twenty-Fifth International Joint Conference on Artificial Intelligence (IJCAI-16), 2016
5.Wei Li , Melvin Gauci and Roderich Gro: Turing learning: a metric-free approach to inferring behavior and its application to swarms, https://arxiv.org/pdf/1603.04904v2.pdf
6.T. Miklov: Efficient Estimation of Word Representations in Vector Space, 2013
7.Perozzi B, Al-Rfou R, Skiena S. DeepWalk: Online Learning of Social Representations[J]. arXiv preprint arXiv:1403.6652, 2014.
8.Aditya Grover, Jure Leskovec. node2vec: Scalable Feature Learning for Networks. KDD 2016.
9.R Fu et al: Learning Semantic Hierarchies via Word Embeddings, Meeting of the Association for Computational Linguistics, 2014
10.Lin Y, Liu Z, Sun M, et al. Learning entity and relation embeddings for knowledge graph completion[J]. 2015.
11.Defferrard M, Bresson X, Vandergheynst P. Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering[J]. 2016.
12.Niepert M, Ahmed M, Kutzkov K. Learning Convolutional Neural Networks for Graphs[J]. 2016.
13.Mehta P, Schwab D J. An exact mapping between the Variational Renormalization Group and Deep Learning[J]. Computer Science, 2014.
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。