0
本文作者: camel | 編輯:郭奕欣 | 2017-10-28 09:15 | 專題:CNCC 2017 |
雷鋒網AI科技評論消息,2017年10月26日上午,第十四屆中國計算機大會(CNCC 2017)正式在福州海峽國際會展中心開幕,雷鋒網作為獨家戰(zhàn)略合作媒體,對大會進行了全程報道。
在大會第一天,菲爾茲獎獲得者、哈佛大學終身教授丘成桐在會上作為特邀嘉賓做了首個演講報告,報告主題為《現(xiàn)代幾何學在計算機科學中的應用》。
報告中丘成桐先生首先介紹了現(xiàn)代幾何的發(fā)展歷史,隨后介紹了他與他的學生及朋友在計算機與幾何交叉方面的一些研究。對于人工智能,丘成桐先生認為現(xiàn)代以神經網絡為代表的統(tǒng)計方法及機器學習在工程實踐中取得了很大的成功,但其理論基礎非常薄弱,是一個黑箱算法;人工智能需要一個可以被證明的理論作為基礎。
下面為雷鋒網AI科技評論根據(jù)丘成桐先生演講內容整理,內容在不改變原意的情況下稍有修改。
胡事民(大會程序主席,清華大學教授):
大家都知道,計算機科學離不開數(shù)學,早期的計算機都是數(shù)學家?guī)臀覀兊於嘶A。今天的第一個報告,我們非常榮幸地邀請到了著名的數(shù)學家、數(shù)學界最高獎菲爾茲獎獲得者、哈佛大學教授丘成桐。丘老師不僅是偉大的數(shù)學家,他也在計算機方面做了很多工作。他開創(chuàng)了計算共形幾何,廣泛地應用在圖形學、視覺傳感器等方面。最近丘先生還在Nature上發(fā)表了一篇文章,研究社交網絡。下面我們有請丘先生。
丘成桐演講全文:
今天很榮幸地收到你們的邀請來做一個演講。我本人在數(shù)學上的貢獻不在計算機數(shù)學,最近這十多年來,由于我的學生顧險峰以及其他朋友的緣故,他們叫我?guī)兔ψ鲂└嬎銠C有關的學問。我發(fā)覺,純數(shù)學,尤其是幾何學在計算機方面有很大的應用。所以我今天就濫竽充數(shù),講講幾何跟計算機數(shù)學的關系。
首先,前面幾分鐘講講幾何學歷史。幾何學一開始,就類似今天的人工智能,有很多工程上的應用以及產生的很多定理。不過隨后歐幾里得將當時主要的平面定理組合以后發(fā)現(xiàn)這些定理都可以由5個公理推出來。這是人類歷史上很重要的一個里程碑,在很繁復的現(xiàn)象里,他找到了很簡單但卻很基本的五個公理,從而能將原來的這些公理全部推出來。我是很鼓勵我們做人工智能的也能重復這個做法——從現(xiàn)在復雜多樣的網絡中找到它最簡單的公理。
由于希臘人的工具不夠,所以除了二次方程定義的圖形(圓形、直線、橢圓等)以外,他們沒有能力處理更一般的圖形。一直到阿基米德,才開始做微積分的無限算法(積分體積),同時他們也開始做射影幾何的算法。
微積分的出現(xiàn)使幾何學進入了新紀元,微分幾何也因此誕生。幾何學在歐拉和高斯手上突飛猛進,變分方法和組合方法被大量地引入到幾何學當中。
現(xiàn)代幾何(近兩百年的幾何)主要發(fā)源于黎曼在1854年的博士論文,這篇論文奠定了整個現(xiàn)代幾何的基礎,他把幾何圖像看成一個抽象但是能夠自足的空間。這個空間后來成為了現(xiàn)代物理的基礎,現(xiàn)在物理中研究引力波等都是從黎曼這里開始的,沒有黎曼這個空間,愛因斯坦不可能研究出來廣義相對論。同時假如我們細看黎曼的這篇論文的話,就會發(fā)現(xiàn),黎曼還認為離散空間也是一個很重要的空間。這個離散的空間包括了我們現(xiàn)在研究的圖論,也用來研究宇宙萬物可能產生的一切。所以即使是150年以后的今天,我們依然能看到黎曼的這個觀點很重要。
幾何學能夠提供很多重要的想法,可以講其影響是無所不在的。幾何學的很多概念在高能物理和一般的物理學領域都產生重要的影響。其中一個重要的概念叫做“對稱”?!皩ΨQ”的概念是在1820年到1890年間由幾個重要的數(shù)學家發(fā)展出來的。我們中國喜歡講的陰陽,其實就是一個屬于對稱。在數(shù)學上有一個叫龐加萊對偶的概念,其實就是陰陽,但這個概念要比陰陽具體得多,同時也真正用在了數(shù)學的發(fā)展上。
19世紀,Sophis Lee發(fā)展的李群,也是物理學界最重要的工具之一,在現(xiàn)代物理中幾乎沒有一個學科可以離開李群的。
在幾何學上,1870年的時候,偉大的數(shù)學家克萊因發(fā)表了《埃爾朗根綱領》,在這個綱領里克萊因提出用對稱來統(tǒng)治幾何的重要原理,隨后產生了很多重要的幾何學,包括仿射幾何、保角幾何和投影幾何等。
這些幾何對于圖像處理都有密切的關系。我以及我的學生和朋友這十多年來就是用保角幾何及種種幾何來處理不同的圖像。即使是當年看上去不重要的幾何,現(xiàn)在實際上都有它重要的用處。這種種的計算都是從對稱這個概念發(fā)展出來的。從大范圍對稱到小范圍對稱,這些在20世紀的基礎研究中都有很成功的影響。
另外一個很重要的概念,我想是很多做工程的人都沒有注意到的,就是平行移動的概念。這個概念影響了整個數(shù)學界兩千年。平行移動的概念其實就是一點和另外一點要有一個很好的比較的方法;計算機也好,圖形學也好,在某一點上看到的事情要和其他點進行比較,比較的方法就叫平行移動。這也是一個很廣泛、很重要的概念。現(xiàn)在在計算數(shù)學里面還沒有大量的引進,但是在物理學界已經被大量地使用上了。所以我期望這些基本的概念以后能在計算機里面大量地使用。
現(xiàn)在我們具體來講一些的事情。現(xiàn)代幾何為計算數(shù)學奠定了很多理論的基礎,并且指導了計算機科學未來發(fā)展的方向。現(xiàn)代幾何廣泛應用到計算機的所有分支。舉例來講,計算機圖形學、計算機視覺、計算機輔助幾何設計、計算機網絡等等都有廣泛的應用。再例如,黎曼幾何可以用來理解社交網絡;現(xiàn)代幾何理論也可以用來理解人工智能的特性。要記住,我們講的幾何并不是高中時代的幾何,所有與圖像或者網絡有關的都是幾何的一部分。
從另一方面來看,計算機學科的發(fā)展為現(xiàn)代幾何提供了需求和挑戰(zhàn),也推動了跨學科的發(fā)展方向。例如:
人工智能中的機械定理證明推動了計算代數(shù)的發(fā)展;
數(shù)據(jù)安全、比特幣、區(qū)塊鏈的發(fā)展推動了代數(shù)數(shù)論、橢圓曲線和模形式的發(fā)展;
社交網絡、大數(shù)據(jù)的發(fā)展催生了持續(xù)同調理論(persistent homology)的發(fā)展;
動漫、游戲的發(fā)展推動了計算共性幾何學科的誕生和發(fā)展;
機器學習的發(fā)展推動了最優(yōu)傳輸理論的發(fā)展等等。
我們下面舉幾個具體的例子,分別是圖論、計算機圖形學、計算機視覺、人工智能、深度學習等。這幾個和幾何都有密切的聯(lián)系。
我們先講講圖論。圖,就是一大堆頂點、一大堆邊把它們連起來,這是最簡單不過的事情。對于一個圖,譬如交通圖,我們要找出它們有著怎么樣一個結構,什么地方比較擁擠。有時候我們也要研究怎么將這個圖切成小部分,然后分解成簡單的子圖;如何衡量各個連通分支間的連接度;如何將圖染色等。這些問題實際上都跟圖上的特征函數(shù)有密切的關系。
圖上的特征函數(shù)跟光滑圖形上的特征函數(shù)有很類似的地方。我在40年前跟幾個朋友,鄭紹遠、李偉光,做了一個工作,將光滑黎曼流形的特征函數(shù)推廣到圖上,得到了很好的結果。這些結果可以用來決定圖上的連結的生成,研究圖上的邊創(chuàng)造過程,尤其是有個量的估值來控制在圖上發(fā)散的過程。約束發(fā)散的過程可以應用到許多實際的過程中。我們還研究了圖上的薛定諤方程,定義了圖上的量子隧道概念。這些概念都是從物理上來的,被借用到圖上。
假如我們在考慮有向圖,就是每個點、每個邊,給它一個方向,我們就可以將拓撲學整個引用到圖上去,定義了圖上的同調群。同調群可以用來研究圖上密切的關系和它的內容。
現(xiàn)在我們來講講我們做的關于博弈理論的一個事情。進化圖論為表達種群結構提供了數(shù)學工具:頂點代表個體,邊代表個體的交互作用。圖可以用來代表各種具有空間結構的群,例如細菌、動植物、組織結構、多細胞器官和社交網絡。在進化過程中,每個個體依據(jù)自身的適應程度,進行繁殖病侵占到鄰近頂點。圖的拓撲反映了基因的演化——變異和選擇的平衡。類似的,互聯(lián)網是一個大網,一個非常復雜的網絡,我可以在上面研究它的變化。社交行為的進化可以用進化博弈論來研究。個體和鄰居博弈,根據(jù)收益而繁殖。個體繁殖速率受到自身與其他個體的交互作用影響,從而產生博弈的動態(tài)演化。其中心的問題就在于對于給定的圖如何決定哪種策略會取得成功。
我們在今年年初的時候在nature上發(fā)了篇文章,我們得到一個結果,就是在任何給定的圖上進行弱選擇,自然選擇從兩種彼此競爭的策略中如何進行挑選,這個理論框架適用于人類決策,也適用于任何集群組織的生態(tài)演化。
我們從弱選擇極限得到的結果,解釋了何種組織結構導致何種行為。我們發(fā)現(xiàn),如果存在成對的強紐帶結構,合作就會大規(guī)模出現(xiàn)。我們用數(shù)學證明了社會學方面的一個結論:穩(wěn)定的伙伴或者伴侶,對于形成合作型的社會起到了骨干作用。
2、計算機圖形學:全局參數(shù)化 – 共形幾何
下面我要講的是“計算機圖形學:全局參數(shù)化 – 共形幾何”。這是我們發(fā)展了二十多年的一個學問。我和顧險峰從他還在哈佛念博士的時候(1999年)我們就開始做這個事情。
當我們將圖形整體光滑映射到參數(shù)區(qū)域,使幾何變得很小,會破壞掉整個圖形;一般來講這個要用手工來做,否則的話它變化非常大。針對這個問題,我們使用了紋理貼圖、法向量貼圖等等的方法。共性幾何是一個很重要的從很古典的黎曼幾何中產生的幾何。
舉例來講,這個大衛(wèi)的雕像,我們將它保角地映射到平面上去。它表面上看好像變化很大,但實際上變化不大,因為它是保角不變的。這在圖像處理中是一個很重要的事情。舉個例子來講,從圖上要畫格點,因為我們畫到平面上去以后,我們就可以將平面上畫的很好的格點映射到臉上,就可以變成很漂亮的四方形的格點。這對工程處理有很多好處,其好處就是它將圖上很小的圓映射到對方圖上還是一個很小的圓,不會有扭曲,不會有太大的變化。
前面這些應用到一個數(shù)學上很重的定理,叫做龐加萊單值化定理,這是一個從黎曼時候開始的定理。就是講映射的圖形只跟它的拓撲性有關,這上面有三種幾何,分別為:球面幾何、歐氏幾何、雙曲幾何。所有二維的幾何,不管是什么樣子的,我們都可以用這三種幾何來分類。因此我們就可以將很復雜的事情很簡單地描述出來。
上面這些我們得出了很好的結果。但是保角也有它的缺點,所以我們也發(fā)展了第二類映射,我們使得面元被保持,而角度不一定被保持。保角映射有時候可能將一個面拉的很遠,左手邊是保角映射,右手邊是保面元映射。右面的圖在不同的情形下會得出很好的結果。
3、計算機視覺,表情追蹤 – 擬共映射
共性映射也可以應用到表情識別和追蹤當中。我們可以自動地找到球面上曲面間的光滑映射,使得特征點匹配,使映射帶來的變化很小。這是我們得到的一個很重要的結果。
因此,我們可以用來追蹤表情,表情捕捉。一個人他在笑、在哭、在種種不同的表現(xiàn)的時候,我們能夠得到他的重要的面部特征,主要的方法就是我們將它映射到平面上,然后用共形映射或擬共形映射來研究它。這些都是很重要的數(shù)學工具,在計算上也有很重要的應用。
擬共形映射到目前來講,純數(shù)學家把它看得還是非常重要的,它不是一個正則方程,而是一個偽正則方程,也即Beltrami方程。這個方程在我們研究圖像變形時在數(shù)學上是非常重要的,所以我們應用到圖形處理里面去也得到很重要的結果。我們可在微分同胚的空間進行變化到最優(yōu)的映射。它對醫(yī)療和動漫都有很重要的應用。
4、計算力學 – 六面體網格生成,葉狀結構理論
我們也可以用同樣的變化(保角映射)來產生六面體網格的生成和葉狀結構理論。
這是在一只兔子上找到的好的網格。但是這個網格會產生一些奇異點(拓撲學的緣故)。針對這些奇異點,我們就做了一些研究,得出了很好的結論。
再比如,我們看這個曲面,在這個曲面上我們畫出一些葉狀的結構,可是它也有一定的奇異點。我們將這些奇異點分類,得出了一些在計算機科學上有意義的結論。
此外,全純二次微分的網絡中間有個六邊形的變化。
5、數(shù)字幾何處理-幾何壓縮:蒙日-安培理論,幾何逼近理論
下面我們來看計算機的幾何壓縮中的蒙日-安培理論以及幾何逼近理論。如何壓縮復雜幾何數(shù)據(jù),同時保證幾誤差最小,保證黎曼度量、曲率測度、微分算子的收斂性,這些都是很重要的問題。我們用了很多共形映射的方法將曲面映射到平面去;再用蒙日-安培方程,將高曲率區(qū)域放大;隨后重采樣,在共性參數(shù)域上計算Delaunay三角剖分。這樣得到的簡化多面體網格就能夠保證黎曼度量、曲率測度、微分算子收斂。
6、區(qū)塊鏈:數(shù)字安全,橢圓曲線理論
這方面很多人都知道,這部分我就跳過去不再講了。
7、人工智能
目前機器學習算法需要大量的樣本。雖然現(xiàn)在比從前進步得多了,但規(guī)模還是很龐大。所以我們的想法是,讓理論來幫忙處理這種復雜的數(shù)據(jù)學習。
在機器學習中有很多統(tǒng)計的內容,但是很多內容我們都不是很了解它是如何產生的。所以我們需要用一些比較嚴格的數(shù)學的理論來從這些復雜的現(xiàn)象中抽取出它們的本質。我們今天介紹一下用幾何的方法來研究對抗生成網絡(GAN)的事情。
生成對抗網絡GAN(Generative Adversarial Networks)其實就是以己之矛克己之盾,在矛盾中發(fā)展,使得矛更加鋒利,盾更加強韌。這里的盾就被稱為判別器(Descriminator),矛被稱為生成器(Generator)。生成器G一般是將一個隨機變量(例如高斯分布或者均勻分布),通過參數(shù)化的概率生成模型(通常是用一個深度神經網進行參數(shù)化),進行概率分布的逆變換采樣,從而得到一個生成的概率分布。判別器D也通常采用深度卷積神經網絡。
舉個例子來講,有個概率分布u,u是基本的白噪音,影射到右手邊的圖片,一個概率分布v。我們從映射里看到GAN的問題其實就是:在兩個概率分布u和v之間,找到一個最優(yōu)的傳輸映射,從一個空間到另外一個空間,使它的概率分布是保持的。
u通過phi映射到v上去,同時我們要將它傳輸?shù)拇鷥r變得最小。這樣的變化是我們所需要的,因為這就不再需要像剛才所說的矛盾變化來達到最好的結果。我們知道,映射可以用一個方程來解決,所以我們其實就是要找一個凸函數(shù)U,它的梯度是我們的映射函數(shù)phi,它滿足一個方程:蒙日-安培方程。
我們可以通過對這個方程進行求解的方式來找到最優(yōu)傳輸映射,所以就節(jié)省很多生成對抗的時間。蒙日-安培方程本身其實是等價于微分幾何中的亞歷山大定理的。60年代就有人處理過這個方程,我自己也做過這個方程,前幾年顧險峰跟他的學生也和我一起對它做了一個計算。
對抗生成網絡實質上就是用深度神經網絡來計算概率測度之間的變換。雖然規(guī)模宏大,但是數(shù)學本質并不復雜。應用相對成熟的最優(yōu)傳輸理論和蒙日-安培理論,我們可以為機器學習的黑箱給出透明的幾何解釋,這有助于設計出更為高效和可靠的計算方法。
我們看到現(xiàn)代數(shù)學和計算機科學的發(fā)展緊密相關,共形幾何的單值化定理、蒙日-安培理論、最優(yōu)傳輸理論等現(xiàn)代幾何中的定理應用到計算機科學中的很多領域。我希望我們能夠將更多那些表面上看來很高深的數(shù)學應用到我們日常的計算機上去,不但是能夠有效地提出計算機的算法,同時也能夠給它一個理論的基礎。人工智能需要一個堅實的理論基礎,否則它的發(fā)展會有很大困難。
更多CNCC 2017精彩資訊,敬請關注雷鋒網AI科技評論。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。