0
本文作者: 岑大師 | 2017-09-19 15:09 |
9月12日上午,南京金秋洽談會“2017中國人工智能峰會(CAIS 2017)”在南京國際博覽會議中心盛大開幕。本次峰會以“創(chuàng)新、變革、突破”為主題,并設兩大主題論壇,共吸引了30余位人工智能領域著名的科學家、企業(yè)領袖親臨現(xiàn)場,1500余名專業(yè)觀眾報名參會,雷鋒網作為受邀媒體參加了本次峰會并進行了報道。
在大會上,瑞士人工智能實驗室 IDSIA 主任、“LSTM之父”Jürgen Schmidhuber發(fā)表了名為《True Artifical Intelligence Will Change Everything》的演講。LSTM近年來取得了長足的發(fā)展,今天,基于 LSTM 的系統(tǒng)被廣泛應用在機器人控制、圖像分析,文檔總結,視頻識別、手寫識別、聊天機器人、智能助手、推薦系統(tǒng)、預測疾病和股票市場等商業(yè)領域,但Jürgen Schmidhuber認為,現(xiàn)在的人工智能離真正的人工智能,即具備自我學習能力的通用人工智能還有不小的差距。
(Jürgen Schmidhuber在CAIS 2017大會上演講)
在演講中,Jürgen Schmidhuber對20世紀的人工智能進行了簡要的回顧,并結合自己對遞歸式自我改進算法的研究,對未來做出自己的展望。在他看來,目前被各大科技巨頭采用的LSTM只是通用人工智能的前序工作,具備自我學習能力的通用人工智能可能比人類更聰明,也具備改變一切的能力。
Jürgen Schmidhuber 還對未來的世界進行了展望。根據其研究發(fā)現(xiàn),宇宙歷史的重大事件之間的間隔時間存在一定規(guī)律性,每個大事件到來的時間是前一個大事件的四分之一。通過仔細研究了這一模式發(fā)現(xiàn),這些大事件將會收斂于 2050 年,即“奇點”,而根據這一規(guī)律,Jürgen Schmidhuber預計,在2038年前后,廉價家用電腦或將具備人腦的能力。
在會后,Jürgen Schmidhuber接受了雷鋒網的采訪,以下為采訪實錄:
雷鋒網:您在機器學習領域有著諸多的杰出貢獻,如超級深度學習系統(tǒng)(Very Deep Learners)、LSTM、機器好奇心理論(Artifical Curiosity)等,您自己最引以為傲的一項研究成果是?
Jürgen Schmidhuber: 我覺得我所有研究中有一項,雖然在商業(yè)上認知不是很廣,但是卻是非常重要的研究:這是在我1987年的畢業(yè)論文中,我設想有一種算法,在學習的過程中可以同時提升自己如何去學習的能力。這是一種自我監(jiān)督型的算法,我認為在宏觀來講這一研究目前在商業(yè)應用上不是很好,但卻是更宏大的命題:如何讓機器具備自我學習、更聰明的能力。
雷鋒網: 在您的這篇畢業(yè)論文中提到一個具有自我學習能力的機器人,這也使得您在此后的30年來一直為此努力。在您看來,您現(xiàn)在的研究和30年前的研究有什么樣的差別?
Jürgen Schmidhuber: 當我還是一個男孩的時候,我就希望最大化我的影響力。我意識到,我必須建立一個具備自我學習能力的AI,學會變得比我更聰明,這樣讓AI解決我無法解決的所有問題,然后我就可以退休了。在我1987年的論文中,我描述了元學習(雷鋒網注:Meta Learning,或者叫做 Learning to Learn,已經成為繼增強學習之后人工智能研究的一個重要的研究分支)計劃的第一個具體研究,即不僅學習如何解決問題,而且學習提高自己的學習算法,通過遞歸自我學習最終成為超級人工智能。但這種設想受限當時的計算性能力無法進得到充分驗證。
我仍然在為實現(xiàn)這一30年前的目標而努力,而且有越來越多的人對此感興趣。為什么?由于我們在實現(xiàn)這一目標的道路上創(chuàng)造的方法正在滲透到我們生活的現(xiàn)代世界,每天有數(shù)十億次的計算。截至2017年8月,五家最有價值的上市公司分別是蘋果,谷歌,微軟,F(xiàn)acebook,亞馬遜。所有這些巨頭都在使用LSTM。具體來講,F(xiàn)acebook正在應用LSTM完成每天45億次的翻譯,Google 29%的數(shù)據中心計算能力使用LSTM(CNN僅占5%),LSTM不僅改善了近10億部iPhone手機中的Siri和QuickType功能,更為超過20億部Android手機語音識別提供支持,LSTM還是亞馬遜Alexa和Google語音識別器的核心。
基于LSTM的系統(tǒng)還被廣泛應用在機器人控制、圖像分析,文檔總結,視頻識別、手寫識別、聊天機器人、智能助手、推薦系統(tǒng)、預測疾病和股票市場等領域。你可以參考我們實驗室的相關網頁:http://people.idsia.ch/~juergen/impact-on-most-valuable-companies.html。
雷鋒網:要研發(fā)出這種自我完善的AI,最大的挑戰(zhàn)在那里?
Jürgen Schmidhuber:深度學習主要是通過監(jiān)督學習進行模式識別。LSTM本身也是一種監(jiān)督學習方法,因此在沒有“老師”的情況下,它是無法成為能解決未知環(huán)境中各種問題的“真正的AI”。這就是為什么在30年的時間里,我一直在研究更加通用的AI。
元學習來是最近30年來關注焦點之一,自上世紀90年代,無監(jiān)督學習展現(xiàn)出了我所說的“機器好奇心”(Artifical curiosity)和創(chuàng)造力,它們創(chuàng)造了自己的目標和試驗來了解世界的運作方式以及能做的事情,這種AI可能會使用LSTM作為其學習預測行為的一個子模塊,像孩子一樣不斷去解決發(fā)現(xiàn)和解決它們自己的全新的問題,最終成為一個能解答通用問題的AI。在這當中,最大的挑戰(zhàn)在于,如何將這些通用類型的元學習和“機器好奇心”進一步擴大。
(Jürgen Schmidhuber接受媒體采訪)
雷鋒網:最近Fran?ois Chollet(Keras的作者)發(fā)推稱,深度學習的研究進入了一個平臺期。您怎么看這一觀點?
Jürgen Schmidhuber:如果要說平臺期的話,深度學習的基礎研究可能在上一個千年就進入了平臺期了,我們做的無非在舊的方法下做小的改進而已(笑)。今天的深度學習主要基于LSTM和CNN,二者都是在上個世紀提出的理論,但近幾年來,隨著計算能力的提升和成本的下降,它們開始被廣泛應用于商業(yè)領域。
一個比摩爾定律更古老的趨勢是,一美元能買到的計算力在5年間大約增長10倍,從Konrad Zuse在1935-41年發(fā)明了第一臺可以編程工作的計算機來,75年后,我們現(xiàn)在的計算能力大約是當時的千萬億倍。
問:在您看來,深度學習能力現(xiàn)在發(fā)展到了什么程度?
Jürgen Schmidhuber:現(xiàn)在的深度學習主要是模式識別,比如你問Google,最近的餐館在哪里?這是一種被動的方式?,F(xiàn)在人工神經網路會對外部的信號做一個認知,觀察,對它做一個簡單的處理,但這遠遠沒有達到人類那樣收集到信號后對其可以進行深度加工和解析的程度。要達到這種程度,我們需要做一些更精細的人工智能,比如說增強學習,它可以通過獎勵回饋的機制,去優(yōu)化它的深度學習這種表現(xiàn)形式。我們現(xiàn)在沒有的,就是讓機器人像我們的嬰兒一樣的,看著你做東西就可以把它識別出來的通用能力,這方面的研究剛剛興起,但遠遠沒有達到人的程度。
現(xiàn)在大家能接觸到的應用主要在手機里面,比如翻譯、識別等,這里面的主要技術是LSTM,是我在97年提出的理論,隨著近期計算能力的飛躍提升,這一方法的優(yōu)勢開始體現(xiàn)出來,與傳統(tǒng)的機器學習方法相比最大的不同是,傳統(tǒng)的機器學習是一種單向的向前進的學習方式,但LSTM是一種遞歸式、回饋上一個節(jié)點,通過不斷的循環(huán)的機器學習方式,這也是LSTM最大的優(yōu)勢所在。
傳統(tǒng)的單向式學習方法是一種預編程式的計算方法,需要人去預先編程,而LSTM可以進行通用計算,這也使得LSTM可以進行各種層次的運算,不管是并行的還是串行的,都可以通過這種通用的方式來進行計算,特別是在翻譯、機器識別方面很有效。
具體應用上,我不知道微信是否有在用LSTM,但Facebook每天會基于LSTM進行45億次的計算,主要應用在它的語言翻譯方面。Google也在翻譯上應用LSTM,一開始機器對于語言是一無所知的,你給了它兩個語言翻譯前后的對比,它會去逐步學習這當中的語言結構、語義等,漸漸的機器就學會了語言的翻譯。我聽說在2016年的11月前,Google翻譯中文是會鬧出很多笑話的,但在那之后,因為Google使用了LSTM,翻譯的效果有了顯著提升。同樣在2015年,Google開始在翻譯中將老的技術換成基于LSTM的模型的時候,當時不是有5%、10%的效果提升而是50%的飛躍式的效果提升。
問:您認為在未來5年內人工智能會如何發(fā)展?
Jürgen Schmidhuber:在五年內,我們最好的自我學習機器人可能還無法達到孩子甚至某些動物的智能水平,但我認為不久后我們有望建立一個基于NN的人工智能(NNAI),通過逐步學習成為至少和動物一樣聰明、具有好奇心、可以持續(xù)學習進行規(guī)劃和推理,將各種各樣問題分解為可快速解決(或已解決)的子問題的AI。
問: 您認為現(xiàn)在的AI應用是更加貼近于企業(yè)機構還是更貼近于個人?
Jürgen Schmidhuber: 我們公司現(xiàn)在做的是一個B2B的生意,但如果你看我們公司(Nnaisense)的Logo,當中的A是一個倒A,在數(shù)學里這是“For All”的意思,我們希望AI的應用最終是能夠造福全人類的。以后可能有一段可以賦予AI學習能力的源代碼,而這樣的源代碼可以被所有人使用,而不僅僅是現(xiàn)在的巨頭可以使用AI的這種能力一樣。在未來AI可能會發(fā)展成像生物圈這樣一個多層次、多樣化的情況。
問:最近Facebook有兩個機器人對話,大家覺得很危險,后來這個項目被Facebook關掉了,現(xiàn)在對于人工智能的爭議也很大,想問一下未來機器人會不會取代人類?
Jürgen Schmidhuber:早在1990年代,科學家已經做過了類似的機器人對話。從更宏觀的角度來講,我們應該去討論我們是否去擔心,當AI應用在軍事用途的時候會不會造成一些不好的影響。現(xiàn)在AI技術也有被用在如控制軍用無人機上,但宏觀角度講, 我不是很擔心AI帶來的變化,因為我們已經達到了自我毀滅能力的最大可能性,全世界有數(shù)千核彈頭和運載它們的導彈,即使沒有AI,如果我們打起核戰(zhàn)爭,幾小時內地球會毀滅掉,所以我并不是很擔心AI帶來的附加威脅。AI并沒有把我們自我毀滅能力變得更大。
從生物學的角度,我們應該擔心的是和你相近的物種、而且和你有著共同目標的種群。有著共同的目標意味著你們或者會有合作,或者是競爭。最極端的合作方式就是婚姻,最極端的競爭方式就是戰(zhàn)爭。當有相同目標的時候,它會更傾向于被彼此吸引,政客對其他政客感興趣、CEO對其他CEO感興趣,7歲的小女孩對其他7歲的小女孩感興趣,袋鼠關心袋鼠。同樣,當超人工智能出現(xiàn)的時候,它關心的不是我們,而是其他超人工智能的更可能是另一個超人工智能,而非人類或者袋鼠。
在終結者或者黑客帝國里,我們看到AI奴役人類的情景,在我看來是非常愚蠢的,因為人類對AI來說是非常不好用的,它完全可以在很短時間內制造一大批效率比我們高的機器人,更快地完成他們的目標,人遠遠不是他們要奴役的工具。
點擊此處可下載Jürgen Schmidhuber演講Slide
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。