2
本文作者: 史中 | 2017-01-14 23:07 |
雷鋒網(wǎng)按:六十年前初識計算機的時候,人們就在想:是否有一天我們可以創(chuàng)造出一種人工智能,達到甚至超越我們?nèi)祟惖闹悄芩健?/span>
幾十年過去了,AI 經(jīng)過了幾個寒冬。我們?nèi)匀粵]有了卻幾十年前的心愿。今天,人工智能再一次火爆全球,我們似乎看到了人類科學正在加速沖向那個奇點。產(chǎn)業(yè)界和學術(shù)界都在不遺余力地進行 AI 研究,甚至流行的美劇《西部世界》也在討論人工智能。
站在今天的時點上,人工智能到底有什么突破,未來的人工智能會向什么方向前進呢?
四位人工智能界的泰斗大牛在未來論壇2017年會的圓桌對話上發(fā)表了自己的看法。
他們分別是:
李飛飛 美國斯坦福大學計算機科學系終身教授、人工智能實驗室主任
李凱 普林斯頓大學 Paul & Marcia Wythes 講席教授,美國工程院院士,未來論壇科學委員會委員
沈向洋 微軟全球執(zhí)行副總裁,微軟人工智能及微軟研究事業(yè)部負責人,未來論壇理事
張鈸 清華大學計算機系教授、中國科學院院士、清華大學智能技術(shù)與系統(tǒng)國家重點實驗室學術(shù)委員會名譽主任
【畫面從左至右分別為:主持人洪小文、李飛飛、李凱、沈向洋、張鈸】
雷鋒網(wǎng)在第一時間記錄整理了四位大牛的精彩發(fā)言。他們似如山巔上的先知,通過他們的預言,似乎可以窺見人工智能的下一個春天。
---
Part1:對于目前人工智能的理解
---
大家都說人工智能可以做很多事情,我想先說說人工智能目前還不能做什么。
人工智能學科從創(chuàng)立到現(xiàn)在,只往前走了兩步。
以前人工智能只是建立在數(shù)學模型的基礎(chǔ)上。而推理模型在數(shù)學模型的基礎(chǔ)上,把問題變成:如果可以把這個問題清晰地表述出來,用陳述性或過程性的語言,那么計算機就能解決它。
當這個模型被提出來,人工智能解決問題的能力提高了一大步。這樣,可解的問題就遠比用數(shù)學表達的問題多得多。
實際上,當時對人工智能的估計過高。因為人們發(fā)現(xiàn),能“清楚表達”的問題很少。及時是理性思考,有很多問題都不能表述。
這又讓人工智能向前邁了一步,而且這一步比前一步大得多。
之前,我們可以用計算機解決的問題是“知其然又知其所以然”的問題。而有了深度學習,我們也可以解決“知其然而不知其所以然”的問題。特別是可以解決感知、視覺、聽覺等方面的問題,例如:張三長什么樣子,這個實在是不好表述。
我們身邊充滿“說不清道不明”的問題,用新的深度學習技術(shù)可以解決很多這類問題。但是,我們的人工智能還沒有到頂峰。
目前的人工智能有三個限制條件。
1、確定性
2、完全的知識和信息
3、封閉化、特定化的問題
一個典型的人工智能可以解決的問題就是:阿法狗下圍棋。
圍棋有著確定的規(guī)則和目標;
對方如何下子,盤面的信息,完全可以知道;
而所有答案的可能性是一個封閉的。
處理帶有這三個限制條件的問題,計算機肯定比人類好。但是如果缺一個條件,計算機就非常難完成了。例如打橋牌,答案不是封閉的,計算機就很難做了。
一年以前,如果我和微軟小冰聊天。我說我叫張鈸,小冰就會傻眼了。因為他沒有我的信息。我如果說我是章子怡,小冰應(yīng)該可以聊下去。所以,盡管小冰很厲害,但是和人的智能還是差得多。
深度學習目前有兩個很難克服的重要缺點:
1、魯棒性差。機器學習過的內(nèi)容,和沒學習過的內(nèi)容,在識別效果方面差距太大。例如一個模式識別系統(tǒng),經(jīng)過訓練可以很好地識別馬、牛、羊。你給它一塊石頭,它有可能認為是馬。
2、機器數(shù)據(jù)輸入和輸出結(jié)果差距太大。人的智能是舉一反三,而機器是舉一百反一。給幾百萬的數(shù)據(jù),識別幾萬個目標。這和人類是背道而馳的。
所以,現(xiàn)在的人工智能還有很長的路要走。
很多朋友都知道我剛剛生了我們家的老二,還不到一歲大。
作為人工智能研究者,我很高興能體會當媽媽的感覺。之前張鈸老師說感知代表了很多“不知其所以然”的問題,在現(xiàn)在大規(guī)模數(shù)據(jù)標注的情況下,都可以解決。
我覺得人工智能的下一步應(yīng)該是認知。
認知包括很多我們還不太清楚怎么用數(shù)學和人工智能表達的。比如:知識系統(tǒng)的建立、情感的產(chǎn)生和交流、好奇心和創(chuàng)造力驅(qū)動的學習,還有 learning to learn。這些都是認知的范疇。
確實,我們?nèi)斯ぶ悄苡钟瓉砹舜禾?,但下面確實還有很長的路要走。
我認為下一步人工智能的發(fā)展,需要加強對情感,情緒的了解,要走進認知學,心理學。我說的不僅是腦科學,而是認知學。因為我們目前對人的情感理解非常少,而這對于人工智能來說是很重要的。
作為人工智能學者,能夠得到這么多關(guān)注,我很高興。但是我也擔心這樣的“泡沫”會帶來什么。如果是更多的機會和研發(fā)投入,當然是好事;如果是過度承諾或者不切實際的產(chǎn)品研究工作,可能會對這個領(lǐng)域有些不好的影響。
我參加過很多論壇,大家都在問:人工智能什么時候能超過人?一般專家都會推斷通用人工智能超過人的時間,一定在他去世之后的某個時點,例如:五十年后。到了要驗證正確與否的時候,他已經(jīng)不在了,也就不會有人追究他了。(笑)
但人們提出這個問題的時候,有一個假設(shè)條件,那就是:假定人自身的智能不再往前走了。
但是,實際上人的智能還是往前發(fā)展的。如果現(xiàn)在我們對人的大腦有了新的了解,就可以很快幫助我們提高自己的智能。而人堆大腦的了解,也可以幫助提高人工智能的水平。
深度學習,實際上是把我們對人腦神經(jīng)網(wǎng)絡(luò)非常簡單的理解變成算法。然后加之以數(shù)據(jù),發(fā)現(xiàn)智能效果很好。但是,這些人腦神經(jīng)的只是都是三四十年以前的知識。而我們在期待腦科學有新的突破,這些新的知識一定可以推進人工智能的一大步。所以說,智能這條路是很長很長的。無論對于機器,還是對人。
我在工業(yè)界工作,對人工智能的發(fā)展還是持非常樂觀的態(tài)度的。
雖然張鈸老師講人工智能存在種種問題,但是我們現(xiàn)在有數(shù)據(jù),有新的算法。我很相信,
五年之內(nèi),語音識別技術(shù)一定可以超過人;
十年之內(nèi),機器視覺一定比人好。
可以據(jù)此我們可以想象未來是怎樣的圖景。
站在今天來看,我們所有的商業(yè)應(yīng)用都被顛覆了。從銷售市場,到人事招聘,到用戶服務(wù),所有的商業(yè)環(huán)節(jié)都被 AI 改變了,所以從商業(yè)角度來看,我看到的是更多的機會。
---
Part2:這次人工智能的復興,要感謝深度學習和大數(shù)據(jù)。那么,深度學習到底是什么,未來可以看到它怎樣的發(fā)展?為了人工智能的終極目標,除了深度學習意外,我們還需要哪些其他的研究方向?
---
五十年后的事情可能我說不清楚,但是我可以說說三五年之后的事情。很多人說究竟現(xiàn)在是人工智能的春天還是夏天?有人說春天,因為正在蓬勃發(fā)展。有人說夏天,因為有點熱過頭了。
但是我說現(xiàn)在是人工智能的秋天。秋天有兩個含義。
人工智能現(xiàn)在有果實可摘。為什么我覺得很樂觀?因為我覺得人工智能所需的三個資源都是無限的。
1、大數(shù)據(jù)
2、算法
3、計算力
未來相當一部分人都會往這個方向去做,會在包括語音、圖像方面取得很好的成果。
做科學研究,我們要知道冬天要來了。這意味著我們要考慮下一個春天要播種什么種子。也就是說,后深度學習時代,我們要搞什么事。
說到腦科學。人腦有很多層次。其中的智能分布還有大量內(nèi)容我們并不了解,這些從頂下下,側(cè)向連接等等模式,我們都還不了解。
目前,我們對腦科學只學了一點,就有了這么多成果。如果我們研究更多,一定會有更多的成果?;趯θ四X的深度研究,結(jié)合神經(jīng)科學和腦科學,我們要發(fā)展新的計算模型。
這兩個能力對于現(xiàn)在的人工智能是很重要的?,F(xiàn)在為止驅(qū)動人工智能就有兩招:數(shù)據(jù)驅(qū)動和知識驅(qū)動。下面的發(fā)展就要把兩招結(jié)合起來。特別是自然語言處理,離不開知識驅(qū)動,只靠數(shù)據(jù)是不夠的。
如果這兩個能做好,人工智能就會迎來下一個春天。
說到深度學習,“深度學習”大概在2006年被提出來,但是在2006年之前,“神經(jīng)網(wǎng)絡(luò)”這個概念已經(jīng)存在了二三十年。神經(jīng)網(wǎng)絡(luò)領(lǐng)域里,很重要的里程碑是back-propagation。在九十年代,計算機視覺方面做出了 Convolutinal neuron networks,今年的 Deeplearning 基本是這個結(jié)構(gòu)。
現(xiàn)在大部分成功的深度學習是神經(jīng)網(wǎng)絡(luò)是有監(jiān)督學習。有完全的數(shù)據(jù)標注以后做的。
很多人都在思考如何做無監(jiān)督的學習,之前也有很多工具。深度學習革命性的一點是取代了對特征的加工。像之前的 SVM,都是“Engineering Feature”,而深度學習是直接學習數(shù)據(jù)。
深度學習不操作數(shù)據(jù)本身,而是對結(jié)構(gòu)本身進行操作。這就造成了一種感受,深度學習本身結(jié)構(gòu)太復雜了,例如152層,1001層。這里有巨大的空間,可以突破結(jié)構(gòu)的層面。我認同張鈸老師說的,數(shù)據(jù)和知識的結(jié)合。
現(xiàn)在我們的 AI 都是用邏輯的方法來判斷情感。因為邏輯代表 IQ,而情感代表 EQ。人類的情感是非常豐富的。未來,從情緒到情感,最是人工智能未來前進的方向。
任何工作都有近期和遠期。近期人工智能的發(fā)展,我很認同李飛飛講的,和深度學習有關(guān)。機器學習和以前的專家系統(tǒng)有一個非常不同的地方。專家系統(tǒng)是用軟件把人的知識寫到系統(tǒng)里。機器學習輸入的是算法+知識,輸出的是程序。
我和李飛飛和做的時候,我們兩個是比較另類的的研究者。大多數(shù)人在算法上做,我們覺得應(yīng)該發(fā)展知識。知識就相當于上學的時候的教科書??傄腥藢懡炭茣?strong>如果沒有人寫教科書的話,學習方法再好,老師再好,你學的是一年級的教科書,也不可能成為博士。所以我覺得很多領(lǐng)域都需要有人寫教科書。
學術(shù)界很多人的目標不是產(chǎn)生巨大的貢獻和影響力。需要寫很多文章,這樣可以拿到很多資金。我們做的時候沒有資金——申請的時候被拒絕了。
近期人工智能要想發(fā)展,一定需要有人做知識的積累和總結(jié)。
長遠來看,我認同兩位的意見,對人的大腦,人的智力是怎么工作的,要有更多的了解。這樣才會幫助整個 AI 向前走。
我很贊同各位的說法。在商業(yè)上,接下來三五年毫無疑問 AI 可以幫助我們解決很多問題。但是秋天過了,冬天我們要做什么呢?
我覺得有兩點。
第一點,我覺得數(shù)據(jù)很多、算法互通,確實是取之不盡的。但是在計算能力這件事上,我們應(yīng)該更加重視。幾十年下來的摩爾定律,讓我們可以把人工智能做到了今天,這是非常了不起的飛速增長的五十年。但是工業(yè)界普遍會認為,計算能力會慢慢降下來。這也是大家為什么都在非常認真地去做量子計算,也要到十年、十五年才能看到突破。
今天我們 AI 向前走必須要考慮的問題是:計算能力的瓶頸。
第二點,我們要考慮為什么做 AI。是不是計算能力的增強,就一定會產(chǎn)生智能。從人腦的結(jié)構(gòu)來看,我們應(yīng)該定義一個小目標:利用符號學和深度學習做一些結(jié)合,希望在腦科學和人工智能結(jié)合上,解決幾個了不起的問題。我自己想要解決三個和人腦息息相關(guān)的病。
兒童孤獨癥
中年憂郁癥
老年癡呆癥
人工智能如果能解決這三個問題,就是相當了不起的成就。
有關(guān)計算能力方面我想做一下補充。
同樣的一個題目,在我們腦里解決一點不費勁,為什么在計算機里面就要這么多的計算資源來弄?我們要思考的是這個問題,而不是拼命加快計算機。
我覺得,正是因為我們過去走的這條路,迫使我們必須加快計算力。我的觀點是,我們過去做的計算機,從空間結(jié)構(gòu)來講是最簡單的,馮·諾依曼結(jié)構(gòu)。而大腦的空間結(jié)構(gòu)最復雜。你想用一個空間結(jié)構(gòu)最簡單的東西去做空間結(jié)構(gòu)復雜的工作,它花去的代價就是計算時間的增加。世界上沒有免費的午餐。
過去我們使用大量的計算時間來換取同樣的結(jié)果,現(xiàn)在能不能改變思路。把計算機做一下改變,例如 IBM 公司正在做,讓神經(jīng)網(wǎng)絡(luò)的復雜度提高,換來能耗和時間的降低。
至于量子計算,我覺得不要指望,量子計算不可能代替現(xiàn)在的計算機。我們要在現(xiàn)在的計算機基礎(chǔ)上進行改造,也就是研究是不是能夠加快計算機的運行。
更多人工智能內(nèi)容,請關(guān)注雷鋒網(wǎng)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。