1
本文作者: 黃鑫 | 2016-06-17 19:27 |
現(xiàn)在的人工智能還處于一個摸索階段,對話機器人的開發(fā)者們都在從最基礎(chǔ)的程度開始制作深度學(xué)習(xí)。最終做出的產(chǎn)品也千差萬別。但最終歸納起來大致的方法都屬于同樣幾類。
最初大家用的都是最容易實現(xiàn),也最容易想到的:關(guān)鍵詞匹配的方式,到后來開始慢慢出現(xiàn)根據(jù)語序結(jié)構(gòu)來判斷用戶語言內(nèi)容的手段,現(xiàn)在,橫掃整個人工智能行業(yè)的深度學(xué)習(xí)也被運用到對話機器人的訓(xùn)練中了。
加拿大皇家科學(xué)院的院士最近提出了一個應(yīng)用于他們產(chǎn)品上的,一種比較創(chuàng)新的深度學(xué)習(xí)理論和架構(gòu)。通過這個架構(gòu),他們的產(chǎn)品“薄言豆豆”可以進行自主學(xué)習(xí),更新對話的應(yīng)對內(nèi)容。
李明院士表示,自己和團隊在人工智能的基礎(chǔ)理論上下了很大的功夫,他認(rèn)為人工智能的進步一定會是因為基礎(chǔ)理論的進步而不是工程學(xué)上(如關(guān)鍵字的匹配技巧)的進步。
以下是李明院士在第三屆機器人峰會中的演講,關(guān)于薄言豆豆架構(gòu)原理的部分。
NLPCC在2015年10月份組織了一個測試,設(shè)計了1千個用來問機器人的問題,這1千個問題測試了現(xiàn)在中國最先進的對話技術(shù)。參與測試的對話機器人有薄言豆豆、圖靈機機器人,出門問問。還有小I機器人、微軟小冰,和百度度秘。這其中出門問問最近融資了7千萬美元,微軟小冰有4千萬用戶,百度度秘曾經(jīng)跟李克強總理對話過,還博得了總理的喜愛。但是這哥第三方測試的結(jié)果是:及格的只有豆豆一個。其他的都不及格,而豆豆也是剛剛及格,60分出頭。第二是圖靈機器人,出門問問,百分之十幾,小I,小冰,小度都不及格。其他的機器人可能擅長對話而不是回答問題。但是我覺得一個聊天機器人,只會瞎說八道肯定是不行的。知識就是力量,你要想做好一個聊天機器人,就必須要有大量的知識做后盾。
人類的智能,就是從說話開始的。語言賦予了人們組織和更進一步思考的能力。而人工智能的革命,我們覺得也是從學(xué)習(xí)語言開始。這就是我們現(xiàn)在正在做的事。我們覺得這也非常振奮人心。但是機器人怎么學(xué)說話呢?大家都聽說過Alphago,Alphago在跟歐洲圍棋冠軍下棋的時候,棋力還不怎么樣。但是之后的4、5個月他跟自己下了三千萬盤棋,從中它的能力增加了很多,跟李世石下棋的時候,李世石幾乎是一點機會沒有。Alphago是這三千萬盤棋不是白下的,它下完了能知道自己是輸還是贏。通過輸和贏的反饋結(jié)果他就可以改進它的價值網(wǎng)絡(luò)。知道走哪步容易輸走哪步容易贏,這樣訓(xùn)練它的神經(jīng)網(wǎng)絡(luò)。但是說話怎么辦?怎么判斷它的話說得是好還是壞,現(xiàn)在市面上有很多機器人告訴大家它們會學(xué)習(xí),他們的機器人會通過用戶的反映來學(xué)習(xí),這句話100%不靠譜。第一大家聽說過小冰的事。就是如果用戶教你一些壞事,你沒法把它篩選掉的話,就會很麻煩。第二,你的用戶才幾個啊?AlphaGo跟自己下了3千萬盤棋,每盤棋能走好幾百步,這樣多的數(shù)據(jù)量不可能能從用戶那來的,用戶數(shù)據(jù)的量級根本沒有那么大。如果要讓計算機學(xué)說話,必須訓(xùn)練計算機跟自己說話,光自己跟自己說話還不行,你還得要有一個辦法來估計這個話說得好還是不好,所以這是件特別難的事。比Alphago下圍棋難得多,以下我給大家介紹我們薄言怎么樣用我們的數(shù)學(xué)理論解決這件事情。
讓薄言豆豆自己跟自己說話。比下圍棋難得多。這里我們講一個很小的側(cè)面,我來介紹一個數(shù)學(xué)理論,這個數(shù)學(xué)理論可以教會你怎么樣來估計這句話說得好還是不好。我說一個很小的例子,他要學(xué)習(xí)類似的問題。比如天氣問題?直接教你說話的話,我教你今天天氣怎么樣。你學(xué)習(xí)之后可能可以可以回答今天天氣怎么樣,比如天氣挺熱的等等。但是如果我換個問法,我問明天怎么樣。你就要去寫個新的模板,對話的變化是無窮無盡的。所以這樣寫模板不行,最好的辦法是有一個理論,定義什么叫語意相似性,什么東西相似什么東西不相似。這是我們要解決的問題。也是人工智能50年還沒有解決的問題。但是我希望提出對這個問題的一個另類的解決方法。這是豆豆所用的來學(xué)習(xí)一個句子的相似形的LSTM算法,說起來比較復(fù)雜。不過這個東西最關(guān)鍵的是用我說這兩個相似,那最后到底是相似還是不相似?你必須得給我反饋,必須得有一個辦法告訴我是不是相似。
那怎么反饋?這需要設(shè)計一個的最基本的理論概念,數(shù)學(xué)概念。叫“語義距離”。這是非常重要的概念,但是人工智能做了50年沒有人知道怎么算,怎么定義。這就跟大家知道圖靈那個機器人一樣,這個東西有一個概念,但是沒法定義到底它是個什么東西,它是不可計算的,語義就是這么一個東西。語義是不可計算,不可定義的。我們要知道今天天氣怎么樣,我要知道這個語義距離是0。那我怎么定義一個數(shù)學(xué)理論來解決這個問題?我希望我在這能夠給大家解釋一個通俗一點的解釋。我先給大家定義一個別的東西:比如有兩句話,我要定義這兩句話之間的,任何兩個實體之間的距離,只要有信息就會有,我們將它定義為“信息距離”。然后我拿信息距離來近似描述“語義距離”。
那么我們怎么做?我們是從一個特別漂亮的數(shù)學(xué)理論開始的。我們出發(fā)點是用物理公理推導(dǎo)出所有要做的事。這是我們跟所有其他廠家的不一樣的。這個理論是5個人共同發(fā)明的,我是其中之一。
我首先要定義信息距離,這個信息距離是非常復(fù)雜的東西,不能用傳統(tǒng)定義,因為傳統(tǒng)的定義肯定不行。那我怎么辦?比如我們有X、有Y兩個信息載體,現(xiàn)在我需要計算兩個信息載體之間的距離,怎么算?我們給信息距離的定義就是說這兩個信息X、Y之間的距離就是轉(zhuǎn)換他們之間所需要的能量,就是比特數(shù),不可逆的這個數(shù)。我們證明了一個定理,就是最小的信息量可以用這個公式表示,這個K是一種復(fù)雜性。如果大家感興趣可以看我們的書,這本書是我寫的。轉(zhuǎn)換X、Y所需要的最小的能量,我就定義為X、Y之間的信息距離:D(X、Y)。
上面是信息距離,我們之前說的叫語義距離,我們用信息距離去近似語義距離。而且我能證明一件事,如果你有任何可計算的距離模擬近似語義距離。那我這個信息距離一定比你?。∧敲淳褪钦f我這個距離比你好。你根本不用去計算什么語義距離,近似度,就算系距離就夠了。我一定比你好。好了,現(xiàn)在就是咱們從理論,中間證明過程不說了。從理論上解決了語義距離,不可逆,不可定義的辦法。這個雖然不可計算,但是信息距離的定義就是說我要壓縮編碼就可以了。所以在自然語言方面基本上可以用。所以這樣我給豆豆提供了一個理論。
我覺得人工智能的進步,一定要靠首先是理論的進步,而不應(yīng)該是工程上的什么關(guān)鍵字,什么模板匹配。
李明院士堅信理論基礎(chǔ)的建立才是應(yīng)用進步的基礎(chǔ),也在堅持貫徹著這個理念,事實上我們也認(rèn)同這個觀點,這也是最近圖靈測試遭受的質(zhì)疑的思路:即使一個機器人能根據(jù)匹配和搜索關(guān)鍵字完美的回答你的所有問題,甚至讓你分辨不出它到底是人還是機器人。也不意味著它就擁有了思維能力。只有人工智能的理論不斷發(fā)展,當(dāng)我們真正探索出一種能夠創(chuàng)造出智能的手段,才能賦予機器人真正的“智能”。
馮·諾依曼在某次演講中說:只要你把被認(rèn)為是計算機無法解決的問題描述清楚,計算機就總能找到一種方法解決它。而目前我們最需要的也正是對希望計算機解決的問題的精確定義。這么看來,李明院士和他的團隊對語言的含義和效果給出的定義“語義距離”和“信息距離”兩個概念或許能成為AI領(lǐng)域未來進步的基石之一。讓我們期待這些睿智的學(xué)者和科學(xué)家們在制造出越來越有人性味的產(chǎn)品的同時,也在AI的理論領(lǐng)域做出更多的突破。
題圖來自xuite.net
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。