加拿大皇家科學(xué)院李明院士:唯有理論的進(jìn)化才能給人工智能帶來(lái)質(zhì)變

本文作者：黃鑫

2016-06-17 19:27

導(dǎo)語(yǔ)：沒(méi)有基礎(chǔ)理論的研究就像在黑暗中摸索尋找，很難找到真正的價(jià)值所在。

現(xiàn)在的人工智能還處于一個(gè)摸索階段，對(duì)話機(jī)器人的開發(fā)者們都在從最基礎(chǔ)的程度開始制作深度學(xué)習(xí)。最終做出的產(chǎn)品也千差萬(wàn)別。但最終歸納起來(lái)大致的方法都屬于同樣幾類。

最初大家用的都是最容易實(shí)現(xiàn)，也最容易想到的：關(guān)鍵詞匹配的方式，到后來(lái)開始慢慢出現(xiàn)根據(jù)語(yǔ)序結(jié)構(gòu)來(lái)判斷用戶語(yǔ)言內(nèi)容的手段，現(xiàn)在，橫掃整個(gè)人工智能行業(yè)的深度學(xué)習(xí)也被運(yùn)用到對(duì)話機(jī)器人的訓(xùn)練中了。

加拿大皇家科學(xué)院的院士最近提出了一個(gè)應(yīng)用于他們產(chǎn)品上的，一種比較創(chuàng)新的深度學(xué)習(xí)理論和架構(gòu)。通過(guò)這個(gè)架構(gòu)，他們的產(chǎn)品“薄言豆豆”可以進(jìn)行自主學(xué)習(xí)，更新對(duì)話的應(yīng)對(duì)內(nèi)容。

李明院士表示，自己和團(tuán)隊(duì)在人工智能的基礎(chǔ)理論上下了很大的功夫，他認(rèn)為人工智能的進(jìn)步一定會(huì)是因?yàn)榛A(chǔ)理論的進(jìn)步而不是工程學(xué)上（如關(guān)鍵字的匹配技巧）的進(jìn)步。

以下是李明院士在第三屆機(jī)器人峰會(huì)中的演講，關(guān)于薄言豆豆架構(gòu)原理的部分。

NLPCC在2015年10月份組織了一個(gè)測(cè)試，設(shè)計(jì)了1千個(gè)用來(lái)問(wèn)機(jī)器人的問(wèn)題，這1千個(gè)問(wèn)題測(cè)試了現(xiàn)在中國(guó)最先進(jìn)的對(duì)話技術(shù)。參與測(cè)試的對(duì)話機(jī)器人有薄言豆豆、圖靈機(jī)機(jī)器人，出門問(wèn)問(wèn)。還有小I機(jī)器人、微軟小冰，和百度度秘。這其中出門問(wèn)問(wèn)最近融資了7千萬(wàn)美元，微軟小冰有4千萬(wàn)用戶，百度度秘曾經(jīng)跟李克強(qiáng)總理對(duì)話過(guò)，還博得了總理的喜愛(ài)。但是這哥第三方測(cè)試的結(jié)果是：及格的只有豆豆一個(gè)。其他的都不及格，而豆豆也是剛剛及格，60分出頭。第二是圖靈機(jī)器人，出門問(wèn)問(wèn)，百分之十幾，小I，小冰，小度都不及格。其他的機(jī)器人可能擅長(zhǎng)對(duì)話而不是回答問(wèn)題。但是我覺(jué)得一個(gè)聊天機(jī)器人，只會(huì)瞎說(shuō)八道肯定是不行的。知識(shí)就是力量，你要想做好一個(gè)聊天機(jī)器人，就必須要有大量的知識(shí)做后盾。

人工智能的革命從機(jī)器學(xué)習(xí)對(duì)話開始

人類的智能，就是從說(shuō)話開始的。語(yǔ)言賦予了人們組織和更進(jìn)一步思考的能力。而人工智能的革命，我們覺(jué)得也是從學(xué)習(xí)語(yǔ)言開始。這就是我們現(xiàn)在正在做的事。我們覺(jué)得這也非常振奮人心。但是機(jī)器人怎么學(xué)說(shuō)話呢？大家都聽說(shuō)過(guò)Alphago，Alphago在跟歐洲圍棋冠軍下棋的時(shí)候，棋力還不怎么樣。但是之后的4、5個(gè)月他跟自己下了三千萬(wàn)盤棋，從中它的能力增加了很多，跟李世石下棋的時(shí)候，李世石幾乎是一點(diǎn)機(jī)會(huì)沒(méi)有。Alphago是這三千萬(wàn)盤棋不是白下的，它下完了能知道自己是輸還是贏。通過(guò)輸和贏的反饋結(jié)果他就可以改進(jìn)它的價(jià)值網(wǎng)絡(luò)。知道走哪步容易輸走哪步容易贏，這樣訓(xùn)練它的神經(jīng)網(wǎng)絡(luò)。但是說(shuō)話怎么辦？怎么判斷它的話說(shuō)得是好還是壞，現(xiàn)在市面上有很多機(jī)器人告訴大家它們會(huì)學(xué)習(xí)，他們的機(jī)器人會(huì)通過(guò)用戶的反映來(lái)學(xué)習(xí)，這句話100%不靠譜。第一大家聽說(shuō)過(guò)小冰的事。就是如果用戶教你一些壞事，你沒(méi)法把它篩選掉的話，就會(huì)很麻煩。第二，你的用戶才幾個(gè)??？AlphaGo跟自己下了3千萬(wàn)盤棋，每盤棋能走好幾百步，這樣多的數(shù)據(jù)量不可能能從用戶那來(lái)的，用戶數(shù)據(jù)的量級(jí)根本沒(méi)有那么大。如果要讓計(jì)算機(jī)學(xué)說(shuō)話，必須訓(xùn)練計(jì)算機(jī)跟自己說(shuō)話，光自己跟自己說(shuō)話還不行，你還得要有一個(gè)辦法來(lái)估計(jì)這個(gè)話說(shuō)得好還是不好，所以這是件特別難的事。比Alphago下圍棋難得多，以下我給大家介紹我們薄言怎么樣用我們的數(shù)學(xué)理論解決這件事情。

讓薄言豆豆自己跟自己說(shuō)話。比下圍棋難得多。這里我們講一個(gè)很小的側(cè)面，我來(lái)介紹一個(gè)數(shù)學(xué)理論，這個(gè)數(shù)學(xué)理論可以教會(huì)你怎么樣來(lái)估計(jì)這句話說(shuō)得好還是不好。我說(shuō)一個(gè)很小的例子，他要學(xué)習(xí)類似的問(wèn)題。比如天氣問(wèn)題？直接教你說(shuō)話的話，我教你今天天氣怎么樣。你學(xué)習(xí)之后可能可以可以回答今天天氣怎么樣，比如天氣挺熱的等等。但是如果我換個(gè)問(wèn)法，我問(wèn)明天怎么樣。你就要去寫個(gè)新的模板，對(duì)話的變化是無(wú)窮無(wú)盡的。所以這樣寫模板不行，最好的辦法是有一個(gè)理論，定義什么叫語(yǔ)意相似性，什么東西相似什么東西不相似。這是我們要解決的問(wèn)題。也是人工智能50年還沒(méi)有解決的問(wèn)題。但是我希望提出對(duì)這個(gè)問(wèn)題的一個(gè)另類的解決方法。這是豆豆所用的來(lái)學(xué)習(xí)一個(gè)句子的相似形的LSTM算法，說(shuō)起來(lái)比較復(fù)雜。不過(guò)這個(gè)東西最關(guān)鍵的是用我說(shuō)這兩個(gè)相似，那最后到底是相似還是不相似？你必須得給我反饋，必須得有一個(gè)辦法告訴我是不是相似。

判斷訓(xùn)練效果的關(guān)鍵：“語(yǔ)義距離”和“信息距離”

那怎么反饋？這需要設(shè)計(jì)一個(gè)的最基本的理論概念，數(shù)學(xué)概念。叫“語(yǔ)義距離”。這是非常重要的概念，但是人工智能做了50年沒(méi)有人知道怎么算，怎么定義。這就跟大家知道圖靈那個(gè)機(jī)器人一樣，這個(gè)東西有一個(gè)概念，但是沒(méi)法定義到底它是個(gè)什么東西，它是不可計(jì)算的，語(yǔ)義就是這么一個(gè)東西。語(yǔ)義是不可計(jì)算，不可定義的。我們要知道今天天氣怎么樣，我要知道這個(gè)語(yǔ)義距離是0。那我怎么定義一個(gè)數(shù)學(xué)理論來(lái)解決這個(gè)問(wèn)題？我希望我在這能夠給大家解釋一個(gè)通俗一點(diǎn)的解釋。我先給大家定義一個(gè)別的東西：比如有兩句話，我要定義這兩句話之間的，任何兩個(gè)實(shí)體之間的距離，只要有信息就會(huì)有，我們將它定義為“信息距離”。然后我拿信息距離來(lái)近似描述“語(yǔ)義距離”。

那么我們?cè)趺醋觯课覀兪菑囊粋€(gè)特別漂亮的數(shù)學(xué)理論開始的。我們出發(fā)點(diǎn)是用物理公理推導(dǎo)出所有要做的事。這是我們跟所有其他廠家的不一樣的。這個(gè)理論是5個(gè)人共同發(fā)明的，我是其中之一。

我首先要定義信息距離，這個(gè)信息距離是非常復(fù)雜的東西，不能用傳統(tǒng)定義，因?yàn)閭鹘y(tǒng)的定義肯定不行。那我怎么辦？比如我們有X、有Y兩個(gè)信息載體，現(xiàn)在我需要計(jì)算兩個(gè)信息載體之間的距離，怎么算？我們給信息距離的定義就是說(shuō)這兩個(gè)信息X、Y之間的距離就是轉(zhuǎn)換他們之間所需要的能量，就是比特?cái)?shù)，不可逆的這個(gè)數(shù)。我們證明了一個(gè)定理，就是最小的信息量可以用這個(gè)公式表示，這個(gè)K是一種復(fù)雜性。如果大家感興趣可以看我們的書，這本書是我寫的。轉(zhuǎn)換X、Y所需要的最小的能量，我就定義為X、Y之間的信息距離：D（X、Y）。

上面是信息距離，我們之前說(shuō)的叫語(yǔ)義距離，我們用信息距離去近似語(yǔ)義距離。而且我能證明一件事，如果你有任何可計(jì)算的距離模擬近似語(yǔ)義距離。那我這個(gè)信息距離一定比你??！那么就是說(shuō)我這個(gè)距離比你好。你根本不用去計(jì)算什么語(yǔ)義距離，近似度，就算系距離就夠了。我一定比你好。好了，現(xiàn)在就是咱們從理論，中間證明過(guò)程不說(shuō)了。從理論上解決了語(yǔ)義距離，不可逆，不可定義的辦法。這個(gè)雖然不可計(jì)算，但是信息距離的定義就是說(shuō)我要壓縮編碼就可以了。所以在自然語(yǔ)言方面基本上可以用。所以這樣我給豆豆提供了一個(gè)理論。

我覺(jué)得人工智能的進(jìn)步，一定要靠首先是理論的進(jìn)步，而不應(yīng)該是工程上的什么關(guān)鍵字，什么模板匹配。

結(jié)語(yǔ)

李明院士堅(jiān)信理論基礎(chǔ)的建立才是應(yīng)用進(jìn)步的基礎(chǔ)，也在堅(jiān)持貫徹著這個(gè)理念，事實(shí)上我們也認(rèn)同這個(gè)觀點(diǎn)，這也是最近圖靈測(cè)試遭受的質(zhì)疑的思路：即使一個(gè)機(jī)器人能根據(jù)匹配和搜索關(guān)鍵字完美的回答你的所有問(wèn)題，甚至讓你分辨不出它到底是人還是機(jī)器人。也不意味著它就擁有了思維能力。只有人工智能的理論不斷發(fā)展，當(dāng)我們真正探索出一種能夠創(chuàng)造出智能的手段，才能賦予機(jī)器人真正的“智能”。

馮·諾依曼在某次演講中說(shuō)：只要你把被認(rèn)為是計(jì)算機(jī)無(wú)法解決的問(wèn)題描述清楚，計(jì)算機(jī)就總能找到一種方法解決它。而目前我們最需要的也正是對(duì)希望計(jì)算機(jī)解決的問(wèn)題的精確定義。這么看來(lái)，李明院士和他的團(tuán)隊(duì)對(duì)語(yǔ)言的含義和效果給出的定義“語(yǔ)義距離”和“信息距離”兩個(gè)概念或許能成為AI領(lǐng)域未來(lái)進(jìn)步的基石之一。讓我們期待這些睿智的學(xué)者和科學(xué)家們?cè)谥圃斐鲈絹?lái)越有人性味的產(chǎn)品的同時(shí)，也在AI的理論領(lǐng)域做出更多的突破。

題圖來(lái)自xuite.net

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

黃鑫

編輯

發(fā)私信

當(dāng)月熱門文章