丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給黃鑫
發(fā)送

1

加拿大皇家科學(xué)院李明院士:唯有理論的進(jìn)化才能給人工智能帶來(lái)質(zhì)變

本文作者: 黃鑫 2016-06-17 19:27
導(dǎo)語(yǔ):沒(méi)有基礎(chǔ)理論的研究就像在黑暗中摸索尋找,很難找到真正的價(jià)值所在。

現(xiàn)在的人工智能還處于一個(gè)摸索階段,對(duì)話機(jī)器人的開發(fā)者們都在從最基礎(chǔ)的程度開始制作深度學(xué)習(xí)。最終做出的產(chǎn)品也千差萬(wàn)別。但最終歸納起來(lái)大致的方法都屬于同樣幾類。

最初大家用的都是最容易實(shí)現(xiàn),也最容易想到的:關(guān)鍵詞匹配的方式,到后來(lái)開始慢慢出現(xiàn)根據(jù)語(yǔ)序結(jié)構(gòu)來(lái)判斷用戶語(yǔ)言內(nèi)容的手段,現(xiàn)在,橫掃整個(gè)人工智能行業(yè)的深度學(xué)習(xí)也被運(yùn)用到對(duì)話機(jī)器人的訓(xùn)練中了。

加拿大皇家科學(xué)院的院士最近提出了一個(gè)應(yīng)用于他們產(chǎn)品上的,一種比較創(chuàng)新的深度學(xué)習(xí)理論和架構(gòu)。通過(guò)這個(gè)架構(gòu),他們的產(chǎn)品“薄言豆豆”可以進(jìn)行自主學(xué)習(xí),更新對(duì)話的應(yīng)對(duì)內(nèi)容。

李明院士表示,自己和團(tuán)隊(duì)在人工智能的基礎(chǔ)理論上下了很大的功夫,他認(rèn)為人工智能的進(jìn)步一定會(huì)是因?yàn)榛A(chǔ)理論的進(jìn)步而不是工程學(xué)上(如關(guān)鍵字的匹配技巧)的進(jìn)步。

以下是李明院士在第三屆機(jī)器人峰會(huì)中的演講,關(guān)于薄言豆豆架構(gòu)原理的部分。

NLPCC在2015年10月份組織了一個(gè)測(cè)試,設(shè)計(jì)了1千個(gè)用來(lái)問(wèn)機(jī)器人的問(wèn)題,這1千個(gè)問(wèn)題測(cè)試了現(xiàn)在中國(guó)最先進(jìn)的對(duì)話技術(shù)。參與測(cè)試的對(duì)話機(jī)器人有薄言豆豆、圖靈機(jī)機(jī)器人,出門問(wèn)問(wèn)。還有小I機(jī)器人、微軟小冰,和百度度秘。這其中出門問(wèn)問(wèn)最近融資了7千萬(wàn)美元,微軟小冰有4千萬(wàn)用戶,百度度秘曾經(jīng)跟李克強(qiáng)總理對(duì)話過(guò),還博得了總理的喜愛(ài)。但是這哥第三方測(cè)試的結(jié)果是:及格的只有豆豆一個(gè)。其他的都不及格,而豆豆也是剛剛及格,60分出頭。第二是圖靈機(jī)器人,出門問(wèn)問(wèn),百分之十幾,小I,小冰,小度都不及格。其他的機(jī)器人可能擅長(zhǎng)對(duì)話而不是回答問(wèn)題。但是我覺(jué)得一個(gè)聊天機(jī)器人,只會(huì)瞎說(shuō)八道肯定是不行的。知識(shí)就是力量,你要想做好一個(gè)聊天機(jī)器人,就必須要有大量的知識(shí)做后盾。

人工智能的革命從機(jī)器學(xué)習(xí)對(duì)話開始

人類的智能,就是從說(shuō)話開始的。語(yǔ)言賦予了人們組織和更進(jìn)一步思考的能力。而人工智能的革命,我們覺(jué)得也是從學(xué)習(xí)語(yǔ)言開始。這就是我們現(xiàn)在正在做的事。我們覺(jué)得這也非常振奮人心。但是機(jī)器人怎么學(xué)說(shuō)話呢?大家都聽說(shuō)過(guò)Alphago,Alphago在跟歐洲圍棋冠軍下棋的時(shí)候,棋力還不怎么樣。但是之后的4、5個(gè)月他跟自己下了三千萬(wàn)盤棋,從中它的能力增加了很多,跟李世石下棋的時(shí)候,李世石幾乎是一點(diǎn)機(jī)會(huì)沒(méi)有。Alphago是這三千萬(wàn)盤棋不是白下的,它下完了能知道自己是輸還是贏。通過(guò)輸和贏的反饋結(jié)果他就可以改進(jìn)它的價(jià)值網(wǎng)絡(luò)。知道走哪步容易輸走哪步容易贏,這樣訓(xùn)練它的神經(jīng)網(wǎng)絡(luò)。但是說(shuō)話怎么辦?怎么判斷它的話說(shuō)得是好還是壞,現(xiàn)在市面上有很多機(jī)器人告訴大家它們會(huì)學(xué)習(xí),他們的機(jī)器人會(huì)通過(guò)用戶的反映來(lái)學(xué)習(xí),這句話100%不靠譜。第一大家聽說(shuō)過(guò)小冰的事。就是如果用戶教你一些壞事,你沒(méi)法把它篩選掉的話,就會(huì)很麻煩。第二,你的用戶才幾個(gè)???AlphaGo跟自己下了3千萬(wàn)盤棋,每盤棋能走好幾百步,這樣多的數(shù)據(jù)量不可能能從用戶那來(lái)的,用戶數(shù)據(jù)的量級(jí)根本沒(méi)有那么大。如果要讓計(jì)算機(jī)學(xué)說(shuō)話,必須訓(xùn)練計(jì)算機(jī)跟自己說(shuō)話,光自己跟自己說(shuō)話還不行,你還得要有一個(gè)辦法來(lái)估計(jì)這個(gè)話說(shuō)得好還是不好,所以這是件特別難的事。比Alphago下圍棋難得多,以下我給大家介紹我們薄言怎么樣用我們的數(shù)學(xué)理論解決這件事情。

讓薄言豆豆自己跟自己說(shuō)話。比下圍棋難得多。這里我們講一個(gè)很小的側(cè)面,我來(lái)介紹一個(gè)數(shù)學(xué)理論,這個(gè)數(shù)學(xué)理論可以教會(huì)你怎么樣來(lái)估計(jì)這句話說(shuō)得好還是不好。我說(shuō)一個(gè)很小的例子,他要學(xué)習(xí)類似的問(wèn)題。比如天氣問(wèn)題?直接教你說(shuō)話的話,我教你今天天氣怎么樣。你學(xué)習(xí)之后可能可以可以回答今天天氣怎么樣,比如天氣挺熱的等等。但是如果我換個(gè)問(wèn)法,我問(wèn)明天怎么樣。你就要去寫個(gè)新的模板,對(duì)話的變化是無(wú)窮無(wú)盡的。所以這樣寫模板不行,最好的辦法是有一個(gè)理論,定義什么叫語(yǔ)意相似性,什么東西相似什么東西不相似。這是我們要解決的問(wèn)題。也是人工智能50年還沒(méi)有解決的問(wèn)題。但是我希望提出對(duì)這個(gè)問(wèn)題的一個(gè)另類的解決方法。這是豆豆所用的來(lái)學(xué)習(xí)一個(gè)句子的相似形的LSTM算法,說(shuō)起來(lái)比較復(fù)雜。不過(guò)這個(gè)東西最關(guān)鍵的是用我說(shuō)這兩個(gè)相似,那最后到底是相似還是不相似?你必須得給我反饋,必須得有一個(gè)辦法告訴我是不是相似。

判斷訓(xùn)練效果的關(guān)鍵:“語(yǔ)義距離”和“信息距離”

那怎么反饋?這需要設(shè)計(jì)一個(gè)的最基本的理論概念,數(shù)學(xué)概念。叫“語(yǔ)義距離”。這是非常重要的概念,但是人工智能做了50年沒(méi)有人知道怎么算,怎么定義。這就跟大家知道圖靈那個(gè)機(jī)器人一樣,這個(gè)東西有一個(gè)概念,但是沒(méi)法定義到底它是個(gè)什么東西,它是不可計(jì)算的,語(yǔ)義就是這么一個(gè)東西。語(yǔ)義是不可計(jì)算,不可定義的。我們要知道今天天氣怎么樣,我要知道這個(gè)語(yǔ)義距離是0。那我怎么定義一個(gè)數(shù)學(xué)理論來(lái)解決這個(gè)問(wèn)題?我希望我在這能夠給大家解釋一個(gè)通俗一點(diǎn)的解釋。我先給大家定義一個(gè)別的東西:比如有兩句話,我要定義這兩句話之間的,任何兩個(gè)實(shí)體之間的距離,只要有信息就會(huì)有,我們將它定義為“信息距離”。然后我拿信息距離來(lái)近似描述“語(yǔ)義距離”。

那么我們?cè)趺醋觯课覀兪菑囊粋€(gè)特別漂亮的數(shù)學(xué)理論開始的。我們出發(fā)點(diǎn)是用物理公理推導(dǎo)出所有要做的事。這是我們跟所有其他廠家的不一樣的。這個(gè)理論是5個(gè)人共同發(fā)明的,我是其中之一。

我首先要定義信息距離,這個(gè)信息距離是非常復(fù)雜的東西,不能用傳統(tǒng)定義,因?yàn)閭鹘y(tǒng)的定義肯定不行。那我怎么辦?比如我們有X、有Y兩個(gè)信息載體,現(xiàn)在我需要計(jì)算兩個(gè)信息載體之間的距離,怎么算?我們給信息距離的定義就是說(shuō)這兩個(gè)信息X、Y之間的距離就是轉(zhuǎn)換他們之間所需要的能量,就是比特?cái)?shù),不可逆的這個(gè)數(shù)。我們證明了一個(gè)定理,就是最小的信息量可以用這個(gè)公式表示,這個(gè)K是一種復(fù)雜性。如果大家感興趣可以看我們的書,這本書是我寫的。轉(zhuǎn)換X、Y所需要的最小的能量,我就定義為X、Y之間的信息距離:D(X、Y)。

上面是信息距離,我們之前說(shuō)的叫語(yǔ)義距離,我們用信息距離去近似語(yǔ)義距離。而且我能證明一件事,如果你有任何可計(jì)算的距離模擬近似語(yǔ)義距離。那我這個(gè)信息距離一定比你??!那么就是說(shuō)我這個(gè)距離比你好。你根本不用去計(jì)算什么語(yǔ)義距離,近似度,就算系距離就夠了。我一定比你好。好了,現(xiàn)在就是咱們從理論,中間證明過(guò)程不說(shuō)了。從理論上解決了語(yǔ)義距離,不可逆,不可定義的辦法。這個(gè)雖然不可計(jì)算,但是信息距離的定義就是說(shuō)我要壓縮編碼就可以了。所以在自然語(yǔ)言方面基本上可以用。所以這樣我給豆豆提供了一個(gè)理論。

我覺(jué)得人工智能的進(jìn)步,一定要靠首先是理論的進(jìn)步,而不應(yīng)該是工程上的什么關(guān)鍵字,什么模板匹配。

結(jié)語(yǔ)

李明院士堅(jiān)信理論基礎(chǔ)的建立才是應(yīng)用進(jìn)步的基礎(chǔ),也在堅(jiān)持貫徹著這個(gè)理念,事實(shí)上我們也認(rèn)同這個(gè)觀點(diǎn),這也是最近圖靈測(cè)試遭受的質(zhì)疑的思路:即使一個(gè)機(jī)器人能根據(jù)匹配和搜索關(guān)鍵字完美的回答你的所有問(wèn)題,甚至讓你分辨不出它到底是人還是機(jī)器人。也不意味著它就擁有了思維能力。只有人工智能的理論不斷發(fā)展,當(dāng)我們真正探索出一種能夠創(chuàng)造出智能的手段,才能賦予機(jī)器人真正的“智能”。

馮·諾依曼在某次演講中說(shuō):只要你把被認(rèn)為是計(jì)算機(jī)無(wú)法解決的問(wèn)題描述清楚,計(jì)算機(jī)就總能找到一種方法解決它。而目前我們最需要的也正是對(duì)希望計(jì)算機(jī)解決的問(wèn)題的精確定義。這么看來(lái),李明院士和他的團(tuán)隊(duì)對(duì)語(yǔ)言的含義和效果給出的定義“語(yǔ)義距離”和“信息距離”兩個(gè)概念或許能成為AI領(lǐng)域未來(lái)進(jìn)步的基石之一。讓我們期待這些睿智的學(xué)者和科學(xué)家們?cè)谥圃斐鲈絹?lái)越有人性味的產(chǎn)品的同時(shí),也在AI的理論領(lǐng)域做出更多的突破。

題圖來(lái)自xuite.net

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)