丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
特寫 正文
發(fā)私信給高婓
發(fā)送

0

AIR 038 | 加拿大皇家學(xué)會李明院士:如何用深度學(xué)習(xí)對付NLP難題

導(dǎo)語:李明,加拿大皇家學(xué)會院士,滑鐵盧大學(xué)教授,現(xiàn)代信息論奠基者,國家“千人計劃”專家在 2016 CCF-GAIR 全球人工智能與機器人峰會上,李明院士接受了雷鋒網(wǎng)


AIR 038 | 加拿大皇家學(xué)會李明院士:如何用深度學(xué)習(xí)對付NLP難題李明,加拿大皇家學(xué)會院士,滑鐵盧大學(xué)教授,現(xiàn)代信息論奠基者,國家“”專家

在 2016 CCF-GAIR 全球人工智能與機器人峰會上,李明院士接受了雷鋒網(wǎng)的采訪,分享了他對用深度學(xué)習(xí)對付NLP(自然語言處理)難題的看法,及深度學(xué)習(xí)在NLP研究領(lǐng)域的未來應(yīng)用

雷鋒網(wǎng):請簡要談?wù)勀脒x加拿大皇家學(xué)會的經(jīng)過。

李明院士:入選加拿大皇家學(xué)會的程序沒有那么繁瑣,獲得評選資格后,由一兩個院士寫支持信,院士評選會進行評選,比較公正。與中國工程院的體系不同,英國加拿大皇家科學(xué)院包括科學(xué),工程,社科類,法律等。

 雷鋒網(wǎng):當(dāng)前在語義理解方面深度學(xué)習(xí)在科學(xué)上是否有突破性的進展?

李明院士:Siri主要通過關(guān)鍵字來識別語義信息,比如,你問“魚吃什么”,它會回答“海鮮館”類信息,容易犯錯誤,而模版(icon)匹配,太嚴(yán)格,不靈活,“美國總統(tǒng)是誰”,你可以獲得準(zhǔn)確答案“奧巴馬”,但是對于“美國總統(tǒng)是誰啊”這樣的問題形式,基于模板的語義理解則不能識別。而我們運用的深度學(xué)習(xí)不同于別的公司,可以把對這個問題的回答變得具有魯棒性,不會出現(xiàn)很多錯誤,而這是非常關(guān)鍵的,也就是說,深度學(xué)習(xí)可以解決這一問題。深度學(xué)習(xí)也存在局限性,比如需要很多大數(shù)據(jù)來訓(xùn)練,而我們公司的優(yōu)勢在于我們可以自己生成大量數(shù)據(jù)。

 雷鋒網(wǎng):微軟的聊天機器人是通過網(wǎng)絡(luò)公開采集數(shù)據(jù)進行訓(xùn)練,回答問題時可能會出現(xiàn)不友好的現(xiàn)象,未來有沒有可能制造出個性化聊天機器人?

李明院士:比如,聊天機器人小冰之所以出現(xiàn)這么多問題,主要原因是信息復(fù)制的。我們運用的深度學(xué)習(xí)模型,可以將最主流的回答(友好的回答)篩選出來,將過濾掉支流的回答,這也是深度學(xué)習(xí)的問題所在,回答沒有特殊性,不過,深度學(xué)習(xí)可以在一定程度上避免這種不友好回答的問題?;蛘哒f,深度學(xué)習(xí)是否會因為樣本足夠大,可以包容所有的問題,實現(xiàn)個性化聊天?根據(jù)統(tǒng)計結(jié)果顯示,豆豆比小冰可以回答的問題多十倍?,F(xiàn)在的深度學(xué)習(xí)有很多不是真正意義上的深度學(xué)習(xí)。我們的豆豆,有20多個深度學(xué)習(xí)模式,可以篩選出最優(yōu)的回答結(jié)果。此外,我們的聊天機器人的對話模式與方言無關(guān),只管語義信息的輸入。

 雷鋒網(wǎng):在實際應(yīng)用中,“信息距離”理論是否存在理論上的局限性或技術(shù)上的難題?

李明院士:我們的“信息距離”理論在理論上無局限性,但是技術(shù)上有局限性,語義距離沒有定義,不可計算,信息距離有定義,但是也不可計算,只能通過壓縮的方式來度量,用“信息距離”來近似“語義距離”。具體壓縮方法:簡單來講,如“明天明天”將被壓縮為一個詞語“明天”,實現(xiàn)信息方面的簡化。

 雷鋒網(wǎng):在實現(xiàn)大型文本關(guān)系理解(理解人類語言表達的結(jié)構(gòu)和意義)方面,相比其他算法與模型,深度學(xué)習(xí)的優(yōu)點體現(xiàn)在哪里?

李明院士:相比其他算法與模型,深度學(xué)習(xí)的優(yōu)點在于其對話魯棒性。一般用于實現(xiàn)機器人對話的辦法多為關(guān)鍵字法,模板匹配法,但是,相比這兩種方法,深度學(xué)習(xí)處理的對話信息可以以多種形式出現(xiàn),能夠容忍一些錯誤,實現(xiàn)較為自然的人機交互對話。

雷鋒網(wǎng):由您的團隊提出的“中英文分詞”兩者之間有何區(qū)別?

李明院士:相比于漢語分詞,我們的系統(tǒng)不需要考慮英文分詞,因為英語單詞之間有空格隔開,不用進行分詞。

 雷鋒網(wǎng):您認(rèn)為,深度學(xué)習(xí)在計算機智能處理自然語言方面需要做哪些方面的提升?

李明院士:下一步,基于大數(shù)據(jù),深度學(xué)習(xí)訓(xùn)練的好的話,未來的智能機器人可以讀書看報,比如,讀紅樓夢,未來的智能機器人可以分辨清楚人物關(guān)系,譬如,小說中誰喜歡誰,誰是誰的大姨媽,再比如,能夠分辨出三國演義中,誰與誰結(jié)義了?,F(xiàn)在深度學(xué)習(xí)可以回答類似下面的一類問題:林黛玉去了賈寶玉的房間。問:誰去了賈寶玉的房間?當(dāng)前的深度學(xué)習(xí)可以回答:林黛玉,其回答問題的精度精確度可以達到70%到80%。

 雷鋒網(wǎng):深度學(xué)習(xí)可以區(qū)分指示代詞的歧義現(xiàn)象嗎?

李明院士:現(xiàn)階段深度學(xué)習(xí)還不具備擁有的足夠量的背景知識來區(qū)分上下文語言歧義現(xiàn)象,不過,經(jīng)過訓(xùn)練,我想是可以實現(xiàn)的。機器人對話當(dāng)前可以實現(xiàn)寬泛的問答,不過,對于一些小的語言問題,比如,怎么理解“雞不吃了”,深度學(xué)習(xí)還沒有兼顧到。

 雷鋒網(wǎng):當(dāng)前的人機對話模型發(fā)展得比較迅速,對于“機器會有意識嗎?”這樣的問題,可以與我們分享一下您的觀點嗎?

李明院士:其實,目前的機器人自然語言對話,多是訓(xùn)練出來的。在眾多研究,沒有任何人能夠清楚地定義:什么叫意識?我認(rèn)為,機器人說話,類似于人說夢話,你問一個夢游的人一些問題,他是回答問題時是沒有意識的,卻能說的頭頭是到,機器人對話其實是一樣的。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說