0
本文作者: AI科技評(píng)論 | 2016-06-02 16:30 |
圖片來(lái)源:Getty Images。
先是微軟、然后Facebook、現(xiàn)在是谷歌。又一次,互聯(lián)網(wǎng)巨頭們將目光聚焦在了同一個(gè)未來(lái)趨勢(shì)上:聊天機(jī)器人。
這些公司許諾說(shuō),在未來(lái)的幾個(gè)月和幾年內(nèi),你可以像跟朋友聊天一樣,與互聯(lián)網(wǎng)服務(wù)商聊天。聊天機(jī)器人會(huì)即時(shí)回復(fù)你的提問(wèn)、回應(yīng)你的需求,甚至預(yù)測(cè)你的需求。跟老同學(xué)聊天約聚會(huì)的時(shí)候,你可以讓OpenTable機(jī)器人找找有什么餐廳好吃。不用另外打開(kāi)一個(gè)APP,你就能用Travelocity機(jī)器人訂酒店。
不過(guò),還有一個(gè)關(guān)鍵問(wèn)題沒(méi)有解決:打造一個(gè)真的可以聊天的聊天機(jī)器人。機(jī)器人可以以某些方式來(lái)模擬聊天,但是距離真正理解人們聊天的方式,還有很大的差距。上個(gè)月底,為了推動(dòng)這方面AI技術(shù)的進(jìn)步——并且與競(jìng)爭(zhēng)對(duì)手爭(zhēng)搶公關(guān)眼球——谷歌開(kāi)源了SyntaxNet,公司自然語(yǔ)言理解技術(shù)所使用的工具之一(開(kāi)源分享可以讓更多的人來(lái)推動(dòng)技術(shù)進(jìn)步)?,F(xiàn)在,為了不被超越,F(xiàn)acebook展示了自己的一項(xiàng)重要技術(shù),一個(gè)稱(chēng)為DeepText的自然語(yǔ)言引擎。
Facebook還沒(méi)有將這項(xiàng)技術(shù)開(kāi)源。而且,公司也才剛剛開(kāi)始在自己各項(xiàng)服務(wù)中使用DeepText。但是據(jù)Facebook稱(chēng),DeepText讓人們看到公司希望在未來(lái)加速自然語(yǔ)言理解的進(jìn)展。為了打造系統(tǒng),他們希望少一點(diǎn)依賴(lài)人類(lèi),多一點(diǎn)依賴(lài)數(shù)據(jù)——互聯(lián)網(wǎng)上的海量數(shù)據(jù)。
谷歌和Facebook都在使用深度神經(jīng)網(wǎng)絡(luò)來(lái)推進(jìn)他們的自然語(yǔ)言處理能力。深度神經(jīng)網(wǎng)絡(luò)在許多別的在線任務(wù)中都已經(jīng)獲得了成功,例如識(shí)別照片中的人臉、識(shí)別智能電話的語(yǔ)音指令,人們希望這些能夠通過(guò)分析海量數(shù)據(jù)學(xué)會(huì)任務(wù)的軟件和硬件網(wǎng)絡(luò),也能夠成功學(xué)會(huì)理解語(yǔ)言,并以自然的方式回應(yīng)人類(lèi)語(yǔ)言。
谷歌新開(kāi)源的系統(tǒng)“SyntaxNet”使用神經(jīng)網(wǎng)絡(luò)來(lái)理解句子中的語(yǔ)法邏輯。神經(jīng)網(wǎng)絡(luò)可以通過(guò)分析幾百萬(wàn)張貓咪照片來(lái)學(xué)會(huì)識(shí)別貓咪,同樣地,神經(jīng)網(wǎng)絡(luò)可以分析幾百萬(wàn)個(gè)句子,從而學(xué)會(huì)理解語(yǔ)法——名詞、動(dòng)詞、以及動(dòng)詞如何與名詞聯(lián)系起來(lái)等等。這種方法稱(chēng)為句法分析,很有用,但是也有局限性。人類(lèi)必須將幾百萬(wàn)個(gè)例句仔細(xì)標(biāo)記,標(biāo)出句子中的每一個(gè)部分,以及每個(gè)部分與句子剩余部分是什么關(guān)系,這樣SyntaxNet才能從數(shù)據(jù)中學(xué)習(xí)。而且,即便是機(jī)器成功學(xué)會(huì)理解一個(gè)句子的語(yǔ)法,它還得更進(jìn)一步才能理解一個(gè)聊天對(duì)話的完整意義。
但是,現(xiàn)在Facebook的研究人員說(shuō),他們已經(jīng)將這項(xiàng)頂尖技術(shù)推向了全新領(lǐng)域?!保―eepText)幫我們彌補(bǔ)了數(shù)據(jù)庫(kù)標(biāo)記的不足?!盕acebook工程總監(jiān)Hussein Mehanna說(shuō),“它有非常巨大的結(jié)構(gòu)。它可以通過(guò)無(wú)監(jiān)管的方式來(lái)學(xué)習(xí)。”換句話說(shuō),F(xiàn)acebook的系統(tǒng)更多依賴(lài)數(shù)學(xué),而非語(yǔ)法精度。
"他們說(shuō)這話的意思是,關(guān)于語(yǔ)言結(jié)構(gòu),他們沒(méi)有去教神經(jīng)網(wǎng)絡(luò)任何東西?!盋hris Nicholson這樣解釋道,他是深度學(xué)習(xí)創(chuàng)業(yè)公司Skymind的創(chuàng)始人,他說(shuō)Facebook的研究之前已經(jīng)在一些公開(kāi)研究論文中討論過(guò)了。這很重要,他補(bǔ)充說(shuō),因?yàn)檫@可以打造更加靈活的系統(tǒng)——系統(tǒng)可以馬上擴(kuò)展到眾多不同的情景。Facebook的系統(tǒng)可以像學(xué)英語(yǔ)一樣,學(xué)會(huì)法語(yǔ)、西班牙語(yǔ)——只要將語(yǔ)言解構(gòu),將語(yǔ)言看做只是數(shù)學(xué)而已。據(jù)Mehanna說(shuō),DeepText已經(jīng)能用20種不同的語(yǔ)言運(yùn)行了。
過(guò)去,研究人員使用仔細(xì)編碼的規(guī)則來(lái)打造自然語(yǔ)言引擎——這是種困難又耗時(shí)的方法。這也是蘋(píng)果打造Siri的方法。通過(guò)打造可以自主學(xué)習(xí)的系統(tǒng),谷歌和Facebook等公司希望系統(tǒng)不需要很多人類(lèi)干涉,就能夠自己成長(zhǎng)、越來(lái)越智能。不過(guò),我們還沒(méi)實(shí)現(xiàn)這個(gè)目標(biāo)。Facebook的方法還在早期階段,而且并不是所有人都相信Facebook的系統(tǒng)真像公司說(shuō)的那么好用。
Noah Smith是華盛頓大學(xué)的計(jì)算機(jī)科學(xué)家,他的專(zhuān)業(yè)領(lǐng)域就是自然語(yǔ)言理解。他說(shuō)不只有Facebook想通過(guò)未經(jīng)標(biāo)記的數(shù)據(jù)實(shí)現(xiàn)理解。他說(shuō),基于Facebook的一篇近期研究論文,他不覺(jué)得公司的方法特別酷炫。不過(guò),他和許多人都認(rèn)為,這是未來(lái)研究會(huì)探索的方向。
當(dāng)用戶(hù)聊天時(shí)出現(xiàn)以下聊天內(nèi)容,軟件會(huì)自動(dòng)識(shí)別出用戶(hù)想打出租車(chē),并出現(xiàn)叫車(chē)按鈕:“我需要打車(chē)?!薄ⅰ拔覀兇騻€(gè)車(chē)去吧。”、“打個(gè)車(chē)?!?、“叫個(gè)出租?!薄ⅰ暗俏业么騻€(gè)車(chē)?!碑?dāng)用戶(hù)說(shuō)“嗨!”、“我不需要打車(chē)。”和“我想騎毛驢?!钡臅r(shí)候,軟件不會(huì)出現(xiàn)叫車(chē)按鈕。圖片來(lái)源:Facebook。
Mehanna說(shuō),F(xiàn)acebook會(huì)在今年夏天發(fā)表更多關(guān)于DeepText的最新研究論文。他說(shuō),公司正在開(kāi)始測(cè)試該項(xiàng)技術(shù),作為支持Facebook Messenger內(nèi)部聊天機(jī)器人的工具。據(jù)Mehanna說(shuō),系統(tǒng)可以在你平時(shí)跟朋友聊天的時(shí)候自動(dòng)識(shí)別出你想打出租車(chē)。而且,我們有理由相信Facebook可能在此方面有一種競(jìng)爭(zhēng)優(yōu)勢(shì)——數(shù)據(jù)。
要學(xué)會(huì)自然語(yǔ)言,你需要大量的自然語(yǔ)言——以數(shù)字化的形式。以前這是難以實(shí)現(xiàn)的。但是這對(duì)Facebook來(lái)說(shuō)是小菜一碟——公司的社交媒體上,每一天都有幾百萬(wàn)真實(shí)的聊天對(duì)話在發(fā)生。據(jù)Mehanna稱(chēng),人們每分鐘發(fā)布的新消息多達(dá)40萬(wàn)條,而這些新消息下面,每天都會(huì)發(fā)布8千萬(wàn)條評(píng)論。
對(duì),這也就是說(shuō),F(xiàn)acebook利用自己網(wǎng)站上生成的數(shù)據(jù)來(lái)訓(xùn)練DeepText,而公司以外的研究員很難驗(yàn)證公司所說(shuō)的技術(shù)。不過(guò),這個(gè)數(shù)據(jù)也至關(guān)重要。現(xiàn)在,F(xiàn)acebook上幾乎所有的聊天都是人與人之間的進(jìn)行的。但是有了正在傾聽(tīng)和學(xué)習(xí)的機(jī)器人,也許有一天,我們也會(huì)在Facebook上和機(jī)器人聊天。
Via 《連線》雜志
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。