1
本文作者: 天諾 | 2015-03-30 15:20 |
Yann LeCun是Facebook人工智能研究中心主管,也是紐約大學(xué)數(shù)字科學(xué)中心創(chuàng)始負(fù)責(zé)人。他發(fā)表過(guò)180多篇學(xué)術(shù)論文,其開(kāi)發(fā)的字符識(shí)別技術(shù)可以驗(yàn)證支票,也在銀行業(yè)被廣泛應(yīng)用。此外,他也是深度學(xué)習(xí)領(lǐng)域里最卓越的開(kāi)發(fā)者之一。
近日,Yann LeCun接受了紐約時(shí)報(bào)采訪,他表示,從長(zhǎng)遠(yuǎn)來(lái)看,先進(jìn)的計(jì)算機(jī)技術(shù)將會(huì)創(chuàng)造出數(shù)字化伙伴,在人們?nèi)粘I钪信惆樵谖覀冏笥摇?/p>
Q. 人工智能的重要性是什么?
A. 人工智能會(huì)讓數(shù)字世界生成的各種信息變得更有意義。與人工智能或是數(shù)字世界里的許多交互會(huì)帶來(lái)一種所謂的“數(shù)字伙伴”,它會(huì)給人們的日常工作、生活提供幫助。
Q. 對(duì)Facebook來(lái)說(shuō)這意味著什么?
A. Facebook是一家旨在將人們聯(lián)系在一起的公司,如果Facebook可以獲得各種類(lèi)型的海量數(shù)據(jù),肯定能幫助他們實(shí)現(xiàn)自己的愿景。根據(jù)人們?cè)贔acebook上發(fā)帖的內(nèi)容,圖片,以及各類(lèi)新聞,我們可以在一天內(nèi)展現(xiàn)2000個(gè)事件。但是人們的時(shí)間是非常寶貴的,所以我們每天只會(huì)挑選100到150個(gè)最重要、也是對(duì)用戶最有幫助的事件進(jìn)行推送。
為了高效地實(shí)現(xiàn)上述目標(biāo),理解內(nèi)容是必須的,通過(guò)給圖像標(biāo)簽,面部識(shí)別,以及文本分類(lèi),我們做到了。此外,我們還必須知道在不同的狀況下,用戶有什么興趣,想要做什么,以及他們的朋友圈都有誰(shuí)。
Q. 未來(lái)看上去會(huì)是什么樣?
A. 前面提到的這些功能不算是Facebook未來(lái)的產(chǎn)品,而是一種思維方式,也就是說(shuō),如果未來(lái)人們生活中出現(xiàn)了一個(gè)智能數(shù)字伙伴,那么我們需要以一種全新的思維方式來(lái)思考事物了。這種方式會(huì)影響你與好友之間的交互,擴(kuò)展你的想法。未來(lái),人工智能應(yīng)該是可以單點(diǎn)控制的,并且能夠理解、并尊重用戶的隱私信息。
隨著時(shí)間的過(guò)去,這種類(lèi)型的人工智能會(huì)日益增多。在某種程度上,F(xiàn)acebook News Feed中已經(jīng)或多或少有了這種人工智能的影子,當(dāng)然還有蘋(píng)果的Siri和微軟的Cortana。不過(guò)這些產(chǎn)品與用戶的交互方式還是比較膚淺的,基本上算是一種照本宣科的方式。
Q. 深度學(xué)習(xí),這種機(jī)器自主理解事物的能力,是如何運(yùn)作的?
A. 深度學(xué)習(xí)可以支持較為復(fù)雜的交互。當(dāng)遇到情況不同的事情時(shí),機(jī)器需要回到問(wèn)題的不同層級(jí),理解問(wèn)題中的每個(gè)步驟,然后逐一解決。這好比是你在復(fù)盤(pán)下棋,當(dāng)你走錯(cuò)了一步之后,可能需要后退好幾步,通過(guò)“糾錯(cuò)”來(lái)發(fā)現(xiàn)到底是哪一步走錯(cuò)了。當(dāng)然與你從自行車(chē)上摔下來(lái)也很相似,因?yàn)槟阒辽俚妹靼鬃约菏鞘裁磿r(shí)候失去平衡的。深度學(xué)習(xí)就是做這些事兒的,在深度學(xué)習(xí)中,它的追究(Credit Assignment)可能有數(shù)十,甚至數(shù)百層。
Q. 聽(tīng)你這么說(shuō)好像很簡(jiǎn)單。
A. 我們用所謂的“向量”來(lái)表達(dá)對(duì)象,向量就是很長(zhǎng)的數(shù)字串?!柏垺钡南蛄亢汀肮贰钡南蛄亢芟嗨?,所以它們兩者之間是有緊密關(guān)聯(lián)的。而對(duì)于象征性的符號(hào)對(duì)象來(lái)說(shuō),應(yīng)該會(huì)有更進(jìn)一步的區(qū)分,機(jī)器學(xué)習(xí)會(huì)通過(guò)在對(duì)象之間尋找關(guān)聯(lián),繼而判斷出它們的含義。
Q. 你是如何創(chuàng)建一個(gè)具有好向量的系統(tǒng)的,換句話說(shuō),機(jī)器學(xué)習(xí)能夠根據(jù)背景環(huán)境表達(dá)不同的語(yǔ)義嗎?比如,你是如何讓機(jī)器學(xué)習(xí)語(yǔ)言規(guī)則的?
A. Tomas Mikolov在加盟Facebook之前在Google也從事相關(guān)工作,他做了大量基于向量的語(yǔ)言關(guān)系工作,我們稱之為“詞語(yǔ)到向量”關(guān)系。當(dāng)你需要表達(dá)時(shí),你需要使用一連串的詞語(yǔ),而且這些詞語(yǔ)是有順序的,從邏輯上來(lái)說(shuō),會(huì)有一個(gè)詞語(yǔ)開(kāi)頭,一個(gè)詞語(yǔ)結(jié)尾。舉個(gè)例子,如果你說(shuō)了一句話,其中有11個(gè)詞語(yǔ),提供開(kāi)頭和結(jié)尾的單詞,你可以要求機(jī)器學(xué)習(xí)預(yù)測(cè)出中間的詞語(yǔ)。要實(shí)現(xiàn)這一目標(biāo),系統(tǒng)需要學(xué)習(xí)每個(gè)獨(dú)立的詞語(yǔ)在句子中所表達(dá)的含義。
我們還在研究語(yǔ)言的向量表達(dá),這樣就能讓你不太費(fèi)力地理解不同語(yǔ)言了。
Q. 你為什么最終選擇了Facebook?
A. 解決人工智能問(wèn)題,需要科技行業(yè)、學(xué)術(shù)界、以及政府共同努力。就目前而言,全世界有實(shí)力涉足人工智能領(lǐng)域的公司還是屈指可數(shù)的。
蘋(píng)果太神秘了,他們不愿與人分享技術(shù),那里不適合研究人工智能。Google部分保密,他們有工程師進(jìn)行混合研究,但也不是那么開(kāi)放。Google X就是一個(gè)秘密研究部門(mén),別期望他們會(huì)有什么突破。不過(guò),Google在英國(guó)的人工智能項(xiàng)目Deep Mind相對(duì)開(kāi)放的多,所以我對(duì)這個(gè)項(xiàng)目還是比較樂(lè)觀的。
在Facebook,開(kāi)放可以說(shuō)已經(jīng)融入到他們的基因之中了。許多Facebook的軟件和硬件都是開(kāi)放的。在他們眼里,自己就是一家開(kāi)放的公司,因?yàn)樘峁┥缃痪W(wǎng)絡(luò)服務(wù)的公司,開(kāi)放是一個(gè)必不可少的企業(yè)文化。Facebook開(kāi)源了很多代碼,為科技界貢獻(xiàn)了很多價(jià)值。
至于如何實(shí)現(xiàn)商業(yè)化人工智能,恕我不能透露太多。這與我們的研究關(guān)系不大,畢竟我們還是要保持些競(jìng)爭(zhēng)優(yōu)勢(shì)的。
Q. 你們的長(zhǎng)期目標(biāo)是什么?
A. 給人工智能賦予動(dòng)機(jī)和情感。
Q. 你不能在軟件中渲染情感吧?
A. 好吧,讓我們來(lái)談?wù)勄楦?。?dāng)人們開(kāi)始了解這個(gè)世界,他們會(huì)有很多情感表達(dá)。人類(lèi)自身就是一種“預(yù)知機(jī)器”,我們會(huì)按照自己喜歡的方式,以及自己喜歡的狀態(tài)去改變這個(gè)世界。什么是情感?其實(shí)就是判斷哪些是人類(lèi)喜歡的事情,哪些是人類(lèi)討厭的事情。而這些事情其實(shí)都是可以被賦值的。就像現(xiàn)在,人們吃飯、繁衍、避免痛苦、賺錢(qián)、失業(yè),所有這一切其實(shí)都是有原因的。比如你會(huì)想,如果我不去上學(xué),以后就沒(méi)法找工作,日子就會(huì)過(guò)得很苦,所以你得去學(xué)校。人工智能就是要做出類(lèi)似這樣的預(yù)測(cè),當(dāng)然,很多時(shí)候我們也會(huì)感到很矛盾,但是對(duì)于利用機(jī)器代碼來(lái)渲染情感,其實(shí)是做得到的。
Q. 要證明你所說(shuō)的這一切,有哪些困難?
A. 實(shí)際上,我們?nèi)匀徊恢廊绾稳?shí)現(xiàn)一些人工智能概念。最大的困難之一,就是我們不知道如何實(shí)現(xiàn)“無(wú)監(jiān)督學(xué)習(xí)”,也就是機(jī)器自主學(xué)習(xí)。
監(jiān)督學(xué)習(xí),舉個(gè)例子,就是你需要去訓(xùn)練計(jì)算機(jī)去識(shí)別狗或貓咪圖片。如果要鞏固學(xué)習(xí)效果,方法就是不要告訴機(jī)器哪些圖片是正確的。事實(shí)上,你只需給機(jī)器的表現(xiàn)打分就可以了。通過(guò)識(shí)別在哪里出現(xiàn)錯(cuò)誤,機(jī)器可以逐漸理解學(xué)習(xí)規(guī)則。
無(wú)監(jiān)督學(xué)習(xí),則是人類(lèi)的能力,換句話說(shuō),人們會(huì)通過(guò)對(duì)事物產(chǎn)生興趣來(lái)了解整個(gè)世界是如何運(yùn)作的。就算你把一個(gè)玩具藏在盒子后面,孩子們也會(huì)知道玩具不是消失了,它仍存在于這個(gè)世界里面。人類(lèi)和動(dòng)物具有這種能力。相對(duì)于機(jī)器而言,絕大多數(shù)機(jī)器的學(xué)習(xí)都是監(jiān)督學(xué)習(xí),我們目前還沒(méi)有一個(gè)足夠好的模型來(lái)讓機(jī)器實(shí)現(xiàn)“無(wú)監(jiān)督自主學(xué)習(xí)”。
相對(duì)于前文提到的“詞語(yǔ)到向量”關(guān)系,“向量到詞語(yǔ)”可能算是一種無(wú)監(jiān)督自主學(xué)習(xí),然而究竟該如何構(gòu)建無(wú)監(jiān)督學(xué)習(xí)的人工智能,目前我們?nèi)匀狈驹碇С帧?/p>
via nytimes
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。