0
雷鋒網(wǎng)AI科技評論按:Yann LeCun是人工智能神經(jīng)網(wǎng)絡(luò)方面的大牛,現(xiàn)在是Facebook人工智能研發(fā)團隊的領(lǐng)軍人物??墒撬难芯恐凡⒉皇且环L(fēng)順,在神經(jīng)網(wǎng)絡(luò)變得今天這樣火熱之前,他也經(jīng)歷過非常悲催的歲月。BuzzFeed做了一篇Yann LeCun的專訪,以下為雷鋒網(wǎng)原文翻譯。來聽LeCun講講當(dāng)年的故事,也跟他一起思考一下人工智能的未來。
距Facebook的門羅公園總部3000英里外,在曼哈頓市區(qū)的一棟老舊的米色公寓里,有一群FB員工正在為一個項目忙碌,只是這個項目看起來更符合科幻小說而不是社交網(wǎng)絡(luò)。這個小組是Facebook的人工智能研究團隊,內(nèi)部簡稱FAIR (Facebook Artificial Intelligence Research),他們的目標(biāo)是制造出智力水平能與人類匹敵的計算機。盡管距離達到這個目標(biāo)還有很長的距離,這個小組卻做出了沒什么人認為可以在近10年內(nèi)完成的成就。他們做出的AI程序能畫畫,畫作幾乎無法與人類畫家的作品區(qū)分開來;能回答來自維基百科的條目的問答題;現(xiàn)在還能玩類似星際爭霸這樣的高級電腦游戲。它們逐漸變得越來越聰明了。也許某一天,F(xiàn)acebook會不再是連接你和你朋友們的工具,而依靠AI真的成為你的朋友。
以上并不是唯一的原因,不過FAIR確實不是我們印象里的那種典型的Facebook團隊。這個四千億美元市值公司有許多熱門產(chǎn)品,Instagram、WhatsApp、Messenger、Facebook proper等等,而FAIR團隊并沒有直接參與其中的任何一個。這個團隊仿佛放棄了Facebook的最終目標(biāo),更別說達成了。他們的帶頭人也不是常被媒體報道的典型硅谷高材生,而是Yann LeCun,一位經(jīng)歷過重大的失敗但沒有放棄的56歲學(xué)者。他的人工智能理論曾經(jīng)不被別人接受,現(xiàn)在卻被公認是世界級的AI專家;而這也是對Facebook的獎賞。
“你與數(shù)字世界交互的方式,你的手機,你的電腦,都會變化”,談到可能發(fā)生的事情的時候LeCun這樣說。
FAIR正在提高電腦靠自己來看、聽、溝通的能力,這些成果也正在體現(xiàn)在Facebook的產(chǎn)品中,改變著從新聞排名到照片濾鏡等等的各種東西。而且Facebook還在不停地進行大筆的投資——并不是因為人工智能好玩,而是因為人工智能不可或缺。如今,不管在科技的哪個角落,公司們都在依靠他們的AI技術(shù)進行競爭。依靠人工智能的Uber自動駕駛車輛對它的發(fā)單策略非常關(guān)鍵;依靠人工智能的谷歌智能音箱正在用語音回答用戶們曾經(jīng)在搜索頁面用鍵盤敲入的內(nèi)容(甚至更早之前,在百科全書里面翻);亞馬遜正在建立具有人工智能收銀的便利店,以便占領(lǐng)市場容量6740億美元的食物市場。
回到Facebook內(nèi)部呢,人工智能遍地開花。比如帶有人工智能的照片濾鏡就能夠幫忙解決一項來自Snapchat的問題。他們所用的AI能夠瀏覽照片,識別其中的內(nèi)容,然后決定在用戶的資訊流里顯示什么;用戶會反復(fù)地使用這些功能,對公司來講這是一種很有競爭力的用戶體驗。類似的技術(shù)還可以用來監(jiān)控騷擾、恐怖主義、色情內(nèi)容,給他們做出標(biāo)記以便清除它們。
“人工智能對Facebook的全系列產(chǎn)品的用戶體驗有至關(guān)重要的影響?!盕acebook的機器學(xué)習(xí)應(yīng)用小組AML(Applied Machine Learning)負責(zé)人Joaquin Candela這樣講;這個小組把平臺本身也作為研究對象。“今天,F(xiàn)acebook已經(jīng)離不開AI了?!?/p>
隨著這片領(lǐng)域發(fā)展得越來越好,F(xiàn)acebook會越來越需要LeCun和他的團隊來讓自己對任何現(xiàn)有的或者新來的人工智能科技企業(yè)保持競爭優(yōu)勢。
經(jīng)過多年的批評和邊緣化之后,LeCun終于翻盤了:有80位研究人員,有Facebook充足的資金支持,還有主流觀點對他工作的支持?,F(xiàn)在他只需要有產(chǎn)出就好了。
從一開始,LeCun就相信他能讓電腦擁有看的能力。面部識別和圖像檢測,在今天看來也許稀松平常,但是對于1980年代在巴黎讀大學(xué)時候的LeCun來說,電腦基本就是沒有任何視覺能力的,不能理解照片里面的任何東西,也沒辦法弄清相機鏡頭里都拍到什么了。這片領(lǐng)域從1960年代以來沒有怎么得到開發(fā),而LeCun在大學(xué)中遇到了一種解決這個領(lǐng)域問題的方法,他覺得這種方法沒準(zhǔn)能“讓機器學(xué)會做很多任務(wù),包括理解”。
這種被稱作“人工神經(jīng)網(wǎng)絡(luò)”的方法,用小的、互相連接的傳感器組成系統(tǒng),用它們把圖片這樣的內(nèi)容拆解成小塊,然后從其中發(fā)掘模式,再根據(jù)它們的整體輸入判斷它們看到的是什么。這些神經(jīng)網(wǎng)絡(luò)表面上看來很難訓(xùn)練,而且功能算不上強大,但是在LeCun了解過相關(guān)討論以后,他還是決定無論如何要做這個方向的研究,放下疑慮,攻讀了這個方向的博士學(xué)位。“我覺得不是那樣”,這是他對外界評價的態(tài)度。
人工智能領(lǐng)域也會有艱難的時候,以它發(fā)生的頻率和強度,這種艱難的時候甚至有了自己的名字”AI寒冬”(AI Winter)。這種情況多數(shù)發(fā)生在研究者得到的結(jié)果并未達到宣稱效果的時候,這個顯得好像是科學(xué)理論本身有問題。接著發(fā)生的就是外界資金和關(guān)注度下降,技術(shù)進展也隨著停滯。
LeCun也像其他人一樣受到了“AI寒冬”的影響。90年代中期,LeCun在貝爾實驗室做著一份人工智能研究的工作,然而公司內(nèi)部斗爭解散了他的小組。即便LeCun認為研究已經(jīng)有了顯著的成果,他的項目——利用神經(jīng)網(wǎng)絡(luò)進行支票識別的ATM——也隨之停止,而這項技術(shù)在今天則被廣泛使用?!熬驮诔晒Φ睦杳鱽砼R之際,整個項目卻被解散得差不多了”,LeCun回憶道,“這真的讓人很郁悶”。
同一時間,主流的開發(fā)者開始展現(xiàn)出對其它方法的喜好。雖然這些方法后來也被拋棄了,但是它們在這個時候的興起還是足以把LeCun這位長期的競爭者邊緣化。新世紀(jì)頭幾年,其它的學(xué)術(shù)會議甚至不允許他展示論文。Geoffrey Hinton是神經(jīng)網(wǎng)絡(luò)的先驅(qū),現(xiàn)為谷歌工程Fellow的他同時也是多倫多大學(xué)教授,他回憶起那段時間LeCun所受的待遇時是這樣說的:“計算機視覺圈子基本上不待見他,他們覺得他做的事情在80年代還有潛力,但是2000年的時候就應(yīng)當(dāng)放棄了”。不過他也補充道,“現(xiàn)在沒人這樣覺得了?!?/p>
那時候其它的神經(jīng)網(wǎng)絡(luò)研究人員也遇到了類似的問題。即便是蒙特利爾大學(xué)的教授、MILA領(lǐng)頭人Yoshua Bengio,那時候也很難找到愿意跟從他的研究生。他說:“我得逼著我的學(xué)生們研究這些,因為他們怕博士畢業(yè)以后找不到工作”。
2003年對于LeCun是關(guān)鍵的轉(zhuǎn)折點。那一年,他加入了紐約大學(xué)任職,并且與Hinton和Bengio結(jié)成了一個不怎么正式的同盟來復(fù)興神經(jīng)網(wǎng)絡(luò)(雷鋒網(wǎng)按:實為神經(jīng)計算和自適應(yīng)感知項目,Neural Computation and Adaptive Perception)?!拔野盐覀円黄鹱龅倪@件事稱作深度學(xué)習(xí)陰謀”,LeCun說到這里露出了一個狡黠的笑容。
NCAP在這個領(lǐng)域發(fā)揮了無可比擬的作用,發(fā)揮著把自己的信念貫徹到底的美德,他們并沒有為每一種要檢測的內(nèi)容建立單獨的、專用的神經(jīng)元,而是用同一個模版建立一種可以檢測圖像、視頻和對話的神經(jīng)元。所以,并不是用一個網(wǎng)絡(luò)去識別企鵝,再用另一個網(wǎng)絡(luò)去識別貓,你可以用同一個網(wǎng)絡(luò)來檢測兩種東西,而且還能做出區(qū)分。這些新型的神經(jīng)網(wǎng)絡(luò)還可以加以修改后用于其它的任務(wù),比如分析聲波來檢測人聲的模式。
有兩個外部因素對NCAP起到了明顯幫助,一個是不斷提高的計算能力,這讓神經(jīng)網(wǎng)絡(luò)的運行速度提升得具有足夠的實用性;另一個可以用來訓(xùn)練網(wǎng)絡(luò)的數(shù)據(jù)(圖片文本等等),得益于互聯(lián)網(wǎng)的廣泛應(yīng)用,它們也在成指數(shù)增長,而神經(jīng)網(wǎng)絡(luò)可以通過它們來變得越來越聰明。最終造就了一種靈活、快速、準(zhǔn)確的方法,為整個領(lǐng)域帶來了新的可能性。
隨著LeCun和他的同伴們把基礎(chǔ)結(jié)構(gòu)都建立完畢,計算機視覺從2010年以來迎來了爆炸式的發(fā)展。計算機能夠開始識別物體,先是來自單幅圖像的,再是來自視頻的,接著還可以是來自實時的攝像頭的?,F(xiàn)在,你可以把攝像頭對準(zhǔn)一個籃球,然后人工智能就能夠知道它看見的是什么。很快,LeCun不再是邊緣化的那個人,他成為了業(yè)內(nèi)的領(lǐng)軍人物?!皬臎]人做這個方向,到所有人都來做這個方向,只經(jīng)過了不到一年時間”,LeCun說,“這簡直是瘋了,完全瘋了”(It's just insane — it's completely insane.)。
2013年12月,LeCun加入了Facebook,對他來說這是一個研究如何把人工智能應(yīng)用到圖像中的理想環(huán)境。Facebook的平臺中有數(shù)十億的圖像,給LeCun和他的團隊提供了一張巨大的畫布來繪制他們的想法。FAIR定期和AML進行合作,把他們最新的研究成果變成Facebook proper中的實際行動。這兩個團隊的人合作建立了一套系統(tǒng)來讓整個公司上下都能用到最新的技術(shù)。AML用FAIR的研究成果來協(xié)助確定在你的新鮮事里顯示什么內(nèi)容,或者在Facebook內(nèi)部做內(nèi)容翻譯;AML還在給Facebook的內(nèi)部攝像頭中加入FAIR的成果,來讓它們可以根據(jù)人的動作做出特殊效果,跟人互動。
讓計算機有能力看到,是給計算機教會世界運行規(guī)律的基礎(chǔ)。人之所以能懂得世界運行的規(guī)律是因為我們能夠一遍又一遍地觀察到這些情境發(fā)生,從而發(fā)展出對它們接下來會怎么樣的理解。假設(shè)我們站在路上,看到一輛車從路的遠方高速開過來,我們能夠預(yù)計車可能會撞到我們,所以我們會躲開。當(dāng)天色昏暗的時候,我們能夠預(yù)計把燈的開關(guān)打開可以讓周圍重新亮起來,所以我們會把燈打開。
FAIR正在試著給電腦教會預(yù)測結(jié)果的能力,就像人類一樣,用的也是類似的方法。根據(jù)LeCun的解釋,他的團隊反復(fù)給AI看大量的有關(guān)聯(lián)的視頻,然后在某個點停下來,讓AI來預(yù)測接下來會發(fā)生什么。假設(shè)你反復(fù)給AI看那種在一個人的頭頂上方翻轉(zhuǎn)一瓶水的視頻,AI很有可能可以判斷出來這種動作會把人淋濕。
LeCun給我們解釋了他的想法:“從某種程度上,智力的核心就是預(yù)測的能力。如果你能夠根據(jù)自己的行動預(yù)測接下來會發(fā)生的事情,那你就能夠做出計劃。據(jù)此就可以計劃一系列的動作,來達到某個具體的目標(biāo)?!?/p>
教會人工智能預(yù)測的能力,是業(yè)內(nèi)最眾說紛紜的難點之一,很大程度上是因為在不少情境下理論上正確的后果可能會出現(xiàn)很多種。
你可以想象把一支筆立在桌子上然后松手,LeCun說,如果你問電腦一秒鐘以后這支筆會在哪里,是沒有什么正確答案的,因為電腦能判斷出筆會倒下來,但是它沒辦法精確地判斷出筆最后會具體掉在哪里。所以你就需要告訴系統(tǒng),可能有很多個答案都是正確的,“然后實際上發(fā)生的事情僅僅是眾多可能性中的一種。這就是學(xué)習(xí)在不確定的情況下進行預(yù)測會遇到的問題?!?/p>
讓AI明白和接受可能性是人工智能訓(xùn)練方法的一種,稱作“無監(jiān)督學(xué)習(xí)”,現(xiàn)在這是領(lǐng)域的前沿。當(dāng)AI通過足夠多的觀察,能夠明白世界如何運行并且預(yù)測接下來會發(fā)生什么的時候,它的思考方式就能更像人類一點,具備一定的常識那樣的東西。而這在LeCun看來也是讓計算機變得更加智能的關(guān)鍵。
LeCun和他的團隊成員們已經(jīng)做好了可能會花費很多年才能讓AI完全理解灰色地帶的心理準(zhǔn)備,但是他們有信心一定能達成那一步。Larry Zitnick是LeCun團隊中的一位研發(fā)經(jīng)理,他認為:“這一天一定會來到的,不過這應(yīng)當(dāng)是一個10年期目標(biāo)”。
去年12月,馬克扎克伯格公開了一段引人注目的視頻,是他的“人工智能管家Jarvis”的demo。這位Facebook創(chuàng)始人自己給Jarvis編程,而Jarvis能夠給扎克伯格烤面包,能夠在識別出扎克伯格父母的臉之后迎接他們進屋,甚至還給他的小孩Max用中文上了一節(jié)課。
Jarvis看起來挺酷炫的。不過在LeCun眼里也沒什么特別,“它基本上都是在執(zhí)行命令,而且也相對比較簡單。它的智力從某種程度上講還比較淺層,”LeCun說。他的眼光要比這高多了。
LeCun想要做的是智能助理(assistants),能夠真正理解你所講的那種?!澳軌虺掷m(xù)對話的機器人,”他說,“能夠提前計劃的機器人。你不會因為嫌他們蠢而不喜歡它們的機器人?!?/p>
現(xiàn)在他們還沒有造出這種機器人的明確計劃,但是FAIR所研究的內(nèi)容都是一些很有可能成為它的基石的課題,其中之一就是讓AI對世界有基本的認識,并且訓(xùn)練它、讓它能夠預(yù)測接下來會發(fā)生什么;還有一件事是讓AI可以讀書寫字,F(xiàn)AIR也在用神經(jīng)網(wǎng)絡(luò)進行對應(yīng)的研究。對電腦來說,圖片就是一系列數(shù)字,但是一句語音、一段文字也可以表達成一系列數(shù)字。這樣,LeCun這樣的研究者就可以用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來從圖像中識別對象、從語音中識別文字、從文字中識別話題。
AI目前還不能像理解圖片那樣理解文字,但是LeCun心里已經(jīng)對終極的Jarvis有了自己的構(gòu)想。他心目中理想的助理,具有對世界的常識和與其它助理進行溝通的能力。如果你想要約朋友一起去聽音樂會,你會讓你的助理來協(xié)調(diào),它們會自動地對比你的音樂品味、日程安排、正在上演的曲目,然后給你給出建議。
LeCun說:“計算機需要對世界的規(guī)律有一定的理解。比如人沒辦法同時出現(xiàn)在兩個地方,人沒辦法在短時間內(nèi)就從紐約到舊金山,類似這種對旅行產(chǎn)生影響的因素。如果要為別人安排生活事件的話,有很多常識都是需要提前知道的?!?/p>
Facebook正在用一個類似這種,但是做了一定簡化的數(shù)字助理進行試驗,他們把它稱作M,由Messenger團隊運營,用到了一些FAIR的研究成果。Facebook Messenger團隊近期發(fā)布了“M建議”功能,M會判斷用戶對話,然后在它覺得需要它幫忙的時候插進來。比如當(dāng)有人問你“你在哪”,M就可以在對話中給你談出來一個選項,供你在屏幕上輕點一下就能把你的當(dāng)前位置分享出去。未來Facebook很可能把這種功能拓展到更多的場景中,發(fā)揮更多的功能。
M只是Facebook在人工智能語義理解的應(yīng)用之一,他們也在考慮這種技術(shù)還能如何派上用場。甚至,即便最近Facebook參與了形成一些交流的阻礙(雷鋒網(wǎng)按:指下文Facebook的極端化與假新聞事件),他們也可能打算把它作為打通這種阻礙的方法之一。
即便在2016年美國競選引發(fā)了人們對Facebook極端化和假新聞的聲討之前,LeCun團隊的成員Y-Lan Boureau就已經(jīng)在研究如何用人工智能來在Facebook上引導(dǎo)更有建設(shè)性的對話了。Boureau既學(xué)習(xí)過神經(jīng)學(xué),也學(xué)習(xí)過人工智能;她加入這個項目的原因是看到了她的朋友們因為不愿意接受與自己立場相反的觀點,所以在Facebook上爭執(zhí)了起來。Boureau說,“如果我們能夠更好地理解到底是什么在引導(dǎo)著人們思考,如果我們能夠明白觀點是如何形成并且固化、僵化的,如果我們能夠搞清為什么兩個最終會沒辦法互相交流,這會是一件很有意義的事情”。
Boureau想創(chuàng)造這樣一個世界,在這個世界中我們盡可能地看到不同的意見,直到我們開始拒絕接受更多的意見為止。人工智能可以通過發(fā)掘文本中的模式、發(fā)現(xiàn)什么時候?qū)υ掗_始走偏方向、有可能的話想辦法改變對話的走向,來避免情況轉(zhuǎn)壞?!叭绻覀兡芡ㄟ^數(shù)據(jù)對學(xué)習(xí)和人們腦中建立信念的過程有更多的了解,那我們可能可以更好地從整體上弄懂如何引導(dǎo)更多有建設(shè)性的對話?!盉oureau這樣說。
在2016年美國競選結(jié)束之后,LeCun公開宣稱Facebook已經(jīng)有技術(shù)能力來用人工智能篩選去除假新聞。對于美國廣泛存在的極端化問題,許多人認為LeCun的方法可能會起到一些作用,但是他本人認為這些工作最好還是由第三方來做,而不是同樣有能力引發(fā)偏見的機器們。“AI在這個問題上確實能夠起到作用,但這將是一個非常復(fù)雜的產(chǎn)品設(shè)計問題,而非技術(shù)問題”,LeCun說,“你的目的并不是把人們引向特定的話題,實際上這種情況下你還是想要保持中立。”
不斷升級的夸張宣傳對人工智能可能會帶來不小的危險,LeCun尤其明白。到今天,很明顯我們正處在這種狀況中。Bloomberg指出,在2013年第一季度,只有6家公司宣稱把人工智能用在盈利業(yè)務(wù)中;而到了2017年第一季度,就有244家公司這樣講了。
LeCun在談到未來的時候用詞非常謹慎:“我們目前距離理想的目標(biāo)還很遠?!彼踔?xí)妫骸斑@些東西運作得并沒有我們預(yù)想得那么好?!贝_實是這樣,正如LeCun的謹慎所呈現(xiàn)的那樣,現(xiàn)在的人工智能距離達到人類級別智力,或者說通用AI還有很長的距離。
即便這樣,LeCun也還是充滿了激情。對抗訓(xùn)練(adversarial training)是一種相對比較新的人工智能研究方向,它能夠幫助解決這個領(lǐng)域目前遇到的預(yù)測和不確定挑戰(zhàn)方面的困難,而LeCun尤其喜歡它。對抗訓(xùn)練的特征是讓兩個AI系統(tǒng)互相對抗,讓它們從這個過程中學(xué)習(xí)真實世界。比如在某個FAIR的試驗中,研究人員讓一個AI畫圖,然后讓另一個AI來判斷這幅圖是否是人類所畫;前一個AI就根據(jù)用后一個AI的結(jié)果指導(dǎo)自己畫的更好。
在今年初的一個會議中,LeCun展示了一些更高端的東西:生成器要讓判別器判斷它從一段視頻中截取了畫面,還是創(chuàng)造了什么內(nèi)容?
一個AI要讓另一個AI相信它從這第二個AI已經(jīng)看過的視頻里截取了一部分創(chuàng)造了幾幀畫面。LeCun說,這種對抗訓(xùn)練,“是最近10年或者20年內(nèi)機器學(xué)習(xí)方面最好、最酷的點子?!?/p>
就這樣,LeCun會繼續(xù)研究對抗訓(xùn)練,又一次地把這個領(lǐng)域拓展到新的邊界。他早已經(jīng)不是20年前那個沒人愿意聽他講話的人了。盡管LeCun說這項工作還遠遠沒有結(jié)束,成功也遠遠不是他一個人的功勞,他還是一直在享受研究的過程。他說:“它并沒有讓我覺得糟糕,實際上我覺得棒極了。”
AI科技評論招業(yè)界記者啦!
在這里,你可以密切關(guān)注海外會議的大牛演講;可以采訪國內(nèi)巨頭實驗室的技術(shù)專家;對人工智能的動態(tài)了如指掌;更能深入剖析AI前沿的技術(shù)與未來!
如果你:
*對人工智能有一定的興趣或了解
* 求知欲強,具備強大的學(xué)習(xí)能力
* 有AI業(yè)界報道或者媒體經(jīng)驗優(yōu)先
簡歷投遞:
lizongren@leiphone.com
相關(guān)文章:
Facebook Yann LeCun一小時演講: AI 研究的下一站是無監(jiān)督學(xué)習(xí)(附完整視頻)
2017 美國工程院院士名單公布,Lecun、沈向洋、黃永剛、張東曉、陳向力等多人入選
Facebook 人工智能大揭秘:AI 如何變成這家社交巨頭不可或缺的部分?
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。