1
本文作者: 何忞 | 2017-03-07 19:12 |
雷鋒網(wǎng)按:本文作者為 Backchannel 的 編輯 Steven Levy,雷鋒網(wǎng)編譯發(fā)布。
當被問及是否想要用人工智能領(lǐng)導全球最大的社交網(wǎng)站時,Joaquin Qui?onero Candela 猶豫了。
猶豫不是因為這個西班牙裔又自詡為“機器學習人”的科學家沒有意識到人工智能會對 Facebook 提供巨大幫助。自從2012年 Candela 加入 Facebook 以來,他一直負責用機器學習的方法改革公司的廣告運營,讓廣告投放更加具有相關(guān)性和有效性。更重要的是,他讓團隊中的工程師在即使沒接受過訓練的情況下也可以主動使用人工智能,用機器學習技巧讓廣告部門的工作更好。但是他不確定的是,人工智能能在 Facebook 其他更廣闊的領(lǐng)域內(nèi)發(fā)揮作用,畢竟在這個社交網(wǎng)絡中,數(shù)以十億計的個體聯(lián)系所依賴的數(shù)據(jù)比廣告運營的“硬數(shù)據(jù)”模糊而復雜得多。關(guān)于升級,他說到:“我想要確認,人工智能在這里的確有它的價值?!?/p>
雖然有猶豫,但是 Candela 還是接受了這個職位。而兩年后的今天,他的猶豫似乎已經(jīng)失去了意義。正如上個月在紐約的會議上 Candela 對大家說的:“我要在這里強調(diào),如今的 Facebook 已經(jīng)與人工智能難舍難分了,你對 Facebook、Instagram 和 Messenger 的每一次使用,你也許不會意識到,但是你的體驗都是由人工智能驅(qū)動的?!?/p>
去年十一月,我有幸在 Facebook 位于門洛帕克市的總部采訪了 Candela 和他的部分團隊,我也清楚地看到人工智能是如何一夜間變成了 Facebook 不可或缺的一部分。
今天,大家都把注意力集中在了 Facebook 世界級的人工智能研究團隊(FAIR)上,該團隊由著名神經(jīng)網(wǎng)絡專家 Yann LeCun 領(lǐng)導,在谷歌、微軟、百度、亞馬遜和蘋果等眾多競爭者中,仍然是優(yōu)秀的人工智能領(lǐng)域人才渴望加入的理想工作團隊。
該團隊在計算機學習人類大腦進行觀察、傾聽和思考所用的數(shù)字神經(jīng)網(wǎng)絡領(lǐng)域常常做出突破性研究。但是 Candela 的機器學習應用團隊(AML)承擔著與 FAIR 相對獨立的研究——將人工智能應用在 Facebook 的實際產(chǎn)品中,更重要的是,讓公司的工程師們把機器學習應用到他們的工作中。因為 Facebook 已經(jīng)無法離開人工智能而存活了,公司所有的工程師都必須使用 AI 開展工作。
在我進行采訪的兩天前,F(xiàn)acebook 發(fā)生了傳播假新聞幫助川普競選的事件,扎克伯格評論說“太瘋狂”,這個評論就像是火上澆油,很多人覺得 Facebook 是涉嫌串通將假消息放在 News Feed(動態(tài)信息流)中傳播了出去。盡管很多爭議早已超出了 Candela 的職責范圍,但是他明白 Facebook 對假新聞的最終解決辦法取決于機器學習研究的進展,而這也正是他的團隊所要負責的部分。
采訪中,也許是有公關(guān)人員在場坐鎮(zhèn),Candela 想要給我展示一些不同的東西——他的團隊研究的一個成果樣本。但是令我驚訝的是,他展示的只是一個有點無聊的把戲:用著名畫家的風格重新演繹一幅畫或一段視頻,就像你曾經(jīng)在 Snapchat 上看到過的那種數(shù)字特效,在照片中加入畢加索立體主義的風格。
Candela 解釋說:“這背后的技術(shù)叫做風格遷移。就是用一個經(jīng)過訓練的大型神經(jīng)網(wǎng)絡將原有的圖像用一個特殊的風格重新繪制?!八贸鍪謾C拍了張照片,經(jīng)過一些操作之后,照片變成了一幅梵高《星空》的再生品。更驚奇的是,它還能按照規(guī)定的風格繪制視頻。但是 Candela 說,這項技術(shù)最關(guān)鍵的是人們看不到的一點:Facebook 已經(jīng)建立了自己的神經(jīng)網(wǎng)絡,所以這項技術(shù)可以在手機上直接實現(xiàn)。
這實際上也并不新奇,因為蘋果此前曾夸口說他們已經(jīng)在 iPhone 上使用了一些神經(jīng)網(wǎng)絡計算。但是這對 Facebook 來說很難,因為他們無法控制硬件設備。Candela 說他的團隊之所以能勝任這份工作,是因為團隊的工作是疊加式的——每一個項目都可以輕易地疊加在另一個上面,每一個項目都如此運行,以便今后設計相似項目的時候減少對神經(jīng)網(wǎng)絡訓練的工作量,提升工作效率?!皬拈_始接手任務到公開測試,我們只用了8周時間,這挺瘋狂的?!彼f。
(從左到右:機器學習應用工程主管Joaquin Candela、計算機視覺應用團隊主管Manohar Paluri、技術(shù)產(chǎn)品經(jīng)理 Rita Aquino、工程經(jīng)理 Rajen Subba)
Candela 還說,如此快速地完成任務還取決于大家的合作——這也是 Facebook 的企業(yè)文化精髓。在這次任務中,與 Facebook 其他團隊的順暢溝通非常重要,正是因為移動設備團隊對 iPhone 硬件非常了解,才使得我們可以用手機直接實現(xiàn)在 Facebook 數(shù)據(jù)中心上對圖像的重繪。這項研究的好處不僅僅能讓用戶視頻中的人物變成愛德華蒙克的《尖叫》風格。它還是整個 Facebook變得更加強大的第一步。不久之后,這項技術(shù)能讓計算機對語言翻譯和文本理解的反應速度更快。在更遠的未來,這項技術(shù)甚至可以實時分析你的所見所聞。Candela說:“我們是說‘實時‘,比一秒還短的時間。因為我們是社交網(wǎng)絡,如果我們想要對人們的社交反饋做出預測,那系統(tǒng)必須立即反應,對吧?”說完,他又看了看剛剛那張梵高式的照片,毫不掩飾自己的自豪之情?!霸谑謾C上運行復雜的神經(jīng)網(wǎng)絡,意味著把人工智能交付到每個人手中。“他接著說,”這不是偶然產(chǎn)生的,這也是我們在公司中實現(xiàn)人工智能自主化的一種方式。我們已經(jīng)為此努力很久了?!?/p>
Candela 出生在西班牙。在他3歲的時候,全家搬到了摩洛哥,他在那里上了法語學校。盡管他在科學和人文方面的成績都很高,他還是決定在馬德里上大學,學習他覺得最難的專業(yè):通信工程,這不僅要求對無線電、放大器等物理知識的充分掌握,還需要理解數(shù)據(jù),但他認為“這非常酷”。他師從一位研究改善自適應系統(tǒng)的教授,建立了一個利用智能濾波器增強漫游手機信號的系統(tǒng),他將這稱之為一個“初始的神經(jīng)網(wǎng)絡”。與編程相比,他更喜歡訓練算法,2000 年在丹麥學習的一個學期的經(jīng)歷讓這個興趣更強了。在丹麥,Candela 結(jié)識了一位研究機器學習的教授 Carl Rasmussen,他與機器學習著名專家 Geoff Hinton 共事多年。畢業(yè)前夕,當 Candela 正準備加入寶潔團隊時, Rasmussen 教授邀請他繼續(xù)博士的學習。他最終選擇了機器學習。
2007年,他加入了英國劍橋的微軟研究實驗室。工作不久后,他就明白了公司層面的競爭:微軟將要推出 Bing,但是還需要改進搜索廣告部分一個關(guān)鍵構(gòu)件——用來預測用戶何時會點擊廣告。微軟決定開展一項內(nèi)部比賽,獲勝的團隊方案會被測試是否實用,團隊成員則會獲得一次免費夏威夷旅行。19 個隊伍參加了比賽,Candela 的團隊最終獲勝。他獲得了免費旅行,但是當微軟推遲方案測試的時候,他覺得自己被騙了。為了展示決心,Candela 開展了一個所謂的“瘋狂十字軍東征”,試圖說服公司給他一個機會。他進行了至少 50 次內(nèi)部談話,建立了一個模擬器來展示自己算法的優(yōu)越性,跟蹤可以拍板的高管,在吃飯的時候故意跟高管坐在一起,在洗手間向領(lǐng)導宣傳自己的系統(tǒng),在總裁辦公室不請自來,爭論到“承諾就是承諾,必須執(zhí)行,況且他的算法確實更好”。最終,candela 的算法在 2009 年嵌入進 Bing 中。
2012 年,Candela 會見了一位在 Facebook 工作的朋友并參觀了位于門洛帕克市的辦公室。他驚奇地發(fā)現(xiàn)在這個公司里,大家不用求著領(lǐng)導測試自己的系統(tǒng),他們可以自主決定。兩天后,他去 Facebook 面試了,一周后,他加入了 Facebook 的廣告團隊,領(lǐng)導一個小組研究如何向用戶展示更多相關(guān)廣告。盡管那時的系統(tǒng)已經(jīng)使用了機器學習,但是 Candela 認為,“模型不夠先進,太普通了”。
(Facebook 大樓內(nèi)景)
與 Candela 一同進入 Facebook 的另一個工程師是 Hussein Mehanna(他們一同參加了新雇員代碼訓練營),他也認為 Facebook 的人工智能系統(tǒng)太過落后。Mehanna 說:“我從外部觀察它產(chǎn)品質(zhì)量的時候,以為 Facebook 的工作早已人工智能化了,現(xiàn)在看來,顯然還沒有。幾周后我告訴 Joaquin,F(xiàn)acebook 最缺少的是一個合適的先進的機器學習平臺。我們已經(jīng)有了機器,但是沒有合適的軟件幫助機器盡可能多地從數(shù)據(jù)中學習。”(Mehanna 目前是 Facebook 的核心機器學習主管,也是微軟的老員工,采訪中微軟老員工都跳槽到了 Facebook,是巧合嗎?)
Mehanna 所說的“機器學習平臺”,是將人工智能從上個世紀的“寒冬”變?yōu)楝F(xiàn)在蓬勃發(fā)展的模仿人類大腦行為的范式應用。在廣告領(lǐng)域,F(xiàn)acebook 需要的是一個人類工作無法實現(xiàn)的系統(tǒng):對廣告點擊人數(shù)的即時預測。Candela 和他的團隊要基于機器學習的方法創(chuàng)造出這個新系統(tǒng)。并且,因為他們想要將這個系統(tǒng)建成一個平臺,他們的模型和訓練必須具有一般性和可復制性。
建立機器學習平臺的一個重要因素是高質(zhì)量數(shù)據(jù)的獲取,越多越好。幸運的是,這正是 Facebook 一項最大的資產(chǎn):當超過十億人每天與 Facebook 的產(chǎn)品互動時,它可以為他們的訓練收集大量數(shù)據(jù),并且當他們開始測試時,會有取之不盡的用戶行為樣本。這使得廣告團隊進展很快,從每幾周推出一個新模型到每周推出一個新模型。另外,因為系統(tǒng)最終會成建成一個平臺,公司內(nèi)部會使用平臺來設計自己的產(chǎn)品,Candela 設計了一個多團隊同時工作的方法——一個簡潔的三步過程:“首先關(guān)注績效,接著是效用,最后建立一個社區(qū)”。
Candela 的廣告團隊已經(jīng)證明了機器學習可以為 Facebook 帶來多大的變革力量。他說:“我們在預測廣告點擊率上取得了巨大成功,就像是一次大轉(zhuǎn)變。”所以將這個方法擴展到更大的服務中是很自然的事情。事實上,F(xiàn)AIR 的領(lǐng)導 LeCun 已經(jīng)在爭取建立一個伙伴團隊,將人工智能應用在公司產(chǎn)品中,將機器學習的方法更廣泛地應用在公司運營中。LeCun 說:“我正在為此努力,因為我們需要高素質(zhì)的工程師,雖然他們不直接與產(chǎn)品打交道,但產(chǎn)品團隊卻需要他們提供技術(shù)基礎。”
2015 年 10 月,Candela 成為了新的 AML 團隊主管(在一段時間內(nèi),他還同時兼任著廣告團隊的負責人)。他與 FAIR 團隊保持著密切的聯(lián)系。雖然 FAIR 在紐約、巴黎和門洛帕克市都有辦公地,但實際上他們的成員就坐在 AML 工程師旁邊。
他們合作的方式可以用一個正在運行中的產(chǎn)品來說明,該產(chǎn)品是 Facebook 上對照片進行語音描述功能。過去的 5 年中,訓練系統(tǒng)識別屏幕中的物體并給出一般性結(jié)論(比如照片是在室內(nèi)還是室外拍攝)已經(jīng)成為了人工智能訓練的普遍標準。但是最近,F(xiàn)AIR 的科學家們發(fā)現(xiàn)了一個方法,可以訓練神經(jīng)網(wǎng)絡在圖像中變出每一個物體并判斷他們之間的位置和關(guān)系,進而理解整個圖像的含義,比如分析出圖中人們正在擁抱,或者有人正在騎馬。LeCun 說:“我們將這個方法展示給 AML 團隊,他們思考了一會兒,說‘在一種情形下,這項技術(shù)會非常有用’?!庇谑牵粋€幫助盲人或視力低下的人“閱讀”圖片的功能原型出現(xiàn)了。Candela 談到他的姐妹團隊:“我們一直在交流。更大的挑戰(zhàn)是將科學技術(shù)轉(zhuǎn)化成產(chǎn)品,這需要粘合劑,而我們就是這個粘合劑。”
Candela 將人工智能的應用分為四個部分:視覺、語言、談話和照相機特效。他認為這四個部分會產(chǎn)生一個“理解內(nèi)容的機器”。通過研究如何明白內(nèi)容的含義,F(xiàn)acebook 可以從評論中、話語的細微變化中探查隱含的意思,在視頻中識別出你朋友一閃而過的面孔,在你真實的會話中解譯你的表達。
Candela 說:“我們正在使人工智能一般化。在內(nèi)容激增的今天,我們需要理解和分析內(nèi)容,否則我們貼標簽的能力就會跟不時代了?!倍鉀Q方法就在于建立一個普遍性的系統(tǒng),使得一個項目的工作可以為相關(guān)項目的工作提供幫助。他說:“如果我能將其他項目的成果轉(zhuǎn)移來構(gòu)建我自己的算法,豈不是非常棒?” 這樣的轉(zhuǎn)變讓 Facebook 產(chǎn)品上新的速度飛速提升。拿 Instagram 舉例:最開始的時候,用戶展示的照片是按照時間順序反向排序的。但是在 2016 年初,公司決定使用算法將照片按照相關(guān)性來排列。好消息是因為 AML 已經(jīng)完成了類似于 News Feed 動態(tài)信息流中的機器學習部分,所以“他們不用從抓取數(shù)據(jù)開始做起“,Candela 說,“他們有一兩個熟悉機器學習的工程師負責聯(lián)系其他運作排序類應用的團隊,所以他們可以直接復制那些團隊的工作流程,出現(xiàn)問題的時候也可以去詢問他們?!庇谑?,Instagram 在幾個月內(nèi)就完成了這個劃時代的轉(zhuǎn)變。
AML 團隊總是在找尋機會,將神經(jīng)網(wǎng)絡的強大功能融入不同的團隊,幫助他們在 Facebook 層面創(chuàng)造獨特的產(chǎn)品功能。AML 知覺團隊主工程師 Tommer Leyvand 說:“我們正在使用機器學習技術(shù)構(gòu)建自己的核心競爭力,滿足用戶的需求?!保‵YI,他也是從微軟跳槽來的?。?/p>
(Facebook 技術(shù)產(chǎn)品經(jīng)理 Rita Aquino,雷鋒網(wǎng)注)
最近新出的一個叫做“社交推薦”的功能也是一個很好的例子。大約一年前,一個 AML 的工程師和 Facebook 分享團隊的一個產(chǎn)品經(jīng)理談到了公司可以介入的一個場景:當人們詢問朋友有什么可以推薦的當?shù)夭蛷d的時候?!澳敲?Facebook 可以怎樣把推薦的信息展示給用戶呢?“Rita Aquino 說道。分享團隊一開始使用詞匯匹配的方式回應推薦指令。但是 Aquino 說:“當每天有數(shù)十億的推送時,精確和升級的要求就不是必須的了。” 通過對神經(jīng)網(wǎng)絡的訓練和使用真實數(shù)據(jù)對模型的測試,他們已經(jīng)可以探查非常細微的語言區(qū)別,準確地探查到哪個用戶正在詢問某地區(qū)內(nèi)的餐廳或商場,進而觸發(fā)一個指令,將相關(guān)的鏈接展示在用戶的 News Feed 上。接著當某人提供了一個推薦時,機器學習會在用戶的 News Feed 上顯示出餐廳或商場的地理位置。
Aquino 說,她在 Facebook 的一年半時間里,見證了人工智能從產(chǎn)品中的邊緣成分變成了產(chǎn)品概念產(chǎn)生的來源。她說:“人們期望與他們交互的產(chǎn)品能夠更加智能。而團隊在創(chuàng)造產(chǎn)品的時候,并不需要成為一個機器學習專家?!?在處理自然語言的例子中,AML 建立了個一個叫做 “Deep Text” 的系統(tǒng),讓其他團隊可以輕松訪問,用機器學習輔助 Facebook 每日使用超過40億次的翻譯功能的實現(xiàn)。
對于圖像和視頻,AML 團隊建立了一個叫做“Lumos”的機器學習視覺平臺。平臺起初是由 Manohar Paluri 創(chuàng)建的,后來 FAIR 的一個實習生在此基礎上設計了一個大型機器學習視覺系統(tǒng),他稱之為 Facebook 的“視覺皮質(zhì)”,一種處理和理解 Facebook 上所有圖像和視頻的方法。在2014年的編程馬拉松上,Paluri 和同事 Nikhil Johir 在一天半時間里創(chuàng)建了一個產(chǎn)品原型,并向扎克伯格和 Facebook 首席運營官 Sheryl Sandberg 展示了結(jié)果。在Candela 開始組建 AML 團隊的時候,Paluri 也加入進來(他同時在 AML 和FAIR 任職),領(lǐng)導計算機視覺團隊,完善 Lumos 平臺,幫助 Facebook 的工程師(包括 Instagram、Messenger、WhatsApp 和 Oculus)使用視覺處理方法。Paluri 說:“在 Lumos 上,公司里的每個人都可以使用神經(jīng)網(wǎng)絡的各種功能來構(gòu)建自己的模型方案。這樣除了 AML 團隊,公司內(nèi)的其他人都可以修正、訓練、推動系統(tǒng)的發(fā)展?!?/p>
Paluri 給我做了一個快速展示。他在筆記本上啟動 Lumos,做了一個簡單的任務:改進了神經(jīng)網(wǎng)絡識別直升機圖像的能力。屏幕上出現(xiàn)了一個大概有5000個直升機形象的頁面,其中也有一些不是直升機(一個是玩具直升機、一些是從直升機視角拍攝的天空),這些數(shù)據(jù)是 Facebook 從用戶發(fā)布的照片中收集來的。即使我完全不是一個工程師,更不懂人工智能,但是也可以簡單地點擊負面樣本來訓練圖像分類器分辨直升機。最終,這個分類步驟,所謂的有監(jiān)督學習,會完全自動化,利用機器學習方法,神經(jīng)網(wǎng)絡會自動探索圖像中的物體,實現(xiàn)“無監(jiān)督學習”。Paluri 說 Facebook 正在為此努力,“我們的目標是明年將人工注釋減少到百分之一?!?/p>
長期來看,F(xiàn)acebook 會將“視覺皮質(zhì)”融入進自然語言平臺上,幫助 Candela 所謂的內(nèi)容理解引擎進行一般化擴展。Paluri 說:“毫無疑問,我們會將他們結(jié)合在一起,也許就叫做……大腦皮質(zhì)。”
Facebook 的最終目標是將機器學習的核心原理通過發(fā)表論文等方式,擴展到甚至是公司之外的領(lǐng)域。Mehanna 說:“大家不用在花費大量時間創(chuàng)建智能應用,我們可以進展得更快。想象一下,它的影響可以涉及到醫(yī)藥,安全,交通等各個領(lǐng)域。我認為這些領(lǐng)域的應用開發(fā)速度會有百倍增長?!?/p>
(Facebook 計算機視覺應用團隊主管 Manohar Paluri,Stephen Lam 拍攝于門洛帕克市 Facebook 大樓,2017年2月6日)
盡管 AML 機器學習應用在幫助 Facebook 的產(chǎn)品進行觀察、理解甚至對話的過程中發(fā)揮了重大作用,但是扎克伯格認為機器學習的應用還會在 Facebook 的良好社交方面起到重要作用。在他 5700 字的構(gòu)建社交社區(qū)的聲明中,7次提到了“人工智能”,闡釋機器學習和其他技術(shù)能夠如何幫助 Facebook 保持社區(qū)安全和消息靈通。
實現(xiàn)這些目標并不是易事,這也是 Candela 起初在任職問題上猶豫的原因。甚至機器學習也不能解決所有關(guān)于數(shù)十億人之間溝通信息的問題。也正是因為這樣,F(xiàn)acebook 不斷研究算法,確定在 News Feed 上要為用戶展示怎樣的內(nèi)容。Candela 認為目前還未解決的最大問題是:當你不確定內(nèi)容時,你要如何訓練系統(tǒng)提供最優(yōu)結(jié)果?他說:“我們提供隨機消息流就意味著浪費了用戶的時間;我們只提供一個朋友的信息流,則贏者通吃。連續(xù)不斷的討論只會得到一個結(jié)論,這兩個極端情況都不是最佳選擇。我們正在探索一個平衡?!?Facebook 試圖利用人工智能來解決這個問題。人工智能也成為了公司解決任何問題都不可或缺的工具?!蔽覀冊跈C器學習和人工智能方面有很多實質(zhì)性研究,試圖優(yōu)化這種平衡。“ Candela說道,語氣中充滿希望。
自然而然地,當 Facebook 變成傳播假新聞的罪人時,它便召集了AI 團隊迅速刪除了界面上所有假消息。這是一次不同尋常的全體努力,甚至包括 FAIR 團隊,LeCun 認為它可以作為“咨詢顧問“。結(jié)果是FAIR 團隊創(chuàng)造出一個解決問題的工具:一個叫做:World2Vec”的模型(Vec 指代矢量 Vector),該模型在神經(jīng)網(wǎng)絡中加入了記憶能力,幫助 Facebook 標記信息的構(gòu)成,比如信息來源、誰分享了該信息。(這里可能會有些混淆,谷歌有一個發(fā)明叫做 W ord2Vec)。通過這個信息,F(xiàn)acebook 可以理解信息分享模式,描述虛假新聞的特征,之后可能會使用機器學習策略剔除掉虛假消息。LeCun 說:“我們最終發(fā)現(xiàn),識別假新聞與找到人們最喜愛頁面的工作并沒有什么不同?!?/p>
Candela 團隊之前建立的平臺讓 Facebook 推出數(shù)據(jù)檢查類產(chǎn)品的速度比以往都快。雖然他們的表現(xiàn)達到什么程度還有待檢驗,但是 Candela 說,過不了多久就能看到 Facebook 用算法判斷來減少假消息的效果有多好了。然而不論這種新方法是否奏效,困境本身對算法是否能解決問題提出了質(zhì)疑——即使機器學習解決了一個問題,但是可能會無意中產(chǎn)生不好的結(jié)果。Candela 反駁了這種質(zhì)疑:“我認為我們會讓世界變得更好?!彼麑ξ抑v了一個故事:在我采訪的前一天,Candela 給 Facebook 上一個用戶打了電話,那個人是他一個朋友的父親,他們有過一面之緣。他看到這個人在 Facebook 上發(fā)表了一些支持川普的言論,覺得有些疑問。Candela 意識到他的工作就是基于數(shù)據(jù)做出決策,而他好像遺漏了一些重要信息,所以他給這個人發(fā)了消息約談,他們最終在電話里進行了對話。Candela 說:“這次經(jīng)歷沒有改變我的生活,但是卻讓我從一個非常不同的角度觀察事物。如果沒有 Facebook,這一切也不會發(fā)生?!?換句話說,盡管人工智能非常重要,對 Facebook 不可或缺,但是這也不是唯一的答案?!皢栴}在于人工智能仍處于嬰兒時期,我們的工作才剛剛開始?!盋andela說。
Via Backchannel
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。