1
本文作者: 何忞 | 2017-03-07 19:12 |
雷鋒網(wǎng)按:本文作者為 Backchannel 的 編輯 Steven Levy,雷鋒網(wǎng)編譯發(fā)布。
當(dāng)被問(wèn)及是否想要用人工智能領(lǐng)導(dǎo)全球最大的社交網(wǎng)站時(shí),Joaquin Qui?onero Candela 猶豫了。
猶豫不是因?yàn)檫@個(gè)西班牙裔又自詡為“機(jī)器學(xué)習(xí)人”的科學(xué)家沒(méi)有意識(shí)到人工智能會(huì)對(duì) Facebook 提供巨大幫助。自從2012年 Candela 加入 Facebook 以來(lái),他一直負(fù)責(zé)用機(jī)器學(xué)習(xí)的方法改革公司的廣告運(yùn)營(yíng),讓廣告投放更加具有相關(guān)性和有效性。更重要的是,他讓團(tuán)隊(duì)中的工程師在即使沒(méi)接受過(guò)訓(xùn)練的情況下也可以主動(dòng)使用人工智能,用機(jī)器學(xué)習(xí)技巧讓廣告部門的工作更好。但是他不確定的是,人工智能能在 Facebook 其他更廣闊的領(lǐng)域內(nèi)發(fā)揮作用,畢竟在這個(gè)社交網(wǎng)絡(luò)中,數(shù)以十億計(jì)的個(gè)體聯(lián)系所依賴的數(shù)據(jù)比廣告運(yùn)營(yíng)的“硬數(shù)據(jù)”模糊而復(fù)雜得多。關(guān)于升級(jí),他說(shuō)到:“我想要確認(rèn),人工智能在這里的確有它的價(jià)值?!?/p>
雖然有猶豫,但是 Candela 還是接受了這個(gè)職位。而兩年后的今天,他的猶豫似乎已經(jīng)失去了意義。正如上個(gè)月在紐約的會(huì)議上 Candela 對(duì)大家說(shuō)的:“我要在這里強(qiáng)調(diào),如今的 Facebook 已經(jīng)與人工智能難舍難分了,你對(duì) Facebook、Instagram 和 Messenger 的每一次使用,你也許不會(huì)意識(shí)到,但是你的體驗(yàn)都是由人工智能驅(qū)動(dòng)的?!?/p>
去年十一月,我有幸在 Facebook 位于門洛帕克市的總部采訪了 Candela 和他的部分團(tuán)隊(duì),我也清楚地看到人工智能是如何一夜間變成了 Facebook 不可或缺的一部分。
今天,大家都把注意力集中在了 Facebook 世界級(jí)的人工智能研究團(tuán)隊(duì)(FAIR)上,該團(tuán)隊(duì)由著名神經(jīng)網(wǎng)絡(luò)專家 Yann LeCun 領(lǐng)導(dǎo),在谷歌、微軟、百度、亞馬遜和蘋果等眾多競(jìng)爭(zhēng)者中,仍然是優(yōu)秀的人工智能領(lǐng)域人才渴望加入的理想工作團(tuán)隊(duì)。
該團(tuán)隊(duì)在計(jì)算機(jī)學(xué)習(xí)人類大腦進(jìn)行觀察、傾聽和思考所用的數(shù)字神經(jīng)網(wǎng)絡(luò)領(lǐng)域常常做出突破性研究。但是 Candela 的機(jī)器學(xué)習(xí)應(yīng)用團(tuán)隊(duì)(AML)承擔(dān)著與 FAIR 相對(duì)獨(dú)立的研究——將人工智能應(yīng)用在 Facebook 的實(shí)際產(chǎn)品中,更重要的是,讓公司的工程師們把機(jī)器學(xué)習(xí)應(yīng)用到他們的工作中。因?yàn)?Facebook 已經(jīng)無(wú)法離開人工智能而存活了,公司所有的工程師都必須使用 AI 開展工作。
在我進(jìn)行采訪的兩天前,F(xiàn)acebook 發(fā)生了傳播假新聞幫助川普競(jìng)選的事件,扎克伯格評(píng)論說(shuō)“太瘋狂”,這個(gè)評(píng)論就像是火上澆油,很多人覺(jué)得 Facebook 是涉嫌串通將假消息放在 News Feed(動(dòng)態(tài)信息流)中傳播了出去。盡管很多爭(zhēng)議早已超出了 Candela 的職責(zé)范圍,但是他明白 Facebook 對(duì)假新聞的最終解決辦法取決于機(jī)器學(xué)習(xí)研究的進(jìn)展,而這也正是他的團(tuán)隊(duì)所要負(fù)責(zé)的部分。
采訪中,也許是有公關(guān)人員在場(chǎng)坐鎮(zhèn),Candela 想要給我展示一些不同的東西——他的團(tuán)隊(duì)研究的一個(gè)成果樣本。但是令我驚訝的是,他展示的只是一個(gè)有點(diǎn)無(wú)聊的把戲:用著名畫家的風(fēng)格重新演繹一幅畫或一段視頻,就像你曾經(jīng)在 Snapchat 上看到過(guò)的那種數(shù)字特效,在照片中加入畢加索立體主義的風(fēng)格。
Candela 解釋說(shuō):“這背后的技術(shù)叫做風(fēng)格遷移。就是用一個(gè)經(jīng)過(guò)訓(xùn)練的大型神經(jīng)網(wǎng)絡(luò)將原有的圖像用一個(gè)特殊的風(fēng)格重新繪制。“他拿出手機(jī)拍了張照片,經(jīng)過(guò)一些操作之后,照片變成了一幅梵高《星空》的再生品。更驚奇的是,它還能按照規(guī)定的風(fēng)格繪制視頻。但是 Candela 說(shuō),這項(xiàng)技術(shù)最關(guān)鍵的是人們看不到的一點(diǎn):Facebook 已經(jīng)建立了自己的神經(jīng)網(wǎng)絡(luò),所以這項(xiàng)技術(shù)可以在手機(jī)上直接實(shí)現(xiàn)。
這實(shí)際上也并不新奇,因?yàn)樘O果此前曾夸口說(shuō)他們已經(jīng)在 iPhone 上使用了一些神經(jīng)網(wǎng)絡(luò)計(jì)算。但是這對(duì) Facebook 來(lái)說(shuō)很難,因?yàn)樗麄儫o(wú)法控制硬件設(shè)備。Candela 說(shuō)他的團(tuán)隊(duì)之所以能勝任這份工作,是因?yàn)閳F(tuán)隊(duì)的工作是疊加式的——每一個(gè)項(xiàng)目都可以輕易地疊加在另一個(gè)上面,每一個(gè)項(xiàng)目都如此運(yùn)行,以便今后設(shè)計(jì)相似項(xiàng)目的時(shí)候減少對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的工作量,提升工作效率?!皬拈_始接手任務(wù)到公開測(cè)試,我們只用了8周時(shí)間,這挺瘋狂的?!彼f(shuō)。
(從左到右:機(jī)器學(xué)習(xí)應(yīng)用工程主管Joaquin Candela、計(jì)算機(jī)視覺(jué)應(yīng)用團(tuán)隊(duì)主管Manohar Paluri、技術(shù)產(chǎn)品經(jīng)理 Rita Aquino、工程經(jīng)理 Rajen Subba)
Candela 還說(shuō),如此快速地完成任務(wù)還取決于大家的合作——這也是 Facebook 的企業(yè)文化精髓。在這次任務(wù)中,與 Facebook 其他團(tuán)隊(duì)的順暢溝通非常重要,正是因?yàn)橐苿?dòng)設(shè)備團(tuán)隊(duì)對(duì) iPhone 硬件非常了解,才使得我們可以用手機(jī)直接實(shí)現(xiàn)在 Facebook 數(shù)據(jù)中心上對(duì)圖像的重繪。這項(xiàng)研究的好處不僅僅能讓用戶視頻中的人物變成愛德華蒙克的《尖叫》風(fēng)格。它還是整個(gè) Facebook變得更加強(qiáng)大的第一步。不久之后,這項(xiàng)技術(shù)能讓計(jì)算機(jī)對(duì)語(yǔ)言翻譯和文本理解的反應(yīng)速度更快。在更遠(yuǎn)的未來(lái),這項(xiàng)技術(shù)甚至可以實(shí)時(shí)分析你的所見所聞。Candela說(shuō):“我們是說(shuō)‘實(shí)時(shí)‘,比一秒還短的時(shí)間。因?yàn)槲覀兪巧缃痪W(wǎng)絡(luò),如果我們想要對(duì)人們的社交反饋?zhàn)龀鲱A(yù)測(cè),那系統(tǒng)必須立即反應(yīng),對(duì)吧?”說(shuō)完,他又看了看剛剛那張梵高式的照片,毫不掩飾自己的自豪之情。“在手機(jī)上運(yùn)行復(fù)雜的神經(jīng)網(wǎng)絡(luò),意味著把人工智能交付到每個(gè)人手中。“他接著說(shuō),”這不是偶然產(chǎn)生的,這也是我們?cè)诠局袑?shí)現(xiàn)人工智能自主化的一種方式。我們已經(jīng)為此努力很久了。“
Candela 出生在西班牙。在他3歲的時(shí)候,全家搬到了摩洛哥,他在那里上了法語(yǔ)學(xué)校。盡管他在科學(xué)和人文方面的成績(jī)都很高,他還是決定在馬德里上大學(xué),學(xué)習(xí)他覺(jué)得最難的專業(yè):通信工程,這不僅要求對(duì)無(wú)線電、放大器等物理知識(shí)的充分掌握,還需要理解數(shù)據(jù),但他認(rèn)為“這非??帷?。他師從一位研究改善自適應(yīng)系統(tǒng)的教授,建立了一個(gè)利用智能濾波器增強(qiáng)漫游手機(jī)信號(hào)的系統(tǒng),他將這稱之為一個(gè)“初始的神經(jīng)網(wǎng)絡(luò)”。與編程相比,他更喜歡訓(xùn)練算法,2000 年在丹麥學(xué)習(xí)的一個(gè)學(xué)期的經(jīng)歷讓這個(gè)興趣更強(qiáng)了。在丹麥,Candela 結(jié)識(shí)了一位研究機(jī)器學(xué)習(xí)的教授 Carl Rasmussen,他與機(jī)器學(xué)習(xí)著名專家 Geoff Hinton 共事多年。畢業(yè)前夕,當(dāng) Candela 正準(zhǔn)備加入寶潔團(tuán)隊(duì)時(shí), Rasmussen 教授邀請(qǐng)他繼續(xù)博士的學(xué)習(xí)。他最終選擇了機(jī)器學(xué)習(xí)。
2007年,他加入了英國(guó)劍橋的微軟研究實(shí)驗(yàn)室。工作不久后,他就明白了公司層面的競(jìng)爭(zhēng):微軟將要推出 Bing,但是還需要改進(jìn)搜索廣告部分一個(gè)關(guān)鍵構(gòu)件——用來(lái)預(yù)測(cè)用戶何時(shí)會(huì)點(diǎn)擊廣告。微軟決定開展一項(xiàng)內(nèi)部比賽,獲勝的團(tuán)隊(duì)方案會(huì)被測(cè)試是否實(shí)用,團(tuán)隊(duì)成員則會(huì)獲得一次免費(fèi)夏威夷旅行。19 個(gè)隊(duì)伍參加了比賽,Candela 的團(tuán)隊(duì)最終獲勝。他獲得了免費(fèi)旅行,但是當(dāng)微軟推遲方案測(cè)試的時(shí)候,他覺(jué)得自己被騙了。為了展示決心,Candela 開展了一個(gè)所謂的“瘋狂十字軍東征”,試圖說(shuō)服公司給他一個(gè)機(jī)會(huì)。他進(jìn)行了至少 50 次內(nèi)部談話,建立了一個(gè)模擬器來(lái)展示自己算法的優(yōu)越性,跟蹤可以拍板的高管,在吃飯的時(shí)候故意跟高管坐在一起,在洗手間向領(lǐng)導(dǎo)宣傳自己的系統(tǒng),在總裁辦公室不請(qǐng)自來(lái),爭(zhēng)論到“承諾就是承諾,必須執(zhí)行,況且他的算法確實(shí)更好”。最終,candela 的算法在 2009 年嵌入進(jìn) Bing 中。
2012 年,Candela 會(huì)見了一位在 Facebook 工作的朋友并參觀了位于門洛帕克市的辦公室。他驚奇地發(fā)現(xiàn)在這個(gè)公司里,大家不用求著領(lǐng)導(dǎo)測(cè)試自己的系統(tǒng),他們可以自主決定。兩天后,他去 Facebook 面試了,一周后,他加入了 Facebook 的廣告團(tuán)隊(duì),領(lǐng)導(dǎo)一個(gè)小組研究如何向用戶展示更多相關(guān)廣告。盡管那時(shí)的系統(tǒng)已經(jīng)使用了機(jī)器學(xué)習(xí),但是 Candela 認(rèn)為,“模型不夠先進(jìn),太普通了”。
(Facebook 大樓內(nèi)景)
與 Candela 一同進(jìn)入 Facebook 的另一個(gè)工程師是 Hussein Mehanna(他們一同參加了新雇員代碼訓(xùn)練營(yíng)),他也認(rèn)為 Facebook 的人工智能系統(tǒng)太過(guò)落后。Mehanna 說(shuō):“我從外部觀察它產(chǎn)品質(zhì)量的時(shí)候,以為 Facebook 的工作早已人工智能化了,現(xiàn)在看來(lái),顯然還沒(méi)有。幾周后我告訴 Joaquin,F(xiàn)acebook 最缺少的是一個(gè)合適的先進(jìn)的機(jī)器學(xué)習(xí)平臺(tái)。我們已經(jīng)有了機(jī)器,但是沒(méi)有合適的軟件幫助機(jī)器盡可能多地從數(shù)據(jù)中學(xué)習(xí)?!保∕ehanna 目前是 Facebook 的核心機(jī)器學(xué)習(xí)主管,也是微軟的老員工,采訪中微軟老員工都跳槽到了 Facebook,是巧合嗎?)
Mehanna 所說(shuō)的“機(jī)器學(xué)習(xí)平臺(tái)”,是將人工智能從上個(gè)世紀(jì)的“寒冬”變?yōu)楝F(xiàn)在蓬勃發(fā)展的模仿人類大腦行為的范式應(yīng)用。在廣告領(lǐng)域,F(xiàn)acebook 需要的是一個(gè)人類工作無(wú)法實(shí)現(xiàn)的系統(tǒng):對(duì)廣告點(diǎn)擊人數(shù)的即時(shí)預(yù)測(cè)。Candela 和他的團(tuán)隊(duì)要基于機(jī)器學(xué)習(xí)的方法創(chuàng)造出這個(gè)新系統(tǒng)。并且,因?yàn)樗麄兿胍獙⑦@個(gè)系統(tǒng)建成一個(gè)平臺(tái),他們的模型和訓(xùn)練必須具有一般性和可復(fù)制性。
建立機(jī)器學(xué)習(xí)平臺(tái)的一個(gè)重要因素是高質(zhì)量數(shù)據(jù)的獲取,越多越好。幸運(yùn)的是,這正是 Facebook 一項(xiàng)最大的資產(chǎn):當(dāng)超過(guò)十億人每天與 Facebook 的產(chǎn)品互動(dòng)時(shí),它可以為他們的訓(xùn)練收集大量數(shù)據(jù),并且當(dāng)他們開始測(cè)試時(shí),會(huì)有取之不盡的用戶行為樣本。這使得廣告團(tuán)隊(duì)進(jìn)展很快,從每幾周推出一個(gè)新模型到每周推出一個(gè)新模型。另外,因?yàn)橄到y(tǒng)最終會(huì)成建成一個(gè)平臺(tái),公司內(nèi)部會(huì)使用平臺(tái)來(lái)設(shè)計(jì)自己的產(chǎn)品,Candela 設(shè)計(jì)了一個(gè)多團(tuán)隊(duì)同時(shí)工作的方法——一個(gè)簡(jiǎn)潔的三步過(guò)程:“首先關(guān)注績(jī)效,接著是效用,最后建立一個(gè)社區(qū)”。
Candela 的廣告團(tuán)隊(duì)已經(jīng)證明了機(jī)器學(xué)習(xí)可以為 Facebook 帶來(lái)多大的變革力量。他說(shuō):“我們?cè)陬A(yù)測(cè)廣告點(diǎn)擊率上取得了巨大成功,就像是一次大轉(zhuǎn)變?!彼詫⑦@個(gè)方法擴(kuò)展到更大的服務(wù)中是很自然的事情。事實(shí)上,F(xiàn)AIR 的領(lǐng)導(dǎo) LeCun 已經(jīng)在爭(zhēng)取建立一個(gè)伙伴團(tuán)隊(duì),將人工智能應(yīng)用在公司產(chǎn)品中,將機(jī)器學(xué)習(xí)的方法更廣泛地應(yīng)用在公司運(yùn)營(yíng)中。LeCun 說(shuō):“我正在為此努力,因?yàn)槲覀冃枰咚刭|(zhì)的工程師,雖然他們不直接與產(chǎn)品打交道,但產(chǎn)品團(tuán)隊(duì)卻需要他們提供技術(shù)基礎(chǔ)?!?/p>
2015 年 10 月,Candela 成為了新的 AML 團(tuán)隊(duì)主管(在一段時(shí)間內(nèi),他還同時(shí)兼任著廣告團(tuán)隊(duì)的負(fù)責(zé)人)。他與 FAIR 團(tuán)隊(duì)保持著密切的聯(lián)系。雖然 FAIR 在紐約、巴黎和門洛帕克市都有辦公地,但實(shí)際上他們的成員就坐在 AML 工程師旁邊。
他們合作的方式可以用一個(gè)正在運(yùn)行中的產(chǎn)品來(lái)說(shuō)明,該產(chǎn)品是 Facebook 上對(duì)照片進(jìn)行語(yǔ)音描述功能。過(guò)去的 5 年中,訓(xùn)練系統(tǒng)識(shí)別屏幕中的物體并給出一般性結(jié)論(比如照片是在室內(nèi)還是室外拍攝)已經(jīng)成為了人工智能訓(xùn)練的普遍標(biāo)準(zhǔn)。但是最近,F(xiàn)AIR 的科學(xué)家們發(fā)現(xiàn)了一個(gè)方法,可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)在圖像中變出每一個(gè)物體并判斷他們之間的位置和關(guān)系,進(jìn)而理解整個(gè)圖像的含義,比如分析出圖中人們正在擁抱,或者有人正在騎馬。LeCun 說(shuō):“我們將這個(gè)方法展示給 AML 團(tuán)隊(duì),他們思考了一會(huì)兒,說(shuō)‘在一種情形下,這項(xiàng)技術(shù)會(huì)非常有用’?!庇谑?,一個(gè)幫助盲人或視力低下的人“閱讀”圖片的功能原型出現(xiàn)了。Candela 談到他的姐妹團(tuán)隊(duì):“我們一直在交流。更大的挑戰(zhàn)是將科學(xué)技術(shù)轉(zhuǎn)化成產(chǎn)品,這需要粘合劑,而我們就是這個(gè)粘合劑?!?/p>
Candela 將人工智能的應(yīng)用分為四個(gè)部分:視覺(jué)、語(yǔ)言、談話和照相機(jī)特效。他認(rèn)為這四個(gè)部分會(huì)產(chǎn)生一個(gè)“理解內(nèi)容的機(jī)器”。通過(guò)研究如何明白內(nèi)容的含義,F(xiàn)acebook 可以從評(píng)論中、話語(yǔ)的細(xì)微變化中探查隱含的意思,在視頻中識(shí)別出你朋友一閃而過(guò)的面孔,在你真實(shí)的會(huì)話中解譯你的表達(dá)。
Candela 說(shuō):“我們正在使人工智能一般化。在內(nèi)容激增的今天,我們需要理解和分析內(nèi)容,否則我們貼標(biāo)簽的能力就會(huì)跟不時(shí)代了?!倍鉀Q方法就在于建立一個(gè)普遍性的系統(tǒng),使得一個(gè)項(xiàng)目的工作可以為相關(guān)項(xiàng)目的工作提供幫助。他說(shuō):“如果我能將其他項(xiàng)目的成果轉(zhuǎn)移來(lái)構(gòu)建我自己的算法,豈不是非常棒?” 這樣的轉(zhuǎn)變讓 Facebook 產(chǎn)品上新的速度飛速提升。拿 Instagram 舉例:最開始的時(shí)候,用戶展示的照片是按照時(shí)間順序反向排序的。但是在 2016 年初,公司決定使用算法將照片按照相關(guān)性來(lái)排列。好消息是因?yàn)?AML 已經(jīng)完成了類似于 News Feed 動(dòng)態(tài)信息流中的機(jī)器學(xué)習(xí)部分,所以“他們不用從抓取數(shù)據(jù)開始做起“,Candela 說(shuō),“他們有一兩個(gè)熟悉機(jī)器學(xué)習(xí)的工程師負(fù)責(zé)聯(lián)系其他運(yùn)作排序類應(yīng)用的團(tuán)隊(duì),所以他們可以直接復(fù)制那些團(tuán)隊(duì)的工作流程,出現(xiàn)問(wèn)題的時(shí)候也可以去詢問(wèn)他們?!庇谑牵琁nstagram 在幾個(gè)月內(nèi)就完成了這個(gè)劃時(shí)代的轉(zhuǎn)變。
AML 團(tuán)隊(duì)總是在找尋機(jī)會(huì),將神經(jīng)網(wǎng)絡(luò)的強(qiáng)大功能融入不同的團(tuán)隊(duì),幫助他們?cè)?Facebook 層面創(chuàng)造獨(dú)特的產(chǎn)品功能。AML 知覺(jué)團(tuán)隊(duì)主工程師 Tommer Leyvand 說(shuō):“我們正在使用機(jī)器學(xué)習(xí)技術(shù)構(gòu)建自己的核心競(jìng)爭(zhēng)力,滿足用戶的需求?!保‵YI,他也是從微軟跳槽來(lái)的!)
(Facebook 技術(shù)產(chǎn)品經(jīng)理 Rita Aquino,雷鋒網(wǎng)注)
最近新出的一個(gè)叫做“社交推薦”的功能也是一個(gè)很好的例子。大約一年前,一個(gè) AML 的工程師和 Facebook 分享團(tuán)隊(duì)的一個(gè)產(chǎn)品經(jīng)理談到了公司可以介入的一個(gè)場(chǎng)景:當(dāng)人們?cè)儐?wèn)朋友有什么可以推薦的當(dāng)?shù)夭蛷d的時(shí)候?!澳敲?Facebook 可以怎樣把推薦的信息展示給用戶呢?“Rita Aquino 說(shuō)道。分享團(tuán)隊(duì)一開始使用詞匯匹配的方式回應(yīng)推薦指令。但是 Aquino 說(shuō):“當(dāng)每天有數(shù)十億的推送時(shí),精確和升級(jí)的要求就不是必須的了?!?通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和使用真實(shí)數(shù)據(jù)對(duì)模型的測(cè)試,他們已經(jīng)可以探查非常細(xì)微的語(yǔ)言區(qū)別,準(zhǔn)確地探查到哪個(gè)用戶正在詢問(wèn)某地區(qū)內(nèi)的餐廳或商場(chǎng),進(jìn)而觸發(fā)一個(gè)指令,將相關(guān)的鏈接展示在用戶的 News Feed 上。接著當(dāng)某人提供了一個(gè)推薦時(shí),機(jī)器學(xué)習(xí)會(huì)在用戶的 News Feed 上顯示出餐廳或商場(chǎng)的地理位置。
Aquino 說(shuō),她在 Facebook 的一年半時(shí)間里,見證了人工智能從產(chǎn)品中的邊緣成分變成了產(chǎn)品概念產(chǎn)生的來(lái)源。她說(shuō):“人們期望與他們交互的產(chǎn)品能夠更加智能。而團(tuán)隊(duì)在創(chuàng)造產(chǎn)品的時(shí)候,并不需要成為一個(gè)機(jī)器學(xué)習(xí)專家。” 在處理自然語(yǔ)言的例子中,AML 建立了個(gè)一個(gè)叫做 “Deep Text” 的系統(tǒng),讓其他團(tuán)隊(duì)可以輕松訪問(wèn),用機(jī)器學(xué)習(xí)輔助 Facebook 每日使用超過(guò)40億次的翻譯功能的實(shí)現(xiàn)。
對(duì)于圖像和視頻,AML 團(tuán)隊(duì)建立了一個(gè)叫做“Lumos”的機(jī)器學(xué)習(xí)視覺(jué)平臺(tái)。平臺(tái)起初是由 Manohar Paluri 創(chuàng)建的,后來(lái) FAIR 的一個(gè)實(shí)習(xí)生在此基礎(chǔ)上設(shè)計(jì)了一個(gè)大型機(jī)器學(xué)習(xí)視覺(jué)系統(tǒng),他稱之為 Facebook 的“視覺(jué)皮質(zhì)”,一種處理和理解 Facebook 上所有圖像和視頻的方法。在2014年的編程馬拉松上,Paluri 和同事 Nikhil Johir 在一天半時(shí)間里創(chuàng)建了一個(gè)產(chǎn)品原型,并向扎克伯格和 Facebook 首席運(yùn)營(yíng)官 Sheryl Sandberg 展示了結(jié)果。在Candela 開始組建 AML 團(tuán)隊(duì)的時(shí)候,Paluri 也加入進(jìn)來(lái)(他同時(shí)在 AML 和FAIR 任職),領(lǐng)導(dǎo)計(jì)算機(jī)視覺(jué)團(tuán)隊(duì),完善 Lumos 平臺(tái),幫助 Facebook 的工程師(包括 Instagram、Messenger、WhatsApp 和 Oculus)使用視覺(jué)處理方法。Paluri 說(shuō):“在 Lumos 上,公司里的每個(gè)人都可以使用神經(jīng)網(wǎng)絡(luò)的各種功能來(lái)構(gòu)建自己的模型方案。這樣除了 AML 團(tuán)隊(duì),公司內(nèi)的其他人都可以修正、訓(xùn)練、推動(dòng)系統(tǒng)的發(fā)展。“
Paluri 給我做了一個(gè)快速展示。他在筆記本上啟動(dòng) Lumos,做了一個(gè)簡(jiǎn)單的任務(wù):改進(jìn)了神經(jīng)網(wǎng)絡(luò)識(shí)別直升機(jī)圖像的能力。屏幕上出現(xiàn)了一個(gè)大概有5000個(gè)直升機(jī)形象的頁(yè)面,其中也有一些不是直升機(jī)(一個(gè)是玩具直升機(jī)、一些是從直升機(jī)視角拍攝的天空),這些數(shù)據(jù)是 Facebook 從用戶發(fā)布的照片中收集來(lái)的。即使我完全不是一個(gè)工程師,更不懂人工智能,但是也可以簡(jiǎn)單地點(diǎn)擊負(fù)面樣本來(lái)訓(xùn)練圖像分類器分辨直升機(jī)。最終,這個(gè)分類步驟,所謂的有監(jiān)督學(xué)習(xí),會(huì)完全自動(dòng)化,利用機(jī)器學(xué)習(xí)方法,神經(jīng)網(wǎng)絡(luò)會(huì)自動(dòng)探索圖像中的物體,實(shí)現(xiàn)“無(wú)監(jiān)督學(xué)習(xí)”。Paluri 說(shuō) Facebook 正在為此努力,“我們的目標(biāo)是明年將人工注釋減少到百分之一?!?/p>
長(zhǎng)期來(lái)看,F(xiàn)acebook 會(huì)將“視覺(jué)皮質(zhì)”融入進(jìn)自然語(yǔ)言平臺(tái)上,幫助 Candela 所謂的內(nèi)容理解引擎進(jìn)行一般化擴(kuò)展。Paluri 說(shuō):“毫無(wú)疑問(wèn),我們會(huì)將他們結(jié)合在一起,也許就叫做……大腦皮質(zhì)?!?/p>
Facebook 的最終目標(biāo)是將機(jī)器學(xué)習(xí)的核心原理通過(guò)發(fā)表論文等方式,擴(kuò)展到甚至是公司之外的領(lǐng)域。Mehanna 說(shuō):“大家不用在花費(fèi)大量時(shí)間創(chuàng)建智能應(yīng)用,我們可以進(jìn)展得更快。想象一下,它的影響可以涉及到醫(yī)藥,安全,交通等各個(gè)領(lǐng)域。我認(rèn)為這些領(lǐng)域的應(yīng)用開發(fā)速度會(huì)有百倍增長(zhǎng)?!?/p>
(Facebook 計(jì)算機(jī)視覺(jué)應(yīng)用團(tuán)隊(duì)主管 Manohar Paluri,Stephen Lam 拍攝于門洛帕克市 Facebook 大樓,2017年2月6日)
盡管 AML 機(jī)器學(xué)習(xí)應(yīng)用在幫助 Facebook 的產(chǎn)品進(jìn)行觀察、理解甚至對(duì)話的過(guò)程中發(fā)揮了重大作用,但是扎克伯格認(rèn)為機(jī)器學(xué)習(xí)的應(yīng)用還會(huì)在 Facebook 的良好社交方面起到重要作用。在他 5700 字的構(gòu)建社交社區(qū)的聲明中,7次提到了“人工智能”,闡釋機(jī)器學(xué)習(xí)和其他技術(shù)能夠如何幫助 Facebook 保持社區(qū)安全和消息靈通。
實(shí)現(xiàn)這些目標(biāo)并不是易事,這也是 Candela 起初在任職問(wèn)題上猶豫的原因。甚至機(jī)器學(xué)習(xí)也不能解決所有關(guān)于數(shù)十億人之間溝通信息的問(wèn)題。也正是因?yàn)檫@樣,F(xiàn)acebook 不斷研究算法,確定在 News Feed 上要為用戶展示怎樣的內(nèi)容。Candela 認(rèn)為目前還未解決的最大問(wèn)題是:當(dāng)你不確定內(nèi)容時(shí),你要如何訓(xùn)練系統(tǒng)提供最優(yōu)結(jié)果?他說(shuō):“我們提供隨機(jī)消息流就意味著浪費(fèi)了用戶的時(shí)間;我們只提供一個(gè)朋友的信息流,則贏者通吃。連續(xù)不斷的討論只會(huì)得到一個(gè)結(jié)論,這兩個(gè)極端情況都不是最佳選擇。我們正在探索一個(gè)平衡。“ Facebook 試圖利用人工智能來(lái)解決這個(gè)問(wèn)題。人工智能也成為了公司解決任何問(wèn)題都不可或缺的工具?!蔽覀?cè)跈C(jī)器學(xué)習(xí)和人工智能方面有很多實(shí)質(zhì)性研究,試圖優(yōu)化這種平衡。“ Candela說(shuō)道,語(yǔ)氣中充滿希望。
自然而然地,當(dāng) Facebook 變成傳播假新聞的罪人時(shí),它便召集了AI 團(tuán)隊(duì)迅速刪除了界面上所有假消息。這是一次不同尋常的全體努力,甚至包括 FAIR 團(tuán)隊(duì),LeCun 認(rèn)為它可以作為“咨詢顧問(wèn)“。結(jié)果是FAIR 團(tuán)隊(duì)創(chuàng)造出一個(gè)解決問(wèn)題的工具:一個(gè)叫做:World2Vec”的模型(Vec 指代矢量 Vector),該模型在神經(jīng)網(wǎng)絡(luò)中加入了記憶能力,幫助 Facebook 標(biāo)記信息的構(gòu)成,比如信息來(lái)源、誰(shuí)分享了該信息。(這里可能會(huì)有些混淆,谷歌有一個(gè)發(fā)明叫做 W ord2Vec)。通過(guò)這個(gè)信息,F(xiàn)acebook 可以理解信息分享模式,描述虛假新聞的特征,之后可能會(huì)使用機(jī)器學(xué)習(xí)策略剔除掉虛假消息。LeCun 說(shuō):“我們最終發(fā)現(xiàn),識(shí)別假新聞與找到人們最喜愛頁(yè)面的工作并沒(méi)有什么不同?!?/p>
Candela 團(tuán)隊(duì)之前建立的平臺(tái)讓 Facebook 推出數(shù)據(jù)檢查類產(chǎn)品的速度比以往都快。雖然他們的表現(xiàn)達(dá)到什么程度還有待檢驗(yàn),但是 Candela 說(shuō),過(guò)不了多久就能看到 Facebook 用算法判斷來(lái)減少假消息的效果有多好了。然而不論這種新方法是否奏效,困境本身對(duì)算法是否能解決問(wèn)題提出了質(zhì)疑——即使機(jī)器學(xué)習(xí)解決了一個(gè)問(wèn)題,但是可能會(huì)無(wú)意中產(chǎn)生不好的結(jié)果。Candela 反駁了這種質(zhì)疑:“我認(rèn)為我們會(huì)讓世界變得更好?!彼麑?duì)我講了一個(gè)故事:在我采訪的前一天,Candela 給 Facebook 上一個(gè)用戶打了電話,那個(gè)人是他一個(gè)朋友的父親,他們有過(guò)一面之緣。他看到這個(gè)人在 Facebook 上發(fā)表了一些支持川普的言論,覺(jué)得有些疑問(wèn)。Candela 意識(shí)到他的工作就是基于數(shù)據(jù)做出決策,而他好像遺漏了一些重要信息,所以他給這個(gè)人發(fā)了消息約談,他們最終在電話里進(jìn)行了對(duì)話。Candela 說(shuō):“這次經(jīng)歷沒(méi)有改變我的生活,但是卻讓我從一個(gè)非常不同的角度觀察事物。如果沒(méi)有 Facebook,這一切也不會(huì)發(fā)生。“ 換句話說(shuō),盡管人工智能非常重要,對(duì) Facebook 不可或缺,但是這也不是唯一的答案?!皢?wèn)題在于人工智能仍處于嬰兒時(shí)期,我們的工作才剛剛開始。”Candela說(shuō)。
Via Backchannel
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。