5
本文作者: 劉家欣 | 2016-02-01 11:48 |
編者按:你登陸社交網(wǎng)站,以為新鮮事中都是自己訂閱的內(nèi)容,但它還包括平臺(tái)想讓你看到的,以及猜測(cè)你可能喜愛(ài)的內(nèi)容。平臺(tái)會(huì)猜測(cè)用戶的心思,用戶也往往淪為小白鼠。本文編譯自SLATE,揭露了Facebook動(dòng)態(tài)消息的背后的技術(shù)原理。為了了解你,科技公司可是很努力的。
每次你打開(kāi) Facebook ,這個(gè)世界上最具影響力,最有爭(zhēng)議也是最被人誤解的一套算法機(jī)制就開(kāi)始運(yùn)行。它會(huì)收集關(guān)于你的一切狀態(tài)更新:你朋友每周發(fā)過(guò)的狀態(tài),你關(guān)注的每一個(gè)人,你加入的每一個(gè)群組,以及你贊過(guò)的每一條消息。對(duì)于 Facebook 用戶來(lái)說(shuō),平均每周有一千五百次狀態(tài)更新。如果你有數(shù)百位好友,那這個(gè)數(shù)字可能會(huì)高達(dá)一萬(wàn)以上。通過(guò)對(duì)這些數(shù)據(jù)細(xì)致入微的觀察,工程師們對(duì)推薦算法進(jìn)行不斷的優(yōu)化,F(xiàn)acebook 的動(dòng)態(tài)消息(news feed)才能做到出現(xiàn)你真正感興趣的內(nèi)容。因?yàn)椋蠖鄶?shù)人并不會(huì)每天都把時(shí)間線完整看一遍,只會(huì)看最上面幾百個(gè)。
沒(méi)有人能夠猜透 Facebook 的算法究竟是如何生成的,而內(nèi)部人員更不可能告訴你這些。這個(gè)自動(dòng)化的算法對(duì)于人們的社交有著重大的影響,而且它決定了我們每天會(huì)看到什么,要知道世界上有五分之一的人口——近 10 億的 Facebook 活躍用戶每天就在動(dòng)態(tài)消息里面閱讀新聞。病毒式擴(kuò)散的算法機(jī)制完全顛覆了傳統(tǒng)的媒體,把新興的創(chuàng)業(yè)公司 BuzzFeed 和 Vox 市值推上了高位,而擁有一百年歷史的報(bào)紙們則被陸續(xù)帶進(jìn)了墳?zāi)?。社交游戲公?Zynga 和團(tuán)購(gòu)網(wǎng)站 LivingSocial 憑借 Facebook ,在短短一兩年的時(shí)間內(nèi)就做到了數(shù)十億美金的估值,投資者們賺得盆滿缽滿。Facebook 的動(dòng)態(tài)消息甚至能夠左右我們的喜怒哀樂(lè),它推送給我們真正優(yōu)質(zhì)有趣的消息,并將僅僅是情緒性的表達(dá)篩選掉。
然而, 盡管它擁有如此的權(quán)力,它的動(dòng)態(tài)消息卻一直難以讓人滿意,推送的內(nèi)容十分隨意,變幻莫測(cè),有時(shí)候甚至出奇的不雅。經(jīng)常會(huì)推送一些無(wú)關(guān)緊要的東西,謠言,瑣事,充滿戾氣的話,或者是無(wú)趣的消息。Facebook 的內(nèi)部人員很清楚這件事。在過(guò)去的幾個(gè)月內(nèi),這個(gè)社交網(wǎng)絡(luò)巨頭開(kāi)始將重新設(shè)計(jì)過(guò)的動(dòng)態(tài)消息推送算法在用戶內(nèi)進(jìn)行小范圍的測(cè)試,你猜結(jié)果如何?
用戶們普遍反饋「有時(shí)」,新的動(dòng)態(tài)消息會(huì)擊中他們的興奮點(diǎn)。Facebook 對(duì)此表示欣慰,并強(qiáng)調(diào)會(huì)進(jìn)行持續(xù)性的改進(jìn)。
「有時(shí)」代表著你離完全的成功還有很長(zhǎng)的路要走。
近年來(lái),F(xiàn)acebook 和其他硅谷巨頭們?cè)絹?lái)越習(xí)慣于用機(jī)器學(xué)習(xí)軟件替我們做出選擇。硅谷明星埃隆馬斯克和著名科學(xué)家霍金都曾經(jīng)提出警惕人工智能的觀點(diǎn),而「算法」這個(gè)詞本身,就是為了大幅提高效率而生的?!杆惴ā箤?duì)于普通人來(lái)說(shuō),是「不明覺(jué)厲」的計(jì)算機(jī)名詞,神秘而充滿魔性,而 Facebook 等科技巨頭使用的算法更是令人好奇。
最近,我參觀了 Facebook 總部,與動(dòng)態(tài)消息的算法團(tuán)隊(duì)相處,了解這套機(jī)制背后的故事。他們是如何把臭名昭著的動(dòng)態(tài)消息算法扭轉(zhuǎn)口碑的,為什么要這么做,如何做到,及背后的運(yùn)行機(jī)理。此外,我們還能了解到很多關(guān)于算法局限性的問(wèn)題,數(shù)據(jù)有時(shí)候也會(huì)撒謊,F(xiàn)acebook 為此專門(mén)請(qǐng)了外包團(tuán)隊(duì)進(jìn)行人肉反饋,以達(dá)到更準(zhǔn)確的效果。
Facebook 的算法,據(jù)我所知,有點(diǎn)小瑕疵并非系統(tǒng)的緣故。以現(xiàn)在的科技水平而言,算法想要達(dá)到科幻小說(shuō)一般洞悉人性是不可能的。Facebook 算法的背后還是人。工程師們決定了數(shù)據(jù)的篩選,加工,及輸出。算法出錯(cuò),背鍋的當(dāng)然是設(shè)計(jì)算法的工程師。算法的一步步進(jìn)化,也是無(wú)數(shù)工程師們看了無(wú)數(shù)的數(shù)據(jù),開(kāi)了無(wú)數(shù)會(huì)議,反復(fù)測(cè)試,最終的結(jié)果。然而,F(xiàn)acebook 算法的持續(xù)進(jìn)步仍然使人感到好奇,他們是如何做到的?
當(dāng)我到達(dá) Facebook 總部時(shí),一名 37 歲的大男孩接待了我,他臉上掛著善意微笑,充沛的精力及旺盛的表達(dá)欲望是他最明顯的特征。他就是 Tom Alison ,「動(dòng)態(tài)消息」算法的工程主管,他管理著設(shè)計(jì)算法的工程師們。
Alison 帶著我穿過(guò)迷宮般的 Facebook 辦公區(qū),穿過(guò)一個(gè)小廚房之后,我們進(jìn)入了一件小型會(huì)議室里。Alison 向我承諾會(huì)把 Facebook 算法背后的原理講清楚,即使對(duì)于我這種外行來(lái)說(shuō)。 到了以后,我想去一趟洗手間,我問(wèn)了他應(yīng)該怎么走。他很抱歉的對(duì)我說(shuō),「還是我?guī)闳グ伞?。起初我以為他是怕我迷路,?dāng)我從洗手間出來(lái)時(shí),發(fā)現(xiàn)他就站在門(mén)口等著我。我不禁認(rèn)為,他被上級(jí)要求不能讓我在辦公室里單獨(dú)走動(dòng)。
Facebook 總部
同樣,F(xiàn)acebook 對(duì)于他們的商務(wù)信息守口如瓶,Alison 不能告訴我有關(guān)「動(dòng)態(tài)消息」 算法的實(shí)際代碼。然而,他能告訴我大概的原理,以及為什么它一直在改變。工程師們通常喜歡站在白板前講解,他也不例外。
剛開(kāi)始學(xué)習(xí)計(jì)算機(jī)科學(xué)的時(shí)候,你第一個(gè)接觸到的算法必然是關(guān)于排序的。他在白板上快速的寫(xiě)下這幾個(gè)數(shù):4, 1, 3, 2, 5。
接著,他隨手寫(xiě)下了一個(gè)簡(jiǎn)單的任務(wù):設(shè)計(jì)一套算法,使數(shù)組按從小到大排序?!溉祟惪梢院苋菀椎淖龅?,這僅僅是舉手之勞而已。」他對(duì)我說(shuō)。
然而,對(duì)于計(jì)算機(jī),你應(yīng)該給出具體而明確的方法。這就需要算法的幫忙:算法就是用于計(jì)算機(jī)解決問(wèn)題的一系列步驟。Alison 告訴我的算法叫「冒泡排序」 ,它的具體做法如下:
1.對(duì)于每一個(gè)數(shù)組,從第一個(gè)數(shù)起,與后一個(gè)數(shù)比較大小,如果后者較大,則不變。
2.如果前者較大,則兩者置換位置。
3.重復(fù)前兩步,直到?jīng)]有任何一對(duì)數(shù)字需要比較。
冒泡排序的優(yōu)點(diǎn)是簡(jiǎn)單易懂。壞處也顯而易見(jiàn),如果你的數(shù)據(jù)過(guò)大,計(jì)算量會(huì)很大,速度也隨之變慢。對(duì)于 Facebook 數(shù)十億用戶而言,當(dāng)然不能用這種算法。Facebook 的算法要求你在打開(kāi) App 的瞬間就把所有的動(dòng)態(tài)消息準(zhǔn)確歸位,對(duì)速度的要求極其嚴(yán)苛。但這僅僅是算法里的子算法而已。最重要的是把所有的動(dòng)態(tài)消息按照正確的方式排序,最重要的出現(xiàn)在最頂端。這就是 Facebook news feed 排序團(tuán)隊(duì)的工作了,就是把所有用戶關(guān)注的信息按用戶的關(guān)聯(lián)度排序。
這是一項(xiàng)非常艱難的任務(wù)。因?yàn)槟阍?Facebook 上的朋友們發(fā)的消息,還有你關(guān)注的明星們發(fā)的消息,哪些「和你有關(guān)」,是很難量化的事情。為此,Alison 解釋,F(xiàn)acebook 使用了一套與眾不同的算法,稱為預(yù)測(cè)式算法。(Facebook 的 news feed 算法,和谷歌的搜索引擎算法,Netflix 的推薦算法都是分布式的復(fù)雜算法,包涵很多小的算法)
讓我們猜猜下一場(chǎng)籃球賽,公牛對(duì)湖人,誰(shuí)會(huì)贏? Alison 說(shuō)?!腹!?,我不假思索的說(shuō)出了口。Alison 笑了,但他隨后點(diǎn)頭表示同意 。如果把我的大腦類比為計(jì)算機(jī),我剛剛輸入了他提的問(wèn)題,輸出了 公牛這個(gè)回答,我大腦里的直覺(jué)反應(yīng)就是算法。(人類心靈的算法遠(yuǎn)比目前計(jì)算機(jī)使用的復(fù)雜的多,但穩(wěn)定性也差的多)
「當(dāng)你不會(huì)感到壓力時(shí),這種僅憑直覺(jué)的猜測(cè)往往正確率驚人?!笰lison 說(shuō)?!傅绻麆倓偟牟聹y(cè)有金錢(qián)上的掛鉤,數(shù)百萬(wàn)每次,每天預(yù)測(cè)數(shù)百次。那我們就需要一個(gè)成體系的方法。你可能會(huì)看看歷史數(shù)據(jù),每一個(gè)球隊(duì)的勝負(fù)紀(jì)錄,是否有傷員,誰(shuí)正手感火熱。可能你還會(huì)考慮環(huán)境因素,誰(shuí)是主場(chǎng)?客隊(duì)是背靠背比賽還是經(jīng)過(guò)了一段時(shí)間的休息?你的算法可能會(huì)把這些因素全部考慮在內(nèi)。如果你的算法足夠完美,你可能不僅僅預(yù)測(cè)到了勝負(fù)情況,你連比分都能猜個(gè)大概。」
同理,F(xiàn)acebook 的動(dòng)態(tài)消息算法也是這樣的情況。(動(dòng)態(tài)消息是 Faceboook 最大的現(xiàn)金牛,平均日入 2000 萬(wàn)美金)我問(wèn) Alison 在 Facebook 算法的機(jī)器學(xué)習(xí)語(yǔ)言中,總共考慮了多少種條件,他回答道「數(shù)百種。」
Adam Mosseri (站著)
整個(gè)動(dòng)態(tài)消息算法設(shè)計(jì)團(tuán)隊(duì)
它不僅僅會(huì)根據(jù)你以往的點(diǎn)贊習(xí)慣預(yù)測(cè)你會(huì)不會(huì)點(diǎn)贊。它還會(huì)預(yù)測(cè)你點(diǎn)擊展開(kāi)全文,評(píng)論,分享的可能性,甚至標(biāo)記為垃圾的可能性。從而確定一個(gè)關(guān)聯(lián)分,這個(gè)分?jǐn)?shù)決定了它是否會(huì)出現(xiàn)在你的動(dòng)態(tài)消息列表中,以及所在的位置。所以,每次你打開(kāi) Facebook 動(dòng)態(tài)消息上的第一條,是從數(shù)百條消息中脫穎而出的,最能刺激你點(diǎn)贊,評(píng)論,分享,及改變你情緒的消息。
然而,無(wú)論你怎樣精心構(gòu)建一個(gè)算法,總是有很多的數(shù)據(jù)你是不得而知的:教練的比賽計(jì)劃,德里克羅斯(公牛隊(duì)球星)的膝蓋傷勢(shì),甚至是籃球的氣壓。從微觀層面講,比賽也不是一個(gè)單純比數(shù)值的游戲。這是人參與的游戲,「人」的復(fù)雜程度遠(yuǎn)非算法可以預(yù)測(cè)。
這套預(yù)測(cè)算法還面臨著其他的挑戰(zhàn),這些挑戰(zhàn)是來(lái)自認(rèn)識(shí)論的。關(guān)聯(lián)度的分預(yù)測(cè)公牛隊(duì)將會(huì)贏得比賽。顯然這個(gè)結(jié)果是可量化的:輸了或贏了,猜中了或猜不中。Facebook 嘗試著使用相似的思路解決問(wèn)題,記錄你與這些動(dòng)態(tài)消息的互動(dòng)頻率。而這些互動(dòng)也正好成為了 Facebook 收入的來(lái)源:點(diǎn)贊,點(diǎn)擊,分享,評(píng)論,使消息病毒式傳播,把每一個(gè)單獨(dú)的用戶串起來(lái),精準(zhǔn)地投放廣告。
但是這些交流對(duì)于真正的用戶來(lái)說(shuō),是非常粗糙且不準(zhǔn)確的。他們點(diǎn)了贊,并不一定代表他們真的喜歡這條消息,故事看到一半就關(guān)閉,也不一定是不喜歡。如何優(yōu)化這樣的情況?
「點(diǎn)贊」
在 2013 年末,F(xiàn)acebook 已經(jīng)是當(dāng)時(shí)最炙手可熱的公司。用戶數(shù)量超過(guò) 10 億,估值達(dá)到 1000 億美金以上。當(dāng)時(shí)它們已經(jīng)花了數(shù)年的時(shí)間不斷優(yōu)化移動(dòng)端的應(yīng)用體驗(yàn),在國(guó)際上,受歡迎程度已經(jīng)超過(guò)谷歌搜索和谷歌地圖。Facebook 已經(jīng)不僅僅是一個(gè)朋友間社交的工具,事實(shí)上,它還是 21 世紀(jì)全球化的新聞源:一個(gè)針對(duì)每一位用戶量身定制,瞬時(shí)更新的新聞,娛樂(lè)資訊,朋友動(dòng)態(tài)聚合網(wǎng)站。
在公司之中,動(dòng)態(tài)消息收入的增長(zhǎng)讓他們感到震驚。但在用戶數(shù)量暴漲的同時(shí),F(xiàn)acebook 員工們并不能確定用戶的滿意度究竟如何。人們?cè)?Facebook 上點(diǎn)贊的數(shù)量前所未有的多,但他們討厭什么?
為了搞清楚這件事,我們必須把鏡頭拉回到 2006 年。當(dāng)時(shí)的 Facebook 與現(xiàn)在復(fù)雜的側(cè)欄及群組相比,還處于原始狀態(tài)。和競(jìng)爭(zhēng)對(duì)手 Myspace 相似,「動(dòng)態(tài)消息」僅僅是朋友間的狀態(tài)更新的聚合。
2006 年的 Facebook 主頁(yè)
甚至,你朋友的更新你不一定能看得到。為了防止信息過(guò)多給用戶造成太大壓力,F(xiàn)acebook 用了一種簡(jiǎn)單粗暴的算法過(guò)濾掉了一部分它認(rèn)為用戶不感興趣的信息。而當(dāng)時(shí)并沒(méi)有東西能夠能夠衡量用戶對(duì)于信息究竟是否感興趣——點(diǎn)贊功能距推出還有三年時(shí)間。工程師們靠直覺(jué)判斷消息的呈現(xiàn)與否。一開(kāi)始的標(biāo)準(zhǔn)是,這條消息發(fā)布了多久,以及你的朋友提及這條消息的次數(shù)。之后的一段時(shí)間里,工程師們決定停止這種簡(jiǎn)單粗暴的方式,而把用戶在消息上停留的時(shí)間總數(shù)作為消息重要性的依據(jù)。但這樣的機(jī)制難以分辨哪條消息令用戶感到愉悅,那條消息冒犯了用戶,那些是無(wú)聊的,那些是純碎的謠言。本質(zhì)上,工程師們還是在碰運(yùn)氣。
「點(diǎn)贊」功能并非一個(gè)新鮮的交流方式。而 Facebook 推出點(diǎn)贊功能最初的用意,是想了解用戶對(duì)消息的偏好??赡苡脩魶](méi)有意識(shí)到,這是一個(gè)非常精妙的設(shè)計(jì)。如果用戶們明確知道「點(diǎn)贊」是為了方便 Facebook 進(jìn)行偏好紀(jì)錄,那么這個(gè)過(guò)程將顯得十分單調(diào)乏味。Facebook 的「動(dòng)態(tài)」算法是世界上第一個(gè)在用戶沒(méi)有感受的情況下,了解用戶習(xí)慣及偏好的,并且影響了我們所有人。
沒(méi)有一點(diǎn)點(diǎn)防備,這套算法就在不知不覺(jué)中有了辨認(rèn)實(shí)時(shí)熱點(diǎn)的能力,然后讓它們病毒式傳播。以前熱點(diǎn)是一個(gè)人鏈?zhǔn)降膫鞑ィF(xiàn)在一個(gè)人點(diǎn)贊以后,他的好友都能看到這一則消息,傳播效率堪比滾雪球。這樣的效應(yīng)不僅僅讓 Facebook 的員工們看見(jiàn)了,廣告商,出版商,造謠者,甚至普通用戶都看到了其中巨大的威力——輕點(diǎn)一贊,即可把消息傳播給自己所有的好友,關(guān)注者甚至陌生人。很多人開(kāi)始絞盡腦汁思考如何制造「引爆點(diǎn)」。甚至這催生了一項(xiàng)新職業(yè)——專門(mén)教人發(fā)狀態(tài)的社交網(wǎng)絡(luò)顧問(wèn),他們精于研究文字,發(fā)消息的時(shí)間,及照片對(duì)于傳播度的影響?!盖簏c(diǎn)贊」成為常態(tài),甚至他們已經(jīng)忘記了他們發(fā)狀態(tài)的初衷。許多人的發(fā)的狀態(tài)變得同質(zhì)化:庸俗,矯情,自憐,只為獲得更多的「贊」?!复竽粗浮钩闪松缃痪W(wǎng)絡(luò)的中心。
就這樣,網(wǎng)站的交互度有了長(zhǎng)足的提升,但這應(yīng)該是動(dòng)態(tài)消息所追求的嗎?這個(gè)問(wèn)題一直困擾著 Chris Cox ,他是 Facebook 的元老了,也是動(dòng)態(tài)算法的工程師?!赣^察用戶的點(diǎn)贊,點(diǎn)擊,分享,評(píng)論等行為,是為了更好的弄清楚用戶的心理。」Cox 在郵件中這么對(duì)我講。(他是 Facebook 的首席產(chǎn)品官)「但我們很清楚這不是一個(gè)完美的解決方案。例如,當(dāng)你看到一則悲傷的新聞,你肯定不會(huì)點(diǎn)贊,但這并不能代表你沒(méi)有受到觸動(dòng)。幾年過(guò)去了,我們需要知道比點(diǎn)贊和點(diǎn)擊更細(xì)節(jié)的用戶行為?!?/p>
一個(gè)算法可以盡可能的算出最優(yōu)解,但是不是最優(yōu)解,還得由人來(lái)評(píng)判。Cox 等人為動(dòng)態(tài)消息機(jī)制設(shè)立的終極目標(biāo)就是,把所有人們真正關(guān)系的消息按重要程度排序,把無(wú)關(guān)的全部隱去。他們知道,這意味著犧牲一些短期的廣告收入及用戶體驗(yàn)。Facebook 目前持有著大把現(xiàn)金,而 CEO 扎克伯格有著長(zhǎng)遠(yuǎn)的目標(biāo),這給了他們寶貴的試錯(cuò)機(jī)會(huì)。但如何把握機(jī)會(huì),還是要靠他們自己。
長(zhǎng)久以來(lái),媒體機(jī)構(gòu)對(duì)于判斷受眾們對(duì)什么內(nèi)容感興趣都源于主觀判斷。這樣的判斷影響編輯們講故事的方法,價(jià)值觀的取向,新聞價(jià)值的判斷及題材的選取。但這樣的主觀判斷是 Cox 和其他 Facebook 同事們極力避免的。他們與 Facebook 想要的效果是:用戶在動(dòng)態(tài)里看到的都是他們感興趣的內(nèi)容,而不是 Facebook 強(qiáng)推的內(nèi)容。「最完美的解決方案是給用戶選擇權(quán),讓他們挑出自己愛(ài)看的,但這明顯不實(shí)際?!笴ox 對(duì)我說(shuō)。所以次好的解決方案就是用算法猜測(cè)用戶喜愛(ài)什么,然后花錢(qián)雇傭一批人看效果如何。事實(shí)上這個(gè)外包團(tuán)隊(duì)已經(jīng)達(dá)到上千人之多,之前他們統(tǒng)一在 Knoxville 的辦公室工作,現(xiàn)在他們?cè)谧约杭依铩?/p>
Adam Mosseri 是現(xiàn) 32 歲的動(dòng)態(tài)消息產(chǎn)品主管,與 Alison 處于同一層級(jí),但前者更關(guān)注戰(zhàn)略而后者更關(guān)注技術(shù)細(xì)節(jié)。他找到問(wèn)題,Alison 負(fù)責(zé)解決問(wèn)題。他負(fù)責(zé)從哲學(xué)層面思考動(dòng)態(tài)消息問(wèn)題。
動(dòng)態(tài)消息從人性化方面的改善始于 Mosseri 的前任主管,Will Cathcart。Cathcart 的工作從采集更多細(xì)節(jié)信息開(kāi)展,不僅僅是用戶點(diǎn)擊了什么,還有用戶在每一個(gè)頁(yè)面上的停留時(shí)間,不僅僅是用戶點(diǎn)贊的內(nèi)容及傾向,還有他是在看前點(diǎn)贊,還是看了之后再點(diǎn)贊。對(duì)于看前就點(diǎn)贊的消息,F(xiàn)acebook 傾向于認(rèn)為你并不是那么喜歡。
自 2013 年主政以后,Mosseri 又有了一個(gè)大舉動(dòng),在 2014 年夏季創(chuàng)立了「動(dòng)態(tài)消息質(zhì)量評(píng)測(cè)小組」,該小組包含數(shù)百名成員,在諾克斯維爾市的辦公室,每天負(fù)責(zé)不斷體驗(yàn)自己的 Facebook 動(dòng)態(tài)消息時(shí)間線,并把細(xì)節(jié)及滿意程度反饋給 Facebook 的工程師。(他們其實(shí)是 Facebook 一個(gè)秘密的外包團(tuán)隊(duì)。)Mosseri 和工程師們不止于此,他們還會(huì)問(wèn)體驗(yàn)者為什么點(diǎn)贊,為什么不點(diǎn)贊,他們對(duì)自己點(diǎn)贊的標(biāo)準(zhǔn),還有他們的點(diǎn)贊傾向?!甘聦?shí)上,他們幾乎每天都要寫(xiě)調(diào)查報(bào)告」, Greg Marra 是評(píng)測(cè)小組的主管,他這么對(duì)我講。
「問(wèn)題是,我們可能錯(cuò)過(guò)了什么?」Mosseri 說(shuō),「有哪一方面的事實(shí)是我們的盲點(diǎn)?」 例如,他補(bǔ)充道,「我們知道有些消息是你感興趣的,但你并不會(huì)參與討論交流。如果沒(méi)有關(guān)注到這種情況,算法會(huì)誤以為你對(duì)這些消息并不感興趣,因?yàn)槟慵礇](méi)有點(diǎn)贊,也沒(méi)有評(píng)論。所以什么東西能把這些消息和普通消息區(qū)分開(kāi)來(lái)?」
Mosseri 任命了產(chǎn)品經(jīng)理 Max Eulenstein 還有用戶體驗(yàn)研究員 Lauren Scissors 管理著評(píng)測(cè)小組的日常運(yùn)營(yíng),對(duì)問(wèn)題的咨詢也是他們負(fù)責(zé)。例如,Eulenstein 讓小組成員們看一篇故事,測(cè)試他們?cè)谙矚g或不喜歡這條消息時(shí),分別在網(wǎng)頁(yè)上停留的時(shí)間。一般認(rèn)為,你在網(wǎng)頁(yè)上停留的時(shí)間越長(zhǎng),你對(duì)它越感興趣,即使你并沒(méi)有為它「點(diǎn)贊」?!傅珱](méi)那么簡(jiǎn)單,不僅僅是『 5 秒表示喜歡,2 秒表示不喜歡』」,Eulenstein 對(duì)我解釋,「每一位用戶的閱讀速度也大有差異,這個(gè)時(shí)間值應(yīng)該和用戶平均閱讀時(shí)間結(jié)合起來(lái)看?!龟P(guān)于這個(gè)問(wèn)題的研究成果在六月的算法改進(jìn)中得以體現(xiàn),F(xiàn)acebook 會(huì)盡量把用戶停留時(shí)間長(zhǎng)的消息排名靠前。
花費(fèi)了數(shù)月的時(shí)間,Mosseri 和他的團(tuán)隊(duì)終于建起了一個(gè)可以信賴的測(cè)評(píng)小組,這是一個(gè)國(guó)際化的團(tuán)隊(duì),根據(jù) Facebook 在全球的用戶數(shù)量分配團(tuán)隊(duì)中成員的國(guó)籍,并且允許他們?cè)诩肄k公。在 2015年末,F(xiàn)acebook 遣散了之前在諾克斯維爾市的辦公室,并擴(kuò)張了海外測(cè)試團(tuán)隊(duì)。Mosseri 的直覺(jué)是對(duì)的:動(dòng)態(tài)消息算法推薦上存在盲點(diǎn),但這件事工程師們自己發(fā)現(xiàn)不了。這需要另一種數(shù)據(jù)的支持——人肉反饋。
評(píng)測(cè)小組對(duì)于動(dòng)態(tài)消息算法的成熟起到了至關(guān)重要的作用,擺脫了對(duì)「大數(shù)據(jù)」的迷信之后,團(tuán)隊(duì)迅速成長(zhǎng)。 取而代之的是一個(gè)具有完善的反饋及平衡機(jī)制的系統(tǒng),每一次算法的改動(dòng)都必須經(jīng)歷不同類型,不同國(guó)籍的用戶的反饋,經(jīng)過(guò)多維度的標(biāo)準(zhǔn)測(cè)試正確率。
這一個(gè)包含排序工程師,產(chǎn)品經(jīng)理,數(shù)據(jù)分析師的小團(tuán)隊(duì)最主要的任務(wù)就是平衡算法的準(zhǔn)確性。Sami Tas 是其中的一位軟件工程師,他的工作是把動(dòng)態(tài)消息排序小組寫(xiě)出的目標(biāo)(即偽代碼)翻譯成電腦可以理解的語(yǔ)言。這個(gè)下午,我盯著他看,他從我旁邊經(jīng)過(guò),被一個(gè)看似微不足道的問(wèn)題困擾了。這真的是一個(gè)微不足道的問(wèn)題啊,然而,F(xiàn)acebook 的員工們卻錙銖必較。
大多數(shù)時(shí)候,人們看到一則不感興趣的消息,會(huì)直接跳過(guò)去。但有些消息使他們感到惱怒,他們會(huì)特地點(diǎn)開(kāi)下拉欄,找到「隱藏」按鍵。Facebook 算法將「隱藏」視為強(qiáng)烈的不滿信號(hào),并盡量減少相似的消息出現(xiàn)。
「隱藏」功能藏在下拉欄的二級(jí)菜單里
顯然,每個(gè)用戶的習(xí)慣都是不同的,有趣的是,F(xiàn)acebook 的數(shù)據(jù)分析師們發(fā)現(xiàn),5% 的用戶使用「隱藏」功能占了總數(shù)的 85 %。他們更深入的了解,這一小部分人幾乎把自己看過(guò)的所有消息都隱藏了——即使是他們點(diǎn)過(guò)贊的或評(píng)論過(guò)的消息。對(duì)于這些「『隱藏』強(qiáng)迫癥患者」,顯然,「隱藏」不代表他們不喜歡這條消息,他們想要表達(dá)的是「已閱」標(biāo)記,就像 Gmail 里的「歸檔」。
然而他們的行為將使賴以排序的數(shù)據(jù)造成偏差。對(duì)于這么復(fù)雜的情況,算法并不能分辨出這樣的行為。它只會(huì)傻傻地認(rèn)為點(diǎn)贊即代表滿意,隱藏代表強(qiáng)烈的不滿意。所以,對(duì)于這樣的「『隱藏』強(qiáng)迫癥患者」,工程師們決定為他們做專門(mén)的優(yōu)化。Tas 為此專門(mén)寫(xiě)了代碼辨別出這群人,并減低他們「隱藏」的負(fù)面權(quán)重。
這看似一個(gè)小問(wèn)題呢。但這套算法對(duì)于 Facebook 是如此重要,以至于這樣小小的改動(dòng)都應(yīng)該經(jīng)過(guò)嚴(yán)密的測(cè)試才能真正投入使用。首先是離線測(cè)試,在 Facebook 內(nèi)部小組內(nèi)小范圍測(cè)試,然后推出到一小部分用戶上,最后才是全面使用。每一步,數(shù)據(jù)分析師們都要收集對(duì)于用戶的網(wǎng)站交互度,廣告投放收入和加載速度影響。如果有哪一項(xiàng)出現(xiàn)大幅度的波動(dòng),則會(huì)出現(xiàn)警報(bào)并自動(dòng)通知到工程師們。
即便如此,F(xiàn)acebook 也不能確定對(duì)于長(zhǎng)期來(lái)看是否有負(fù)面影響。為了防止意外,還留有一部分「保留小組」,即一小部分的用戶會(huì)在幾個(gè)月內(nèi)保持原樣。
動(dòng)態(tài)消息排序算法不僅僅有一套,這是廣泛的誤解。事實(shí)上,這不是一套有幾百個(gè)小算法組成的算法。由于總共有很多個(gè)測(cè)試小組,「保留小組」,這個(gè)世界上同時(shí)運(yùn)行著很多個(gè)版本的排序算法。我猜,有一部分「『隱藏』強(qiáng)迫癥患者」已經(jīng)可以愉快地刷動(dòng)態(tài)消息了,但還有一部分的用戶仍受到不準(zhǔn)確算法的困擾。
質(zhì)量評(píng)測(cè)小組的出線另動(dòng)態(tài)消息算法團(tuán)隊(duì)的數(shù)據(jù)更立體,這是大數(shù)據(jù)不能給予的。至此,Tas 和其余的排序團(tuán)隊(duì)成員對(duì)于機(jī)器算法的盲點(diǎn)有了深刻的認(rèn)識(shí)。但是,F(xiàn)acebook 還有一個(gè)小組,對(duì)于這套算法的成熟也起到了至關(guān)重要的作用,那就是包括你我在內(nèi)的普通用戶。
在過(guò)去的六個(gè)月中,F(xiàn)acebook 一直在普通用戶中做著隨機(jī)的調(diào)查,設(shè)置左右兩列動(dòng)態(tài)消息,讓普通用戶選擇更感興趣的那一列,這是全民參與的「動(dòng)態(tài)消息評(píng)測(cè)小組」。但是,不僅如此,F(xiàn)acebook 在最近兩年一直給予用戶更多定制自己動(dòng)態(tài)消息的權(quán)力。
你不僅可以「取關(guān)」某人,還可以把你的好朋友列入優(yōu)先列表中,把某個(gè)類型的消息屏蔽掉。當(dāng)然,這些功能對(duì)于粗心的用戶來(lái)說(shuō)很難發(fā)現(xiàn),并不會(huì)增加輕度用戶的上手成本——它藏在右上角的灰色小箭頭里。大部分用戶甚至永遠(yuǎn)都不會(huì)發(fā)現(xiàn)這些功能。當(dāng)你打開(kāi)導(dǎo)航及幫助頁(yè)面時(shí),F(xiàn)acebook 會(huì)對(duì)這些功能進(jìn)行詳細(xì)的說(shuō)明。
這些轉(zhuǎn)變有部分原因是為了起到防御作用。近年來(lái),F(xiàn)acebook 在社交網(wǎng)絡(luò)的統(tǒng)治地位屢遭威脅,正如當(dāng)年 MySpace 的地位遭到 Facebook 的挑戰(zhàn)一樣。而新興的創(chuàng)業(yè)公司完全避開(kāi)了數(shù)據(jù)驅(qū)動(dòng)的模式,以 Instagram 為例,他們直接把你關(guān)注的所有人的狀態(tài)消息以反時(shí)間順序的時(shí)間線列出,F(xiàn)acebook 不得不買(mǎi)下 Instagram 以維持老大哥地位。Sanpchat 則以獨(dú)特的閱后即焚模式侵蝕著 Facebook 的青少年市場(chǎng)。
Facebook 并不是近年來(lái)唯一數(shù)據(jù)驅(qū)動(dòng)優(yōu)化推薦算法的公司。Neflix 的最佳影片推薦,同樣更具海量的用戶數(shù)據(jù),給用戶分成無(wú)數(shù)小類,分類推薦。為了平衡亞馬遜的自動(dòng) A/B 測(cè)試,首席執(zhí)行官貝索斯一直設(shè)立一個(gè)單獨(dú)的反饋郵箱供用戶提出意見(jiàn)?,F(xiàn)在將數(shù)據(jù)的處理完全交給機(jī)器學(xué)習(xí)還為時(shí)尚早,但機(jī)器學(xué)習(xí)的時(shí)代正在加速到來(lái)。Facebook 主管 Mosseri 在開(kāi)會(huì)時(shí)并不喜歡使用時(shí)髦的“數(shù)據(jù)驅(qū)動(dòng)”,他說(shuō)的是「數(shù)據(jù)輔助」。
Facebook 動(dòng)態(tài)消息排序小組相信他們的努力終將得到回報(bào)?!溉绻覀兝^續(xù)根據(jù)反饋提升動(dòng)態(tài)消息推送,我們呈現(xiàn)的消息就回越來(lái)越接近人們心中所想?!关?fù)責(zé)與動(dòng)態(tài)消息反饋小組對(duì)接的用戶體驗(yàn)分析師 Scissors 說(shuō)。
這里有一個(gè)潛在的負(fù)面影響:給用戶控制的權(quán)利,可是他們真的知道自己究竟想要什么嗎?還是數(shù)據(jù)驅(qū)動(dòng)的 Facebook 比我們更懂自己?可能做出比用戶自己想要的更吸引人的動(dòng)態(tài)消息嗎?
Mosseri 告訴我他并不會(huì)過(guò)度擔(dān)心這些。他解釋道,這些數(shù)據(jù)目前為止,都暗示應(yīng)該多做調(diào)查,給予用戶更多的選擇權(quán),這樣可以增加用戶的參與度及在網(wǎng)站上停留的時(shí)間,這兩項(xiàng)看似都是短期最主要的目標(biāo)。
動(dòng)態(tài)消息推送算法的改進(jìn)是一個(gè)非常長(zhǎng)期的過(guò)程。如果它恰好每次都擊中你的痛點(diǎn),那也僅僅是一個(gè)令人愉快的巧合。在長(zhǎng)達(dá)十年的動(dòng)態(tài)消息運(yùn)營(yíng)過(guò)程中,數(shù)據(jù)從來(lái)就沒(méi)有盡善盡美過(guò)。而算法的改進(jìn)就是一個(gè)否定之否定的過(guò)程,今天辛苦寫(xiě)成的代碼也許明天就會(huì)被無(wú)情刪除。日復(fù)一日,工程師們?cè)?Facebook 門(mén)洛帕克市的總部里的研究體驗(yàn)報(bào)告,開(kāi)會(huì),進(jìn)行一系列測(cè)試,然后一次又一次修正算法。
via slate
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。