3
本文作者: 霍炬 | 2015-07-18 12:42 |
【編者按】作者霍炬,本文來自他的微信公號:歪理邪說,已獲得作者授權。
這幾天最有趣的消息莫過于Uber相關關鍵字被微信屏蔽的事。騰訊的回應說“系統(tǒng)抖動”造成的這次屏蔽,結果引起了更多爭議,有人表示相信,有人表示不信。馮大輝在“小道消息”里面說他相信這個解釋,而我,則是半信半疑,我相信這件事一定有技術因素,但我同樣相信背后有非技術因素影響,故為半信。
(編者注:如不了解事件,可以看雷鋒網消息:微信今日“系統(tǒng)抖動”,短暫屏蔽Uber)
虎嗅有一篇文章大概是從百度百科抄來一個“系統(tǒng)抖動”定義,那個解釋跟這件事完全沒關系。
所以,我們先猜測下系統(tǒng)抖動到底是什么,會造成什么影響。
在互聯網以及計算機行業(yè),系統(tǒng)抖動本來也不是一個嚴謹的工程名詞,不同的系統(tǒng)設計和架構,會出現完全不同的狀況。
如果非要概括一下,微信所指的應該是指因為分布式系統(tǒng)數據同步的差異,從而造成的系統(tǒng)表現出來的不一致狀態(tài)。
中國用戶比較容易體會到類似的系統(tǒng)抖動,大概有兩個案例。
其一是所謂的Google Dance,就是在Google上時而搜不到一個網站,過幾天又可以搜到了。這是因為Google在更新巨大的網頁索引庫的時候,不同節(jié)點的索引版本不一樣,導致排序算法暫時混亂。而過了一段時間,數據同步了,自然也就好了。
如果你從來沒注意過這件事,可能是因為在中國一會能訪問Google,一會又不能訪問。這就是其二,偉大的GFW系統(tǒng)封網站的時候出現了類似問題,大多數情況下會封掉Google,但某些時候因為數據同步和更新的問題,又導致Google被解封,用戶就感覺偶爾能訪問一下,但大部分時間不行。
這兩個例子說明這類技術問題確實很常見,最終用戶也很容易會感知到它的存在。
但這種技術問題的特征應該是偶然發(fā)生,持續(xù)時間不長,并且分布平均。
比如Google Dance不可能只針對一個網站出現,而是機會平均被各種網站遇到,如果每次都是騰訊域名下所以頁面都搜索不到,那就不是系統(tǒng)抖動了。而GFW抖動造成被封網站突然能用,也不僅僅限于Google,其他網站,比如Facebook、Twitter也時而會出現突然能訪問的狀況,如果這些都不熟悉,順便說一聲,著名的1024網今天突然能訪問了…...
按照這個特征對照一下Uber遇到的情況,就會覺得這不是常規(guī)意義的“系統(tǒng)抖動“。
我自己寫不少Uber相關的文章,對Uber非常關注,微信上也有不少在Uber工作的朋友。時而會遇到他們說自己的官方帳號不能訪問了,或者貼個圖問大家能不能看到。對Uber的屏蔽一直是逐步升級的,而且也確實持續(xù)了三個月。系統(tǒng)如何抖動,和架構設計和原理有很大關系,但既然叫做抖動了,它必須得是在抖才合理。想想抖動這個詞在現實世界本來的含義是什么?
抖,應該是忽然向上、忽然向下,一會兒正常、一會兒不正常,這樣才叫抖。Uber是持續(xù)遇到問題,一邊倒,這怎么能叫做抖呢?我覺得叫做“系統(tǒng)傾翻”更符合這種一邊倒情況。
微信的反垃圾攔截系統(tǒng)具體設計和算法不得而知,但所有反垃圾系統(tǒng)使用的數學方法萬變不離其宗。它肯定是一種基于概率的過濾器算法。我并不打算在這解釋數學原理,霍金說:“一本書中多一個數學公式就會減少一半讀者”,所以我就一個公式也不寫,只解釋一下大致原理。
以比較常用的貝葉斯過濾器當例子,貝葉斯概率是從一個主觀假設開始,通過逐漸補充的數據計算來修正最初假設的過程。在這個過程中,主觀假設是可以隨便設置的,比如:假設公眾帳號發(fā)表的文章中,有30%是違反規(guī)則的垃圾文章。然后用事實去修正它。所謂修正,就是持續(xù)告訴系統(tǒng)這一篇不是垃圾,那一篇是垃圾的過程。
在這個模式里面,最早的猜想叫做先驗概率,通過一系列的事實修正,最終得到的結果叫做后驗概率,后驗概率就可以用來判斷一篇文章是不是違規(guī)了。實際應用系統(tǒng)會比這個復雜的多,但原理應該差不多,總是根據一個假設和事實修正逐漸接近事實情況的優(yōu)化過程。在這個過程中,四處是可以調整的參數,并且會直接影響最終效果。
在這類系統(tǒng)中,如果不是專門為Uber調整了某些參數,我實在沒法從技術角度理解這種所謂的系統(tǒng)抖動是如何發(fā)生的。
退一步說,就算真是系統(tǒng)自發(fā)的錯誤行為,相關團隊也應該早就應該通過優(yōu)化的方式解決這一問題,而不至于等到大眾媒體都開始關注才發(fā)現。
就說誘導分享這件事,整個微信世界還有比滴滴紅包更頻繁,更廣泛的誘導分享嗎?恐怕找不出第二個案例來。但滴滴這樣做就是沒事,這如果也不是人工優(yōu)化參數的結果,我只能認為騰訊已經孕育出了超越人類智能的人工智能了。據Uber的官方說明,他們此前已經多次和騰訊聯系試圖解決問題,結果就是解決不了。另外一方面,Uber中國團隊也有不少曾經在騰訊工作過的人。無論是私下渠道還是公開渠道,騰訊應該都不會是這幾天才知道這件事存在吧。這些情況放在一起,就更不是單一技術問題能夠解釋的。
另外,我時而會舉報一些確實是”誘導分享“的文章,以試圖測試微信的行為模式。不過到目前為止無一成功,都被系統(tǒng)回復了舉報失敗,可見這個誘導分享的判斷門檻并不低。
對比前一段常見的Uber相關文章被“多人舉報”的情況,我不禁對這位”多人“同學非常佩服,一舉報一個準。我時而感嘆世界上最強大的情報機關中,中國擁有兩個,一個是”多人“,一個是”朝陽群眾“。
我的“半信半疑“的半疑就來源于此。到現在為止,技術上的解釋沒法讓我相信。當然了,技術上的解釋合理不合理并不重要,從阿里到騰訊,技術在關鍵時刻總是被拿出來“獨擋一面“,重要的是將來會怎么樣。
所以所謂半信,除了相信存在一些技術因素,即,確實和算法有一些關系,而不是直接屏蔽一個關鍵詞之外。我更愿意相信微信把事情做好的愿望。
在中國普遍的職權不分的情況下,微信能回應此事,并且確實在解決,已經不容易了。對于未來我就保持一個半信的態(tài)度。對于大企業(yè)內部利益的平衡方式,是中國企業(yè)和美國企業(yè)最大的區(qū)別,當然也可以認為是中國社會和美國社會最大的區(qū)別。每次大家說起來Google的某些團隊竟然要招聘SEO(搜索引擎優(yōu)化)人員,就覺得是個笑話,但這恰恰說明了Google內部有防火墻,可以隔絕各部門利益。這是成為一個公平平臺的關鍵。這種公平,正是平臺型公司獲得信賴的關鍵。在中國,恐怕還沒有哪家互聯網公司能做好這件事。
另外,這件事由Uber引發(fā)并不奇怪。Uber是罕見的大規(guī)模沖擊現實世界的公司,在之前,互聯網公司里面只有電商企業(yè)真正沖擊了現實世界。別說騰訊這樣一家企業(yè),就算是各國政府不也正在Uber引發(fā)的浪潮中顛三倒四,做出各種怪事來嗎?
這里在順便說一個這幾天發(fā)生的好玩事。此前我寫過我們這個加拿大城市發(fā)生的Uber和市政府對抗的故事,最近這故事又有了新升級。本市出租車聯盟主席責怪市長,說應該讓警方來按照《安省高速法案》嚴格執(zhí)法,打擊Uber。我們的市長竟然真的致電警方,要求警方嚴格執(zhí)法。對于一個三權分立的國家,這簡直是天大的笑話。市民簡直被震驚了,人們紛紛評論說市長你是Peace Officer,有什么權利去要求Police Officer按照你的要求執(zhí)法啊?果不其然,幾天之后警方發(fā)言人得體的回復:“夏天是我們最忙的時候,我們最重要的職責是保護市民安全,打擊犯罪,保證交通暢通,其他不重要事務暫時沒人手專門處理?!币粋€三權分立了上百年的國家,其首都都被攪和到這樣顛三倒四,恨不得和中國一樣設立政法委組織聯合辦公,騰訊做為一家公司稍微有點混亂也不算什么奇怪的事。
對于Uber這樣一家公司,并不需要給予他們特別的同情,只要給他們不要太不公平的環(huán)境即可。必須要說,微信在維護秩序和尊重用戶方面,做的已經比其他中國互聯網公司好很多了,希望如這樣的抖動只是偶然現象。
畢竟,用戶還是需要Uber的,這是強大而真實的需求,任何阻力都很難阻擋它。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。