0
本文作者: 林覺(jué)民 | 2022-07-19 15:05 | 專題:2022年人物群像作品 |
作者 | 林覺(jué)民
編輯 | 王亞峰
總有些人,讓我們熱淚盈眶。
不知道現(xiàn)在的年輕人還玩不玩豆瓣,他們應(yīng)該不會(huì)知道,豆瓣是最先提出“推薦引擎改變世界”這句口號(hào)的公司。
不過(guò),他們對(duì)中國(guó)頭號(hào)文藝青年+理想主義者“豆瓣阿北”或許還有印象。
阿北(楊勃)1998年加入發(fā)明計(jì)算機(jī)的IBM做顧問(wèn)科學(xué)家,兩年后出來(lái)參加了一個(gè)Python郵件組,并且從中發(fā)掘出積極分子洪強(qiáng)寧。
豆瓣阿北
2005年底,阿北創(chuàng)辦豆瓣后,打算將洪強(qiáng)寧拉入伙,于是給他出了一道解BUG的面試題,洪強(qiáng)寧用Python完成后成為豆瓣2號(hào)員工。
洪強(qiáng)寧對(duì)雷峰網(wǎng)回憶過(guò)當(dāng)日見(jiàn)面的場(chǎng)景:“哈哈,阿北原來(lái)是用Java的,但是做豆瓣時(shí)他說(shuō)自己恨死Java了,所以我們豆瓣一開(kāi)始就用Python?!彼髞?lái)主動(dòng)降薪加入豆瓣,做到首席架構(gòu)師,也是中國(guó)早期杰出的Python布道者。
在拿到融資前,整個(gè)豆瓣就阿北一個(gè)老板帶著洪強(qiáng)寧一個(gè)正式員工(負(fù)責(zé)社區(qū)管理的Brant當(dāng)時(shí)還是兼職),兩人每周在咖啡館見(jiàn)面一次,聊到深更半夜,然后各自回家干活,直到2006年6月他們才搬到北京798藝術(shù)區(qū)旁邊的辦公室里。
網(wǎng)上一直盛傳豆瓣得名于公司所在地“豆瓣胡同”,洪強(qiáng)寧卻跟雷峰網(wǎng)說(shuō),自己只是路過(guò)那里,并沒(méi)待過(guò),只阿北在那里曾短暫居住。
從豆瓣成立第一天起,阿北要解決的問(wèn)題就是信息過(guò)窄,他非常清晰的認(rèn)識(shí)到推薦是一個(gè)行之有效的解決方案。
阿北和后來(lái)的張一鳴一樣,自己動(dòng)手寫了第一版推薦引擎,這也是中文互聯(lián)網(wǎng)世界的第一個(gè)推薦引擎。
單從推薦效果來(lái)看,這個(gè)推薦引擎其實(shí)已經(jīng)相當(dāng)厲害。當(dāng)時(shí)豆瓣的主要用戶都是熱愛(ài)讀書創(chuàng)作的硬核文青,他們非常需要一個(gè)探索發(fā)現(xiàn)新書的工具。阿北幫助他們解決了這個(gè)需求,所以豆瓣開(kāi)始風(fēng)靡博客圈,也因此獲得許多流量。
但是從運(yùn)行效率來(lái)看,阿北這個(gè)純Python的推薦引擎也同樣渣渣,隨著用戶的不斷涌入,很多時(shí)候運(yùn)行一整天才能算出結(jié)果。
不過(guò)阿北并不像張一鳴那樣為技術(shù)不足憂愁,因?yàn)樗型跏貚嬤@個(gè)多年老友相助。
王守崑
事實(shí)上,王守崑當(dāng)時(shí)手里拿著兩份offer,一份是世界第一有錢的電商公司亞馬遜的,另一份就是世界第一有情懷的豆瓣的,這兩份offer需要他做的事都一樣——那就是推薦算法。
這并不是一個(gè)需要考慮的抉擇,因?yàn)橥跏貚嬃x無(wú)反顧站到了阿北一邊,原因僅僅是豆瓣看起來(lái)更有意思。
王守崑老師對(duì)雷峰網(wǎng)回憶了剛加入時(shí)的工作:“我作為四號(hào)員工入職后,頭兩個(gè)月只做了一件事,就是把阿北的純Python版本改成純C版本,然后推薦效率就大概提升了十幾倍的樣子?!?/p>
按照王守崑的說(shuō)法,阿北的版本仍然是非常好的,他認(rèn)為自己做的主要是優(yōu)化性能的工作。
同樣是2005年,同樣出身IBM,同樣覺(jué)得推薦有意思的徐易容創(chuàng)立了抓蝦,他聚攏了30位工程師,抓取了500多個(gè)博客和新聞?lì)l道的13億篇文章,他計(jì)劃將機(jī)票、招聘、教育、餐飲通通容納進(jìn)自己的抓蝦閱讀器,他甚至開(kāi)始評(píng)價(jià)當(dāng)時(shí)正在創(chuàng)業(yè)的師兄李彥宏“也沒(méi)什么了不起”。
如果用后來(lái)移動(dòng)互聯(lián)網(wǎng)時(shí)代的說(shuō)法,徐易容想做的抓蝦就是主打信息分發(fā)的推薦引擎,不過(guò)他始終沒(méi)有真正建立起一個(gè)推薦工具,從頭到底采用的仍然是傳統(tǒng)的關(guān)鍵詞規(guī)則匹配方法,主要是依靠好的產(chǎn)品體驗(yàn)獲取客戶。
另外,徐易容的想法太大,做的也太早,抓蝦最后抓瞎,只能賣給豆瓣。抓蝦雖然沒(méi)有為豆瓣帶來(lái)多少技術(shù),卻也貢獻(xiàn)了不少內(nèi)容資源。
在此之后,豆瓣開(kāi)始做一個(gè)叫“豆瓣猜”的推薦產(chǎn)品,豆瓣內(nèi)部將書籍、電影、音樂(lè)稱為釘子,推薦引擎稱為錘子。阿北的任務(wù)是帶隊(duì)找釘子,王守崑的任務(wù)招人做錘子。
2007年,豆瓣第一個(gè)定義并且提出招聘“算法工程師”這個(gè)職稱。在此之后,廣大推薦算法人才終于有了自己獨(dú)特的崗位。
2007年谷文棟從北京航空航天大學(xué)博士畢業(yè),他敲響了王守崑的面試大門,雖然阿北和王守崑都覺(jué)得他是少見(jiàn)的推薦人才,但是谷文棟最終決定創(chuàng)業(yè),王守崑沒(méi)能招納到谷文棟,只好保持長(zhǎng)期聯(lián)系。
一年后的夏天,國(guó)人的目光都集中在奧運(yùn)盛典上時(shí),谷文棟卻醉心于經(jīng)營(yíng)自己討論推薦算法的郵件組和博客,很多推薦技術(shù)愛(ài)好者都是其忠實(shí)粉絲。
又過(guò)了一年,谷文棟和還在讀博的項(xiàng)亮一起成立面向推薦領(lǐng)域的專業(yè)社區(qū)ResysChina,并且計(jì)劃辦一場(chǎng)“ResysChina推薦大會(huì)”,將大家弄到一處好好聚聚,但是他們連個(gè)場(chǎng)地都沒(méi)有。
這時(shí)候,阿北和王守崑對(duì)兩人伸出了援手。
2009年12月19日,豆瓣支持谷文棟搞起了第一屆ResysChina推薦大會(huì),不僅給大家提供點(diǎn)心飲料紀(jì)念品,而且貢獻(xiàn)王守崑擔(dān)任主講人上臺(tái)演講,國(guó)內(nèi)推薦技術(shù)愛(ài)好者紛紛報(bào)名。
不久前,谷文棟和雷峰網(wǎng)回憶那天時(shí)說(shuō):“阿北當(dāng)時(shí)非常激動(dòng),他說(shuō)了好多好多話?!?/p>
王守崑上臺(tái)分享了很多豆瓣猜經(jīng)驗(yàn)。
迅捷英翔的孫超和劉凱義講了怎么做推薦產(chǎn)品。
百度的張棟當(dāng)時(shí)正在搭建鳳巢系統(tǒng),有非常豐富的大規(guī)模機(jī)器學(xué)習(xí)經(jīng)驗(yàn),整段演講高屋建瓴而且故事性強(qiáng),每一段話都妙趣橫生,將大會(huì)推向高潮。
張棟
以至于,后來(lái)谷文棟再辦推薦大會(huì)時(shí),又再次找他。
張棟是中國(guó)搜索引擎界的臥龍鳳雛,當(dāng)前國(guó)內(nèi)能叫得出名字的搜索引擎大多和他有關(guān)。
他1976年出生,碩士畢業(yè)于中科院,博士畢業(yè)于瑞士聯(lián)邦理工大學(xué)和美國(guó)麻省理工大學(xué)。
2006年底張棟加入谷歌,從事推薦引擎技術(shù)的研發(fā)。兩年后,作為第一個(gè)從谷歌加入百度的員工,張棟擔(dān)任了百度鳳巢廣告系統(tǒng)架構(gòu)師,是最早將大規(guī)模機(jī)器學(xué)習(xí)核心算法應(yīng)用在中國(guó)互聯(lián)網(wǎng)產(chǎn)品的先行者。
多年后的一個(gè)寒夜,張棟吃完火鍋后這樣告訴雷峰網(wǎng):“當(dāng)前人們提到人工智能,首先想到的是戰(zhàn)勝國(guó)際象棋大師的 AlpahGo,人臉識(shí)別、自動(dòng)駕駛等。但是我認(rèn)為,人類迄今最大的人工智能應(yīng)用就是互聯(lián)網(wǎng)搜索引擎?!?/p>
在張棟眼里,離開(kāi)百度可能是他做過(guò)最錯(cuò)誤的選擇,從他后來(lái)的創(chuàng)業(yè)來(lái)看,他骨子里仍然有很強(qiáng)的搜索情節(jié)。
時(shí)間回到2009年,張棟這年不僅在豆瓣的推薦大會(huì)上做了分享,而且還干了另一件影響深遠(yuǎn)的事,他把自己在谷歌的好友宿華拉進(jìn)了百度。
兩個(gè)人分工是這樣的,張棟擅長(zhǎng)算法,所以能夠設(shè)計(jì)算法框架,宿華擅長(zhǎng)系統(tǒng)優(yōu)化和工程,能做很多工程實(shí)現(xiàn)。
張棟那時(shí)候?qū)λ奕A評(píng)價(jià)非常高,每次見(jiàn)到谷文棟,都會(huì)忍不住自夸:“臥槽,哥們,我這邊有個(gè)天才程序員。”
宿華
張棟將百度鳳巢做起來(lái)后,百度收入飆升,凈利增165%,這也是百度領(lǐng)先騰訊阿里兩家的高光時(shí)刻,以后再也沒(méi)有這樣的機(jī)會(huì)了。
不得不說(shuō),谷歌對(duì)中國(guó)互聯(lián)網(wǎng)的發(fā)展真是影響深遠(yuǎn)。
從根子上說(shuō),張棟在百度鳳巢做的大規(guī)模矩陣分解,和他前同事王益后來(lái)在騰訊廣點(diǎn)通做的大規(guī)模語(yǔ)義分解,其實(shí)大同小異,都是谷歌大規(guī)模并行化技術(shù)的發(fā)展。
谷歌間接給百度和騰訊送來(lái)了最強(qiáng)營(yíng)收算法。
有人說(shuō),張棟并沒(méi)有將算法看得很重,他在第二屆ResysChina推薦大會(huì)上甚至提出了一個(gè)觀點(diǎn),這個(gè)觀點(diǎn)被人解讀為“算法無(wú)用論”。
2010年的ResysChina推薦大會(huì)是在淘寶舉辦的。
這里有兩個(gè)背景:一是當(dāng)時(shí)淘寶事事向亞馬遜看齊,亞馬遜有個(gè)說(shuō)法——他們35%的交易是推薦驅(qū)動(dòng)的,淘寶自然也開(kāi)始重視推薦算法;二是當(dāng)年淘寶雙11交易額達(dá)到9.36億的天文數(shù)字,這都是靠人工運(yùn)營(yíng)做出來(lái)的,阿里人很想知道還有沒(méi)有進(jìn)步空間。
淘寶贊助谷文棟搞ResysChina大會(huì)的目的非常明晰——那就是搜羅推薦人才。
本來(lái),這次推薦大會(huì)最受期待的嘉賓是谷文棟請(qǐng)來(lái)的以色列人Yehuda Koren,此人在之前的奈非推薦大賽上擊敗項(xiàng)亮團(tuán)隊(duì),獲得全球第一名。
甚至可以這樣說(shuō),這次大會(huì)之所以如此火爆,一半的原因都是Yehuda Koren會(huì)出席。
可惜Yehuda Koren這個(gè)人表達(dá)不行,現(xiàn)場(chǎng)效果一般般,反而是張棟在會(huì)上提出的4321模型反響熱烈,后來(lái)被廣泛引用。
黃建軍就曾經(jīng)說(shuō)過(guò):“推薦系統(tǒng)作為一個(gè)整體,包括UE/UI、數(shù)據(jù)、行業(yè)知識(shí)和算法,我比較信奉百度張棟的說(shuō)法?!?/p>
王守崑也曾經(jīng)在知乎里給人家安利張棟的框架。
那么張棟的4321模型是怎樣的呢?
公式大抵如此:UI/UE占40% > 數(shù)據(jù)占30% > 知識(shí)占20% > 算法10%。
這個(gè)說(shuō)法提出后,有一段時(shí)間內(nèi)被解釋為“算法無(wú)用論”,人們?cè)尞愑诟愠霭俣萨P巢的張棟怎么會(huì)提這樣的觀點(diǎn)。
在雷峰網(wǎng)向張棟求證了4321的說(shuō)法,張棟說(shuō)了這么一句話:“推薦引擎大戰(zhàn)就好比奧運(yùn)會(huì)百米賽跑,前面90%大家都能跑,剩下10%決定勝負(fù)?!?/p>
對(duì)推薦系統(tǒng)來(lái)說(shuō),10%算法是更珍貴的,因?yàn)檫@是做推薦系統(tǒng)的第一步,如果沒(méi)有這個(gè),后面90%的實(shí)現(xiàn)問(wèn)題都沒(méi)有機(jī)會(huì)解決。
這里接著說(shuō)完第二屆推薦大會(huì)的故事,在這次大會(huì)上,阿里的人向谷文棟提了個(gè)問(wèn)題:
“以阿里的體量搞一個(gè)推薦引擎,至少需要兩三百號(hào)人,而且都是價(jià)格不菲的頂級(jí)工程師,如果再考慮試錯(cuò)成本,這個(gè)投入值得嗎?畢竟阿里現(xiàn)在雙11已經(jīng)很猛了,真的有必要再搞推薦引擎嗎?”
谷文棟正面沒(méi)有回答,而是反問(wèn)了阿里的人兩個(gè)問(wèn)題:“一、你們相不相信阿里業(yè)務(wù)還會(huì)爆炸增長(zhǎng)?二、你們認(rèn)不認(rèn)可數(shù)據(jù)驅(qū)動(dòng)的價(jià)值觀?”
后來(lái)的事情證明了阿里的選擇:IBM出來(lái)的袁泉被谷文棟鼓動(dòng)去了阿里,并且受到重用,袁泉開(kāi)創(chuàng)了淘寶推薦算法。
2013年雙11期間,淘寶光是靠推薦引導(dǎo)的交易額就達(dá)到56.8億。
與之相對(duì)照的,當(dāng)當(dāng)技術(shù)總監(jiān)王洪濤那時(shí)候也在搞推薦,可惜李國(guó)慶俞渝內(nèi)亂太嚴(yán)重,公司的技術(shù)革新也處在矛盾對(duì)立中,于是一步落后步步落后,從此與推薦無(wú)緣。
事實(shí)上,阿里面臨的問(wèn)題也是現(xiàn)在很多互聯(lián)網(wǎng)公司面臨的問(wèn)題——大公司在行業(yè)已經(jīng)占據(jù)很大份額,是不是還有必要搞推薦這么昂貴的東西?
有些東西雖然正確,但到底值不值得,這真是一件不好抉擇的事情。這就好比美國(guó)經(jīng)濟(jì)已經(jīng)傲視全球,是不是還有必要搞高鐵和特高壓輸電?
歷史進(jìn)程給大國(guó)家、大公司、大人物的機(jī)會(huì)窗口,其實(shí)都是很有限的,抉擇甚至大于努力。
參加完推薦大會(huì)的張棟,也同樣面臨著是否留在百度的抉擇。
張棟做起鳳巢之后,在百度立下大功,也應(yīng)該獲得獎(jiǎng)勵(lì)晉升。
一位鳳巢前成員曾經(jīng)告訴雷峰網(wǎng),他們當(dāng)時(shí)認(rèn)為:“張棟做不了百度CTO,做百度的首席科學(xué)家還是可以的吧。”
不過(guò),李彥宏顯然沒(méi)有同意這個(gè)要求,而是打了個(gè)大大的折扣任命他做鳳巢的首席科學(xué)家。(百度的隱秘故事可以參見(jiàn)科技史新書《沸騰新十年》,加下方小編微信可搶購(gòu)預(yù)售。)
事實(shí)上,到這個(gè)時(shí)候,鳳巢團(tuán)隊(duì)的人已經(jīng)不太滿意了。畢竟老大上不去,下面的人也很難上的去。
為了安撫鳳巢團(tuán)隊(duì),李彥宏特設(shè)百度最高獎(jiǎng),既然給不了精神獎(jiǎng)勵(lì),給些物質(zhì)補(bǔ)償還是必要的。
李彥宏將百萬(wàn)美金的獎(jiǎng)勵(lì)頒發(fā)給了鳳巢團(tuán)隊(duì)。
可以這么說(shuō),這個(gè)獎(jiǎng)一開(kāi)始幾乎就是為張棟團(tuán)隊(duì)所特設(shè),后期需要獎(jiǎng)勵(lì)別人,就延續(xù)了下來(lái)。
但是兌現(xiàn)時(shí)又出了岔子,張棟后來(lái)發(fā)現(xiàn)這個(gè)獎(jiǎng)是分4年兌現(xiàn)的,于是憤而離職,其團(tuán)隊(duì)內(nèi)包括宿華在內(nèi)的一批牛人也是那時(shí)候離開(kāi)了百度。
2010年谷歌退出中國(guó)大陸留下巨大空白市場(chǎng),百度在國(guó)內(nèi)搜索引擎中一家獨(dú)大,其他巨頭也想來(lái)分一杯羹。
周鴻祎在360找來(lái)了兩個(gè)團(tuán)隊(duì)來(lái)賽馬,一支是董毅團(tuán)隊(duì),另一支是張棟團(tuán)隊(duì)。
張棟對(duì)做搜索引擎可以說(shuō)是駕輕就熟,而且在算法方面的積累和資源遠(yuǎn)遠(yuǎn)超過(guò)其他人,幾乎是不可戰(zhàn)勝的。
董毅是360老將,曾經(jīng)一手做出360最核心的殺毒技術(shù)QVM人工智能引擎,幫助360在極短時(shí)間內(nèi)擊敗各大國(guó)際殺毒巨頭。
董毅團(tuán)隊(duì)的人后來(lái)這樣向雷峰網(wǎng)回憶:“我們?cè)谒阉鞣矫娴慕?jīng)驗(yàn)和能力遠(yuǎn)遠(yuǎn)落后于張棟,沒(méi)人、沒(méi)錢、沒(méi)資源,但是董毅這哥們腦袋真特么靈活,他一開(kāi)始就定下來(lái)一條路:不比算法,比想法。”
那“比想法”是怎么做的呢?
董毅當(dāng)時(shí)的搜索團(tuán)隊(duì)只有8個(gè)人,不可能像張棟那樣搞機(jī)器學(xué)習(xí),但他非常懂殺毒。
他就專門搞了一個(gè)程序放在用戶電腦上,記錄用戶搜索日志,用戶點(diǎn)擊,用戶訪問(wèn)了哪些網(wǎng)頁(yè),然后把這些數(shù)據(jù)建成一個(gè)大的數(shù)據(jù)庫(kù),并且進(jìn)行排序,轉(zhuǎn)化成索引。
這樣做的效果就是,當(dāng)用戶下次搜索的時(shí)候,在沒(méi)有網(wǎng)址導(dǎo)航的情況下,之前搜的網(wǎng)頁(yè)會(huì)排的最靠前,給用戶帶去了極佳的用戶體驗(yàn)。
360搜索上線一周就超過(guò)了搜搜、搜狗,后來(lái)最多時(shí)占據(jù)了國(guó)內(nèi)35%的市場(chǎng)份額。
周鴻祎果斷裁掉張棟團(tuán)隊(duì)。
不過(guò),張棟團(tuán)隊(duì)的成員們也不算倒霉,他們都被張棟推薦給了宿華。
2013年宿華在晨興資本張斐的介紹下認(rèn)識(shí)人人網(wǎng)出來(lái)的程一笑,兩人一拍即合,將GIF快手改造成基于推薦的短視頻社區(qū)。
張棟推薦過(guò)來(lái)的人,很多都成為了快手的早期員工,所以快手短視頻早期才能在推薦算法方面爆發(fā)出驚人的戰(zhàn)斗力。
2014年,張一鳴打算收購(gòu)快手,但是宿華太貴,只好轉(zhuǎn)頭收購(gòu)了一家叫圖吧的公司。
張一鳴
圖吧的創(chuàng)始人是從貓撲出來(lái)的,她的名字叫張楠。
張楠之前每天在微博上給女兒寫一段話配一張圖,因?yàn)槁?tīng)聞微博超過(guò)3萬(wàn)條就會(huì)刪除多余微博,于是創(chuàng)業(yè)做起了圖吧。
圖吧會(huì)根據(jù)用戶瀏覽記錄分析用戶興趣,算是有點(diǎn)推薦的影子。
張一鳴后來(lái)對(duì)雷峰網(wǎng)回憶了決策收購(gòu)的場(chǎng)景:
“那天我和陳林從圖吧公司回來(lái)路上,陳林說(shuō)快手太貴了。那時(shí)候快手已經(jīng)接受了1000萬(wàn)美金投資,如果要收購(gòu)至少需要幾千萬(wàn)美金。我們就討論說(shuō),還是別收快手,收張楠團(tuán)隊(duì)吧,讓他們進(jìn)來(lái)嘗試下這個(gè)方向?!?/p>
后來(lái)大家都知道,張楠成為了抖音的創(chuàng)始人。不過(guò)這已經(jīng)是幾年后的事情了,張楠當(dāng)時(shí)完全無(wú)法替代宿華,因?yàn)樽止?jié)很長(zhǎng)時(shí)間的大窘境就是沒(méi)有好的推薦引擎,抖音崛起有不少的功勞在推薦引擎身上。
從字節(jié)創(chuàng)立第一天起,張一鳴就在為找技術(shù)負(fù)責(zé)人這件事發(fā)愁。
早年在酷訊時(shí)期,張一鳴就常年潛水于ResysChina社區(qū),他是見(jiàn)過(guò)高峰的人,所以也渴望高峰,但是公司早期太小,實(shí)在難容大佛,以至于張一鳴養(yǎng)成了這樣的挖人習(xí)慣——即當(dāng)時(shí)沒(méi)挖成,之后一兩年還是給人打電話約吃飯,然后問(wèn)工作情況。
當(dāng)時(shí),張一鳴曾經(jīng)找過(guò)亞馬遜推薦團(tuán)隊(duì)出來(lái)的林承仁,想要收掉林承仁的無(wú)覓團(tuán)隊(duì)(該團(tuán)隊(duì)不少亞馬遜工程師),不過(guò)對(duì)方創(chuàng)業(yè)興致正濃被婉言拒絕。一年后,林承仁因?yàn)樽龀霈F(xiàn)象級(jí)產(chǎn)品無(wú)秘名聲大振,之后就轉(zhuǎn)向陌生人社交賽道,直到多年后才又回到個(gè)性化方向,這已是后話。
還有一次,張一鳴好不容易挖來(lái)百度技術(shù)委員會(huì)主席廖若雪負(fù)責(zé)技術(shù),可惜廖若雪只干了一個(gè)月覺(jué)得沒(méi)戲就走人,張一鳴只好又重頭開(kāi)始。
2014年,張一鳴終于請(qǐng)到百度大搜副總監(jiān)楊震原吃飯,在這次飯局上,張一鳴沒(méi)有談技術(shù),而是大談對(duì)產(chǎn)品的理解,他跳出互聯(lián)網(wǎng)產(chǎn)品的角度,從產(chǎn)業(yè)的維度談起對(duì)信息分發(fā)的理解。
張一鳴對(duì)產(chǎn)品的理解讓楊震原佩服的五體投地,他后來(lái)私下表示,張一鳴的理解超過(guò)了他見(jiàn)過(guò)的所有人,所以他才愿意到頭條來(lái)試一試。
楊震原加入字節(jié),直接帶動(dòng)大量百度人相繼加入,其中就包括朱文佳等人。
楊震原
朱文佳是楊震原一手培養(yǎng)起來(lái)的推薦天才,在百度時(shí)候已經(jīng)是架構(gòu)師,到字節(jié)后長(zhǎng)期負(fù)責(zé)算法工作,和項(xiàng)亮一起算是楊震原手下的推薦雙璧。
在抖音崛起的過(guò)程中,朱文佳就是那個(gè)向上的轉(zhuǎn)折點(diǎn)。
2016年末,張楠做起抖音后,經(jīng)過(guò)強(qiáng)運(yùn)營(yíng)確實(shí)在微博上小火一把,但是之后就陷入了增長(zhǎng)瓶頸,而且這時(shí)候出現(xiàn)了更大的危機(jī)——內(nèi)容嚴(yán)重同質(zhì)化,如此長(zhǎng)時(shí)間下去用戶一定會(huì)流失。
張一鳴找到楊震原,要求調(diào)朱文佳去負(fù)責(zé)抖音推薦,卻遭到了拒絕,因?yàn)樗藭r(shí)正支撐著今日頭條的DAU和廣告營(yíng)收。
張一鳴從戰(zhàn)略的角度看到了抖音的重要性,于是三番五次找楊震原聊天,最后終于將他說(shuō)服。
朱文佳負(fù)責(zé)抖音算法后,抖音迅速煥發(fā)出強(qiáng)大的生命力,進(jìn)入用戶爆發(fā)期。
這里還有一個(gè)例子可以旁證推薦引擎對(duì)于短視頻社區(qū)的關(guān)鍵性:
Musically創(chuàng)始人陽(yáng)陸育曾經(jīng)告訴雷峰網(wǎng),抖音和Musically產(chǎn)品上非常相似,但是推薦算法做得內(nèi)容泛化更好,他如果不把Musically賣給字節(jié),至少還需兩年時(shí)間才能追的上,那時(shí)候肯定已經(jīng)晚了。
2018年抖音海外版Tik Tok合并Musically,之后三年下載量成世界第一。在產(chǎn)品出海這件事上,字節(jié)終于為中國(guó)互聯(lián)網(wǎng)打了一場(chǎng)勝仗。
時(shí)間再次回到2012年,回到谷文棟辦的最后一屆ResysChina推薦引擎大會(huì)上。
這次的大會(huì)時(shí)Hulu贊助的,會(huì)場(chǎng)在清華科技園紫光國(guó)際交流中心,地方大很多,本來(lái)預(yù)備的200人席位遠(yuǎn)遠(yuǎn)容納不下想要參會(huì)的觀眾。
谷文棟不得不在宣傳欄里寫下“為了保證良好的討論氛圍,優(yōu)先考慮團(tuán)隊(duì)報(bào)名”這個(gè)要求。
大會(huì)的演講嘉賓非常豪華,谷文棟甚至請(qǐng)到了Facebook核心的華人推薦算法leader石言心。
石言心
當(dāng)時(shí)Facebook正是牛氣沖天之時(shí),挖了大量谷歌、亞馬遜的核心算法人才,準(zhǔn)備大舉進(jìn)軍推薦領(lǐng)域,對(duì)外其實(shí)是相當(dāng)保守的。
站在企業(yè)的角度來(lái)看,這也完全可以理解,因?yàn)楫?dāng)時(shí)谷歌和亞馬遜等國(guó)外巨頭也整天盯著Facebook,非常想要知道Facebook的具體執(zhí)行策略。
石言心在這種情況下能夠參加ResysChina推薦引擎大會(huì),并且分享的主題就是“Facebook的推薦系統(tǒng)”,這對(duì)于國(guó)內(nèi)推薦人進(jìn)行前沿探索起到重要作用。
石言心講完后,其他人也都傾其所有。
百度的劉其文講了“百度推薦系統(tǒng)的探索過(guò)程”,騰訊廣點(diǎn)通的王益講了“推薦系統(tǒng)實(shí)踐”,Hulu的鄭華和項(xiàng)亮也做了分享。
沒(méi)錯(cuò),這位項(xiàng)亮正是谷文棟一起創(chuàng)辦ResysChina的好友,此時(shí)的他已經(jīng)是Hulu推薦算法負(fù)責(zé)人。
前文一直在刻意忽略項(xiàng)亮,并不是他不重要,而是因?yàn)樗鳛橹袊?guó)推薦引擎的關(guān)鍵人物,值得重筆講述。
石言心和項(xiàng)亮正好代表了中國(guó)推薦算法的兩個(gè)階段:一、跨國(guó)大公司中的華人華僑群體將推薦算法帶向中國(guó);二、中國(guó)自己培養(yǎng)的人才長(zhǎng)成后是對(duì)外競(jìng)爭(zhēng)的關(guān)鍵力量。
項(xiàng)亮在推薦引擎圈成名非常早。
項(xiàng)亮
早年奈非為了改善電影推薦系統(tǒng)算法,于是懸賞一百萬(wàn)美元辦了場(chǎng)推薦大賽,吸引了全世界186個(gè)國(guó)家的數(shù)萬(wàn)支隊(duì)伍參賽。
當(dāng)時(shí)項(xiàng)亮剛剛從中科大畢業(yè)進(jìn)入中科院自動(dòng)化所,其導(dǎo)師楊青就大力支持他參賽。
比賽開(kāi)始后,項(xiàng)亮的模型和當(dāng)時(shí)以色列Yehuda Koren團(tuán)隊(duì)的模型在很多重要指標(biāo)上都不相伯仲,雙方都遠(yuǎn)遠(yuǎn)領(lǐng)先其他團(tuán)隊(duì)。
這時(shí)候,以色列團(tuán)隊(duì)開(kāi)始拉攏四個(gè)排名靠前的團(tuán)隊(duì)搞模型融合,獲得了非常好的效果。項(xiàng)亮也反應(yīng)過(guò)來(lái),開(kāi)始跟其他的團(tuán)隊(duì)也進(jìn)行合作。
這一比賽就比了三年,最終項(xiàng)亮雖然在成績(jī)上和Yehuda Koren團(tuán)隊(duì)一樣,但因?yàn)楸葘?duì)方晚提交了2小時(shí)20分鐘,排名只能屈居第二。
經(jīng)此一役,項(xiàng)亮在推薦算法上的能力得到大幅度提升,也成為國(guó)內(nèi)推薦圈子的先鋒人物。
在此之后,項(xiàng)亮進(jìn)入阿北、徐易容、袁泉都曾經(jīng)供職的IBM實(shí)習(xí),并在這里和袁泉一起發(fā)過(guò)KDD論文。
在第二屆ResysChina推薦大會(huì)上,項(xiàng)亮見(jiàn)到了CSDN總編劉江,劉江跟項(xiàng)亮說(shuō),國(guó)外已經(jīng)有了講推薦系統(tǒng)的專業(yè)書,國(guó)內(nèi)還一本沒(méi)有,他們圖靈出版社希望能出版一本,這相當(dāng)于在跟項(xiàng)亮約稿。
項(xiàng)亮做完博士論文不久,對(duì)這方面的研究還很有熱情,于是答應(yīng)下來(lái),然后就開(kāi)始寫作《推薦系統(tǒng)實(shí)踐》一書,這一寫就寫了半年。
在寫書期間,項(xiàng)亮進(jìn)入Hulu鄭華手下任職,主要工作就是利用大數(shù)據(jù)做推薦系統(tǒng),雖然遇到了Hulu全球副總裁張小沛這個(gè)好領(lǐng)導(dǎo),但是Hulu這種長(zhǎng)視頻應(yīng)用,并沒(méi)有辦法充分發(fā)揮推薦的作用。
這就來(lái)到著名的“借書事件”,這年頭條剛創(chuàng)立不久,剛剛起步的張一鳴找正在巔峰的項(xiàng)亮要沒(méi)出版的《推薦系統(tǒng)實(shí)踐》書稿,項(xiàng)亮不給他,最后張一鳴只能自己邊學(xué)邊寫,搞了個(gè)渣渣推薦引擎。
2013年,項(xiàng)亮、鄭華跟隨張小沛跳槽宜信大數(shù)據(jù)中心,做出了姨搜和反欺詐圖譜;11月,谷文棟加入宜信擔(dān)任創(chuàng)新中心副總經(jīng)理;一年后,豆瓣洪強(qiáng)寧也加入宜信。
宜信一時(shí)間成為算法人才高地,可惜它仍然沒(méi)有足夠的用戶場(chǎng)景釋放這些推薦人才的創(chuàng)新力。
2017年項(xiàng)亮離開(kāi)宜信加入快手,雖然得到了宿華本人的足夠重視,但非常不適應(yīng)快手的企業(yè)文化,而且,他當(dāng)時(shí)最想做的視頻理解項(xiàng)目也沒(méi)有發(fā)揮空間,所以并沒(méi)有待多久。
外界對(duì)快手有一種推測(cè),宿華帶進(jìn)快手的清華派自視甚高,外部加入的人才往往會(huì)遇到非工作的麻煩??焓掷蠁T工朱藍(lán)天在內(nèi)網(wǎng)文章《談?wù)効焓值牟 分幸矊ⅰ芭上盗至ⅰ绷袨榇髥?wèn)題,不知項(xiàng)亮是否受到影響。另一位算法天才蓋坤跳到快手還過(guò)得不錯(cuò),其清華出身起了很大作用。與之相近的還有個(gè)例子,推薦引擎領(lǐng)域的另一條超級(jí)大魚趙世奇離開(kāi)百度加入了華為鴻蒙。
張一鳴沒(méi)有在第一時(shí)間知道項(xiàng)亮離職這件事,以至于被快手搶了先機(jī),但他并不打算放過(guò)這個(gè)機(jī)會(huì),于是多次游說(shuō)項(xiàng)亮,終于將其招至頭條,頗有一種歷盡坎坷,終歸明主的感覺(jué)。
項(xiàng)亮歸入字節(jié)跳動(dòng)旗下,先是在AILab研究視頻理解,之后擔(dān)任推薦系統(tǒng)的負(fù)責(zé)人。
近兩年字節(jié)跳動(dòng)開(kāi)始做TO B的火山引擎,最大賣點(diǎn)之一莫過(guò)于世界級(jí)的推薦系統(tǒng),其背后的就是項(xiàng)亮。
頭條快手之后,幾乎所有內(nèi)容社區(qū)都有了推薦這個(gè)必選項(xiàng),知乎周源引入李大海主持內(nèi)容泛化,小紅書毛文超找到郄小虎進(jìn)行推薦升級(jí),頭條產(chǎn)品的創(chuàng)始人黃河出來(lái)和李金波做了最右App,陳睿開(kāi)始用推薦武裝B站從二次元社區(qū)變成YouTube。
在這篇文章發(fā)布前,王守崑老師在電話中跟雷峰網(wǎng)說(shuō),建議技術(shù)創(chuàng)業(yè)者和媒體應(yīng)該多關(guān)注下怎樣將推薦技術(shù)與隱私保護(hù)結(jié)合,甚至提到了一個(gè)前沿概念“數(shù)據(jù)稅”,即哪家廠商要用用戶數(shù)據(jù),就要額外付出成本。他自己目前也在和很多學(xué)者研究這些問(wèn)題。
在很多推薦大神看來(lái),推薦引擎的發(fā)展至今仍屬早期,必然要經(jīng)歷暴露問(wèn)題的階段,從業(yè)者們只有從倫理規(guī)范角度做好管理,只有不斷探索如何保護(hù)好用戶隱私,才是推薦引擎技術(shù)長(zhǎng)久發(fā)展之道。
自1994年中國(guó)接入互聯(lián)網(wǎng),到2009年之前的十余年里,中國(guó)互聯(lián)網(wǎng)人最成功的創(chuàng)業(yè)模式幾乎只有一種,那就是將國(guó)外(主要是美國(guó))的互聯(lián)網(wǎng)產(chǎn)品搬到國(guó)內(nèi),百度之于谷歌,阿里巴巴之于亞馬遜,騰訊QQ之于ICQ,新浪微博之于推特,優(yōu)酷之于YouTube,人人網(wǎng)之于Facebook,無(wú)不是如此。
但這并不是因?yàn)橹袊?guó)互聯(lián)網(wǎng)人缺乏創(chuàng)新力,而是我們開(kāi)眼看世界之時(shí),人家已經(jīng)有了幾十年的發(fā)展經(jīng)歷,無(wú)論基礎(chǔ)設(shè)施,還是用戶認(rèn)知,國(guó)際互聯(lián)網(wǎng)生態(tài)都更加先進(jìn)。
摸著美國(guó)過(guò)河,是那個(gè)時(shí)期中國(guó)草莽創(chuàng)業(yè)者肉眼可見(jiàn)的最佳路徑,互聯(lián)網(wǎng)行業(yè)也同樣如此。
但是,學(xué)人者生,似人者死,中國(guó)互聯(lián)網(wǎng)如果一直亦步亦趨,那永遠(yuǎn)都不會(huì)有出頭之日,也只能被嘲笑是躲在防火墻后面的抄襲者。
中國(guó)互聯(lián)網(wǎng)人必須得有自己的殺手锏,這把锏可以繼承自師父,但必得經(jīng)過(guò)數(shù)代人才的精心打磨,才能成為與殘酷世界競(jìng)爭(zhēng)的絕招。
現(xiàn)在看來(lái),這殺手锏的名字就是推薦引擎,今天的中國(guó)互聯(lián)網(wǎng)已經(jīng)進(jìn)入了推薦引擎大時(shí)代。
如果有一天,中國(guó)互聯(lián)網(wǎng)真正追上乃至超越世界互聯(lián)網(wǎng),人們不應(yīng)該忘記這件事是從哪些人開(kāi)始的。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。