丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
AI+ 正文
發(fā)私信給溫曉樺
發(fā)送

1

今日頭條的引擎是怎么樣工作的?

本文作者: 溫曉樺 2017-02-23 23:34
導(dǎo)語(yǔ):今日頭條是如何做到,向每個(gè)讀者推送不一樣的、據(jù)稱(chēng)是符合讀者每個(gè)人不同興趣的內(nèi)容的呢?

把媒體內(nèi)容分發(fā)給用戶(hù),“你關(guān)心的才是頭條”,對(duì)于今日頭條這個(gè)產(chǎn)品,相信大家都不陌生。那么,你是否好奇過(guò),今日頭條是如何做到,向每個(gè)讀者推送不一樣的、據(jù)稱(chēng)是符合讀者每個(gè)人不同興趣的內(nèi)容的呢?今日頭條算數(shù)中心執(zhí)行總監(jiān)劉志毅在日前于深圳北京大學(xué)匯豐商學(xué)院舉行的“數(shù)據(jù)之美”論壇上做了介紹。

首先,數(shù)據(jù)從哪里來(lái)?

雖然對(duì)于頭條來(lái)講,其用戶(hù)量、用戶(hù)的粘性時(shí)間已經(jīng)足夠大了,但是,要怎么樣精細(xì),怎么樣的數(shù)據(jù)才是可信賴(lài)的,怎么樣的數(shù)據(jù)是可復(fù)用的?

對(duì)于數(shù)據(jù)所產(chǎn)生和獲取的流程,今日頭條算數(shù)中心執(zhí)行總監(jiān)劉志毅拋出一道小問(wèn)題來(lái)介紹:

現(xiàn)在面前有很多顆糖果,然后有兩個(gè)人要把這個(gè)糖果的數(shù)量數(shù)清楚,有一個(gè)人他會(huì)加減乘除地來(lái)數(shù),3顆3顆數(shù),5顆5顆地;還有一個(gè)人就很笨,只會(huì)一顆一顆,永遠(yuǎn)一顆一顆地?cái)?shù),那問(wèn)一下,是哪一個(gè)人能夠先把這一大堆糖果數(shù)清楚啊?

事實(shí)上,按正常的邏輯確實(shí)應(yīng)該回答“第一個(gè)”的,“但是在互聯(lián)網(wǎng)公司,答案是第二個(gè),因?yàn)殡m然是一顆一顆地?cái)?shù),但他一秒種可以數(shù)一萬(wàn)個(gè),所以他更直接更快速?!边@是機(jī)器學(xué)習(xí)發(fā)展到今天的成果,機(jī)器分發(fā)的效率一定大于人工分發(fā)。在2016年的年終,易觀發(fā)布的第三方數(shù)據(jù)顯示,如今機(jī)器分發(fā)的比例已經(jīng)超過(guò)了人工分發(fā)。

今日頭條的引擎是怎么樣工作的?

分發(fā)糖果與分發(fā)內(nèi)容邏輯是一樣的。那么,這背后,頭條具體的引擎是怎么樣工作的?這時(shí)候需要把文章和用戶(hù)兩端的數(shù)據(jù)連接起來(lái)。

據(jù)劉志毅解釋?zhuān)?/p>

首先文章進(jìn)入機(jī)器引擎后,頭條需要機(jī)器識(shí)別它們的關(guān)鍵詞,識(shí)別其涉及到的內(nèi)容領(lǐng)域,用戶(hù)對(duì)它們的反應(yīng),然后把結(jié)果放到一個(gè)特征向量空間中。



與此同時(shí),用戶(hù)端也發(fā)生了同樣的變化。

“然后我們?nèi)タ催@兩個(gè)向量,怎么樣匹配度最高,然后就推送給他。”

具體來(lái)說(shuō),這些用以匹配的數(shù)據(jù)變量可能包括幾個(gè)大方面的特征:

首先,這個(gè)用戶(hù),他的性別興趣,年齡地域用的手機(jī)是什么?

家鄉(xiāng)是哪里?關(guān)注什么東西?會(huì)點(diǎn)什么樣的廣告?

然后他目前處在什么樣的環(huán)境?今天有沒(méi)有下雨?用WiFi還是用3G,4G,2G?

這個(gè)文章本身是一分鐘之內(nèi)的快消息,還是幾年之內(nèi)看都不算失效的消息?用戶(hù)的反饋對(duì)他們是什么樣?

這個(gè)文章有什么樣的關(guān)鍵詞……等等

這些數(shù)據(jù)將產(chǎn)生一個(gè)百億級(jí)別的特征,今日頭條最終根據(jù)特征判斷用戶(hù)的需求,把內(nèi)容呈現(xiàn)到每一個(gè)人不同的手機(jī)屏幕上。

今日頭條的引擎是怎么樣工作的?

但是,這還不是最技術(shù)范的地方。數(shù)據(jù)部門(mén)真正做的事情是,“從剛剛所描述的這個(gè)過(guò)程中積累出來(lái)一些東西,然后讓他去發(fā)揮價(jià)值,”劉志毅說(shuō)道,這才是數(shù)據(jù)挖掘的價(jià)值所在。

這只是我所想要表達(dá)的數(shù)據(jù)維度的1%,”

用戶(hù)點(diǎn)擊什么文章?沒(méi)有點(diǎn)擊什么文章?

點(diǎn)贊還是點(diǎn)踩?

閱讀速度快不快?完成多少比例?

對(duì)某一個(gè)話題產(chǎn)生了持續(xù)性的還是短暫的影響?讀完之后有沒(méi)有講到什么評(píng)論?

那他用的是什么樣的手機(jī)在讀你的東西?是什么樣的手機(jī)的什么型號(hào)?去年用這個(gè)型號(hào),今年是不是還用這個(gè)型號(hào)?

……

劉志毅稱(chēng),“這樣的信息都會(huì)作為這個(gè)用戶(hù)的組合特征的一部分,然后我們?nèi)ヌ崛∵@一部分來(lái)把它作為數(shù)據(jù)的樣本進(jìn)行分析?!?/span>

數(shù)據(jù)到哪里去?

知道了數(shù)據(jù)怎么來(lái)之后,數(shù)據(jù)要到哪里去,產(chǎn)生怎樣的價(jià)值?這又是一場(chǎng)好戲了。

據(jù)雷鋒網(wǎng)了解,今日頭條曾推出了“今日頭條媒體實(shí)驗(yàn)室”,這個(gè)實(shí)驗(yàn)室的作用,相當(dāng)于差異化內(nèi)容創(chuàng)作的“參謀”。就是說(shuō),其將通過(guò)每一篇文章的傳播數(shù)據(jù)去告訴不同的內(nèi)容的寫(xiě)作者創(chuàng)作者,假如想要影響某一個(gè)特定的人群,需要怎么樣創(chuàng)作內(nèi)容,并且在什么樣的平臺(tái)上,以什么樣的方式在什么樣的時(shí)間點(diǎn)發(fā)布是效率最大化的。

劉志毅舉了這樣一個(gè)例子:以美國(guó)總統(tǒng)選舉為例,在中國(guó)希拉里一直熱度是領(lǐng)先,但是跟美國(guó)人投票不一樣。最后希拉里敗選,但是她敗選之后,在頭條平臺(tái)上面的熱度也降得非???,這個(gè)可能跟中國(guó)人對(duì)美國(guó)時(shí)政事件的關(guān)心規(guī)律有關(guān)系,那么,媒體則會(huì)依據(jù)這個(gè)來(lái)進(jìn)行內(nèi)容創(chuàng)作。

另外一個(gè)是,數(shù)據(jù)也許可以呈現(xiàn)出人類(lèi)作者意想不到的角度:在今日頭條與南方周末的合作中,大家都關(guān)心學(xué)區(qū)房房?jī)r(jià)的問(wèn)題,但數(shù)據(jù)顯示——在這些事實(shí)之外,跟學(xué)區(qū)房同時(shí)出現(xiàn)的概率最高的詞中間,“離婚”排在前3位。

這就是計(jì)算機(jī)輔助報(bào)道的一種方式,也是大數(shù)據(jù)、AI帶給傳統(tǒng)行業(yè)的變革。

AI帶給商業(yè)市場(chǎng)更多機(jī)會(huì)

除了反哺媒體創(chuàng)作,閱讀數(shù)據(jù)還有哪些想象力呢?

透視市場(chǎng)潛力

雷鋒網(wǎng)此前報(bào)道,在一些數(shù)據(jù)密集型的產(chǎn)業(yè),都成為了AI產(chǎn)業(yè)應(yīng)用孵化的首選之地。接下來(lái)看了OPPO和vivo的案例,你就不會(huì)奇怪了。

眾所周知,去年,手機(jī)市場(chǎng)一個(gè)關(guān)注度頗高的話題是:大家發(fā)現(xiàn)主流手機(jī)品牌不那么景氣了,包括蘋(píng)果,但是有兩家廠商非常受關(guān)注——OPPO和Vivo。

“OPPO跟Vivo做了一件很有意思的事情,他們?cè)?45線城市的用戶(hù)很多,但是他們請(qǐng)了很多跟一二線城市的口味更匹配的代言人來(lái)作為宣傳他們品牌的代言人。這是他們根據(jù)通過(guò)閱讀數(shù)據(jù)產(chǎn)生的決定。他們充分把握住了345線城市對(duì)于手機(jī)的需求。”

雷鋒網(wǎng)了解到,根據(jù)頭條閱讀的數(shù)據(jù)發(fā)現(xiàn),345線城市對(duì)于手機(jī)的具體參數(shù)、性?xún)r(jià)比方面表現(xiàn)得不那么敏感,但對(duì)于手機(jī)的體驗(yàn)的介紹,卻是閱讀量遠(yuǎn)高于一二線城市的?!八援?dāng)OPPO沒(méi)有把大部分的推廣和宣傳經(jīng)費(fèi)放到線下的渠道去影響345線城市的時(shí)候,他后面的成功,也是在閱讀數(shù)據(jù)上能夠發(fā)現(xiàn)的奇妙的地方?!?/span>

總的來(lái)說(shuō),劉志毅表示,AI之所以影響人類(lèi)各行各業(yè),是因?yàn)?,?span style="line-height: 1.8;">閱讀其實(shí)是一種人們對(duì)于自我歸類(lèi)的一種方式,所以頭條上面閱讀數(shù)據(jù)其實(shí)是人在不同的組別中間自我歸類(lèi)的一些信息,這些規(guī)律的信息產(chǎn)生了我剛才所說(shuō)到的所有的價(jià)值?!?/span>

封面圖來(lái)自網(wǎng)絡(luò)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)