丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給楊文
發(fā)送

0

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

本文作者: 楊文 2017-12-28 21:48
導(dǎo)語:分享總結(jié)

雷鋒網(wǎng)AI科技評論按:隨著諸如 Twitter、Facebook、新浪微博等社交平臺的興起,每天有成千上萬的消息在這些平臺上產(chǎn)生并傳播。在如此大體量的消息中,如何能提前預(yù)測某條消息在未來的關(guān)注轉(zhuǎn)發(fā)量(流行度),對于用戶和平臺而言都具有很大的意義。因此,本文將為大家介紹目前的網(wǎng)絡(luò)信息流行度預(yù)測研究進(jìn)展,以及中科院博士生曹婍提出的基于深度學(xué)習(xí)技術(shù)的端到端流行度預(yù)測框架(DeepHawkes 模型)。該工作已被國際會議 CIKM 2017 錄用并發(fā)表。

曹婍,目前就讀于中國科學(xué)院計算技術(shù)研究所的網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,碩博生。碩士導(dǎo)師為沈華偉研究員,博士導(dǎo)師為李國杰院士。本科畢業(yè)于中國人民大學(xué)信息學(xué)院。目前主要研究方向?yàn)樯缃痪W(wǎng)絡(luò)上的信息傳播建模及預(yù)測。

分享題目:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究

分享視頻鏈接地址:http://www.mooc.ai/open/course/356

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

分享內(nèi)容

  • 社交網(wǎng)絡(luò)上消息流行度預(yù)測問題的背景簡介

  • 現(xiàn)有消息流行度預(yù)測的方法以及存在的問題

  • 介紹本人最新提出的基于深度學(xué)習(xí)技術(shù)的端到端流行度預(yù)測框架(DeepHawkes 模型)

  • 對于流行度預(yù)測問題的一些思考以及心得體會

相關(guān)背景

現(xiàn)有的社交平臺的興起,為我們信息的產(chǎn)生和轉(zhuǎn)播帶來了極大的便利。光新浪微博每天至少有一千萬條微博產(chǎn)生,但并不是所有信息都能獲得同樣的關(guān)注度。在社交網(wǎng)絡(luò)上,消息之間的關(guān)注度也是很不均勻的,大致也遵從二八法則。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

信息在社交網(wǎng)絡(luò)上的傳播有什么特性?

不同于傳統(tǒng)的信息傳播平臺,像電視,報紙,更像是一對多的廣播平臺,也就是有一個源發(fā)者。而在微博等社交網(wǎng)絡(luò)上存在一個關(guān)注關(guān)系和轉(zhuǎn)發(fā)關(guān)系,所以在信息的傳播上過程中,會產(chǎn)生一個級聯(lián)現(xiàn)象。

這種現(xiàn)象在社交網(wǎng)絡(luò)上是獨(dú)有的,同時也給社交網(wǎng)絡(luò)上的信息傳播預(yù)測帶來很大的困難。中間任何一個人的參與轉(zhuǎn)發(fā),最終都可能導(dǎo)致信息在最后的流行度有很大的變化。比如有一個大V轉(zhuǎn)發(fā),信息傳播可能就會有一個爆發(fā)式的增長。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

如何形式化定義這個問題?

第一種是把它當(dāng)做分類問題,也就是預(yù)測消息在未來的流行度是否達(dá)到一個特定的預(yù)值,或者呈現(xiàn)一個翻倍的情況。第二種是把它當(dāng)做回歸問題,也就是說預(yù)測消息在未來具體流行度的量級。相對來說,第二個回歸問題較難。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

把它當(dāng)做一個回歸問題后,如何定義這個問題?

首先給定一個觀測時間后,我們能夠觀測到消息在觀測時間內(nèi)的轉(zhuǎn)發(fā)情況。要預(yù)測的目標(biāo)就是在觀測時間窗口到最終預(yù)測時間窗口之間的流行度的增長量。

為了能更好體現(xiàn)預(yù)測的難度,我們把已知的觀測時間窗口內(nèi)的流行度直接去掉,直接來預(yù)測觀測時間到預(yù)測時間中間的增量流行度情況。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

現(xiàn)有的研究方法都有哪些?

現(xiàn)有方法可分為兩類。第一類是基于特征的方法,第二類是基于生成式過程的方式。

第一類是站在非常傳統(tǒng)經(jīng)典的機(jī)器學(xué)習(xí)角度來做的,大家的主要貢獻(xiàn)點(diǎn)在于特征的提取上?,F(xiàn)有的方法主要提取以下這四類特征:

  • 消息內(nèi)容特征

  • 原發(fā)者或轉(zhuǎn)發(fā)者相關(guān)特征

  • 傳播結(jié)構(gòu)特征

  • 時序特征

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

以內(nèi)容特征為例,在提取內(nèi)容特征的時候,包括會提取文字里面是否包含特定特征,還有整篇文字情感的正負(fù)向比例。這些都屬于消息的內(nèi)容特征。

用戶的特征,包括原發(fā)用戶和轉(zhuǎn)發(fā)用戶特征,原發(fā)用戶特征提取包括年齡,性別,注冊時間,活躍度以及他的粉絲數(shù)等等。轉(zhuǎn)發(fā)用戶的特征提取和原發(fā)用戶類似。

結(jié)構(gòu)特征包括兩個,第一個是在原始的社交網(wǎng)絡(luò)上形成的結(jié)構(gòu),第二個是在某條特定消息傳播過程中所形成的傳播圖結(jié)構(gòu)。會提取圖的連通性,廣度,深度,以及初度,入度等等。

時序特征,主要是指在傳播過程中,傳播速率有什么變化。

這樣一類通過特征提取,然后利用機(jī)器學(xué)習(xí)方式來進(jìn)行流行度預(yù)測建模的方法是比較傳統(tǒng)和比較寬泛的。但我們可以看到在這過程中,并沒有對信息傳播的深入動態(tài)過程進(jìn)行理解。而只是通過提取各種各樣特征盡可能擬合這樣一個結(jié)果。它是直接受未來流行度預(yù)測監(jiān)督指導(dǎo)的,一般這樣的模型預(yù)測比較好,但對于我們理解信息傳播過程是有缺陷的,因?yàn)闆]有對傳播過程進(jìn)行建模。

第二類生成式方法,是在原有的特征提取基礎(chǔ)之上,能夠建模信息傳播動態(tài)過程,能夠探尋信息在傳播過程中的一些機(jī)制,把這些機(jī)制建模好。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

自增強(qiáng)泊松過程

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

Hawkes過程,每一次的轉(zhuǎn)發(fā)都會對未來消息帶來新的激勵

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

生成式方法中,它是為每一條消息單獨(dú)建模訓(xùn)練的,它會對觀測時間窗口內(nèi)的每一個事件進(jìn)行觀測,建模的時候,是通過使觀測時間內(nèi)的事件發(fā)生概率最大化來學(xué)習(xí)得到參數(shù)的。它一方面有非常好的可理解性,但同時由于監(jiān)督的數(shù)據(jù)是觀測時間窗口內(nèi)的每個事件的發(fā)生,而不是未來要預(yù)測的增量流行度。預(yù)測的性能是有缺失的。

因此促使我們希望能夠設(shè)計一個模型,在受未來流行度監(jiān)督之下,怎樣把生成式過程中關(guān)鍵機(jī)制和因子刻畫到,這樣就能即具有比較好的預(yù)測性能,同時也對消息的傳播過程有一個較好的理解能力。我們提出了DeepHawkes模型。

DeepHawkes 整體運(yùn)行框架

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

實(shí)驗(yàn)數(shù)據(jù)來源及場景

以下分別是微博場景下預(yù)測一條消息在未來的轉(zhuǎn)發(fā)度和在論文場景下預(yù)測未來論文引用量。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

總結(jié):我們提出DeepHawkes模型,在端到端直接通過未來流行度監(jiān)督的深度學(xué)習(xí)框架之下,刻畫了已有的Hawkes模型當(dāng)中的信息傳播過程中比較關(guān)鍵的因子或機(jī)制。同時,我們對這三個機(jī)制也進(jìn)行了一定的改進(jìn)和擴(kuò)展,包括用用戶學(xué)到的embeding來替代原先啟發(fā)式的用戶粉絲數(shù),以及建模了整個轉(zhuǎn)發(fā)路徑的影響,而不僅僅是當(dāng)前的轉(zhuǎn)發(fā)用戶。還有,我們使用了非參方式來靈活刻畫學(xué)習(xí)特征和學(xué)習(xí)時間的衰減效應(yīng)。

感興趣的同學(xué)可以在ACM的論文庫里下載這篇論文。論文題目:DeepHawkes:Bridging the Gap between Prediction and Understanding of Information Cascade

雷鋒網(wǎng)提醒大家,如果您對DeepHawkes模型的細(xì)節(jié)感興趣,可以觀看GAIR大講堂回放視頻。

視頻鏈接地址:http://www.mooc.ai/open/course/356

雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

中科院曹婍:基于深度學(xué)習(xí)的社交網(wǎng)絡(luò)流行度預(yù)測研究 | 分享總結(jié)

分享:
相關(guān)文章

編輯&記者

AI科技評論員,微信:yeohandwin
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說