丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給叢末
發(fā)送

0

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

本文作者: 叢末 2019-08-31 19:08 專題:IJCAI 2019
導(dǎo)語(yǔ):3 個(gè)真實(shí)數(shù)據(jù)集、3類對(duì)比推薦算法、4 種評(píng)價(jià)指標(biāo)上的對(duì)比實(shí)驗(yàn),驗(yàn)證了該算法的可靠性和魯棒性。

本文是阿里巴巴集團(tuán)機(jī)器智能技術(shù)和優(yōu)酷人工智能平臺(tái)合作的論文《Hybrid Item-Item Recommendation via Semi-Parametric Embedding》的解讀,該論文發(fā)表在 IJCAI 2019,本文提出結(jié)合商品行為 & 內(nèi)容信息的半?yún)⒈硎舅惴?SPE, 旨在結(jié)合 collaborative filtering based 和 content-based 算法,以更好地緩解 I2I 推薦的冷啟動(dòng)問(wèn)題。

1 研究動(dòng)機(jī)

由于常見(jiàn)電商、視頻等推薦系統(tǒng) (淘寶首猜、優(yōu)酷推薦等) 用戶量巨大, 而且用戶個(gè)性化興趣差異明顯, Item-CF 較于 User-CF 有著天然的巨大優(yōu)勢(shì),它因此被廣泛運(yùn)用于推薦系統(tǒng)中. 常見(jiàn)的 Item-CF 推薦系統(tǒng)中, 服務(wù)器收到用戶訪問(wèn)請(qǐng)求, 經(jīng)解析、查詢得到用戶 profile(包括用戶長(zhǎng)期畫(huà)像、歷史足跡等) 后,通過(guò) Item2Item、tag 等方式進(jìn)行候選召回,參與后續(xù)排序和后處理。其中 Item2Item(I2I) 是至關(guān)重要的一環(huán)。

I2I 解決的是針對(duì)給定商品 (trigger item),推薦一系列相關(guān)商品 (rec_items) 的問(wèn)題。一方面 I2I 是 feeds 瀑布流等用戶推薦場(chǎng)景的基礎(chǔ), 另一方面,「為你推薦」、「猜你喜歡」等場(chǎng)景天然就是 I2I 的問(wèn)題. I2I 在推薦系統(tǒng)中的作用至關(guān)重要。


IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

Behavior-based 的 I2I 矩陣計(jì)算通?;谏唐分g以往的共同行為 (例如商品被同一個(gè)用戶瀏覽點(diǎn)擊過(guò)), 它在行為充分的商品上通常有較好的推薦效果。然而對(duì)很多新品較多的場(chǎng)景和應(yīng)用上,例如優(yōu)酷新視頻發(fā)現(xiàn)場(chǎng)景和閑魚(yú)這種二手電商社區(qū),由于沒(méi)有歷史行為累計(jì),商品的冷啟動(dòng)問(wèn)題異常嚴(yán)重,behavior-based 算法在這些商品上的效果較差。

冷啟動(dòng)一直以來(lái)都是推薦系統(tǒng)重要的挑戰(zhàn)之一, 常見(jiàn)的 content-based 方法是引入商品的內(nèi)容信息,利用商品之間的文本、描述、類目等內(nèi)容信息進(jìn)行 I2I 相似度矩陣的計(jì)算。然而 content-based 方法涉及到商品的特征工程和相似性度量的選擇,需要有相應(yīng)的領(lǐng)域知識(shí),另外由于非專業(yè)賣(mài)家、內(nèi)容作者的積極性和專業(yè)能力不夠,商品的特征信息也不夠豐富甚至有誤,content-based 方法的效果差強(qiáng)人意。

因此,本文提出結(jié)合商品行為 & 內(nèi)容信息的半?yún)⒈硎舅惴?SPE (Semi-Parametric Embedding), 以緩解 I2I 推薦中的冷啟動(dòng)問(wèn)題。

2 方法

2.1半?yún)⑾蛄勘硎?SPE)

與CF-based的矩陣分解算法中使用行為信息建模商品向量的做法不同, 本文同時(shí)使用行為和內(nèi)容信息來(lái)建模商品表示, 也即

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

其中, v 為商品的向量表示; z 為商品的行為信息表示部分, 每個(gè)商品的行為表示各自不同; e 為內(nèi)容信息表示部分, 通過(guò)特征輸入IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題得到, c 為商品的內(nèi)容輸入向量(商品的文本、描述、類目等); 2δ 為兩者之間的權(quán)重大小, 由當(dāng)前item上的歷史統(tǒng)計(jì)信息(商品曝光、點(diǎn)擊次數(shù)等)決定。若當(dāng)前item行為豐富, δ較大, 最終的向量由z主導(dǎo); 而新品 item 行為信息少, δ 較小,模型對(duì)行為信息的權(quán)重加大。

行為向量 z 和內(nèi)容向量 e 分別為模型中非參數(shù)化向量和參數(shù)化向量, 結(jié)合兩者,作者將其稱作半?yún)⑾蛄勘硎尽?/p>

2.2 SPE 用于I2I 推薦

本文將半?yún)⑾蛄勘硎緫?yīng)用于 I2I 推薦中, 基于商品的向量表示, 定義相似性度量為

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

則可以通過(guò)最小化如下目標(biāo)函數(shù)求解

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

其中, g 為非線性激活函數(shù)的多層感知機(jī), 后兩項(xiàng)為正則化子。

2.3 多層降噪自動(dòng)編碼機(jī)

由于非專業(yè)賣(mài)家、非專業(yè) UPGC 作者的積極性和專業(yè)能力不夠, item 的內(nèi)容特征信息不夠豐富甚至缺失、錯(cuò)誤。本文針對(duì)參數(shù)化向量表示,引入了深度學(xué)習(xí)中的多層降噪自動(dòng)編碼機(jī)(stacked denoise autoencoder, sDAE), 以學(xué)習(xí)更魯邦的內(nèi)容向量表示。則目標(biāo)函數(shù)更新為:

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

其中IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題為內(nèi)容特征的重構(gòu)損失。

3 實(shí)驗(yàn)

在實(shí)驗(yàn)部分,論文中共選取了2個(gè) benchmark 和阿里二手交易平臺(tái)的真實(shí)數(shù)據(jù)集,分別將半?yún)⑾蛄勘硎究蚣芘c cf-based, content-based, hybrid 方法進(jìn)行了比較, 選取的指標(biāo)為 in-matrix(item 在訓(xùn)練集中出現(xiàn)過(guò))和 out-of-matrix(item在訓(xùn)練集中未出現(xiàn)過(guò))數(shù)據(jù)集上的HitRatio@10 和 NDCG@10。詳細(xì)結(jié)果如下, IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

此外,實(shí)驗(yàn)中對(duì) SPE 和SPE-sDAE的魯棒性進(jìn)行了對(duì)比, 論文通過(guò)對(duì)Amazon數(shù)據(jù)集中的內(nèi)容特征進(jìn)行隨機(jī)擾動(dòng)(非零值以corrupt-ratio的概率進(jìn)行置零)得到不同版本的噪音數(shù)據(jù)集,

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

由圖可見(jiàn),隨著擾動(dòng)比率的增大,兩者的指標(biāo)都在下跌,但是SPE-sDAE比SPE更魯邦,特別是在out-of-matrix的數(shù)據(jù)集上的優(yōu)勢(shì)更明顯。

4 總結(jié)

本文提出了一種半?yún)⒈硎究蚣埽?它結(jié)合商品的行為信息和內(nèi)容信息,以達(dá)到在維持行為豐富 item 上表現(xiàn)的同時(shí),緩解新發(fā)商品上的冷啟動(dòng)問(wèn)題。另外本文引入 sDAE 來(lái)幫助學(xué)習(xí)更強(qiáng)力的內(nèi)容表示,以達(dá)到更魯邦的效果。3 個(gè)真實(shí)數(shù)據(jù)集、3類對(duì)比推薦算法、4 種評(píng)價(jià)指標(biāo)上的對(duì)比實(shí)驗(yàn),驗(yàn)證了該算法的可靠性和魯棒性。

相關(guān)文獻(xiàn)參考:

[1]BadrulSarwar, GeorgeKarypis, Joseph Konstan, and John Riedl. Item-based collaborative filtering recommendation algorithms. In Proceedings of the 10th International Conference on World Wide Web, pages 285–295, 2001

[2] Yehuda Koren, Robert Bell, and Chris Volinsky. Matrix factorization techniques for recommender systems. Computer, 42(8), 2009

[3] Yue Shi, Martha Larson, and Alan Hanjalic. Collaborative filtering beyond the user-item matrix: A survey of the state of the art and future challenges. ACM Computing Surveys, 47(1):3, 2014

[4] Hao Wang, Naiyan Wang, and DitYan Yeung. Collaborative deep learning for recommender systems. In Proceedings of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 1235–1244, 2015  雷鋒網(wǎng) 雷鋒網(wǎng)

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

IJCAI 2019 丨利用半?yún)⒈硎舅惴ň徑馔扑]系統(tǒng)中的冷啟動(dòng)問(wèn)題

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)