0
本文作者: 楊曉凡 | 2017-08-16 10:24 |
雷鋒網(wǎng) AI 科技評論按:2017年8月13-17日,第23屆國際知識發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(KDD)在加拿大哈利法克斯召開。KDD的英文全稱是Knowledge Discovery and Data Mining,即知識發(fā)現(xiàn)與數(shù)據(jù)挖掘,由美國計算機(jī)協(xié)會ACM下的數(shù)據(jù)挖掘分會舉辦,是國際數(shù)據(jù)挖掘領(lǐng)域的頂級會議。 KDD 2017共吸引全世界1144篇論文投遞,收錄216篇,包括清華、中科院、阿里在內(nèi)的中國大陸學(xué)術(shù)界和工業(yè)界共被收錄25篇。
在 KDD 2017全球論文投稿中,阿里集團(tuán)和螞蟻金服共有5篇論文被大會收錄,本次被收錄論文涵蓋深度學(xué)習(xí)、大規(guī)模圖計算、商品智能排序等多個研究領(lǐng)域,基于真實的業(yè)務(wù)場景或數(shù)據(jù)樣本,文中部分方法結(jié)論已經(jīng)在業(yè)務(wù)中運(yùn)用。如深度學(xué)習(xí)語義建模研究中提出了一種新的文本語義編碼算法conv-RNN,該模型在參考了較為常用的文本語義編碼模型循環(huán)神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的同時,進(jìn)行了進(jìn)一步的文本語義編碼優(yōu)化,實現(xiàn)更為精準(zhǔn)的文本分類和問答匹配并已應(yīng)用于阿里智能音響“天貓精靈”。
如下是來自阿里的KDD 2017 收錄論文「Optimized Cost per Click in Taobao Display Advertising」(「淘寶展示廣告中的OCPC智能調(diào)價算法」)的解讀文章,文章作者為朱晗,靳駿奇,李晗。
該論文圍繞OCPC智能調(diào)價,創(chuàng)新地提出了一種雙層優(yōu)化形式,將優(yōu)化廣告主價值轉(zhuǎn)化為首要約束條件,將系統(tǒng)根據(jù)預(yù)估收益對廣告進(jìn)行排序作為內(nèi)層優(yōu)化問題,將用戶體驗和平臺收益的最大化作為外層的尋優(yōu)問題,并提出了相應(yīng)的求解方法。最終達(dá)到不僅廣告主效果優(yōu)化,平臺商業(yè)收入和用戶指標(biāo)也獲得優(yōu)化的三位一體目標(biāo)。
基于固定出價的傳統(tǒng)廣告系統(tǒng)中,廣告主對特定用戶人群和廣告位設(shè)定固定的競價,其本質(zhì)是粗粒度的流量區(qū)分和匹配。事實上,廣告主有著進(jìn)一步細(xì)粒度的競價和流量質(zhì)量匹配的訴求。該系統(tǒng)還有著兩方面的缺陷。其一,廣告主單一固定的出價應(yīng)對連續(xù)多變的流量模式導(dǎo)致經(jīng)濟(jì)效率低下;其二,傳統(tǒng)的最大化廣告收益(eCPM)的排序機(jī)制過于追求短期商業(yè)利益,無法調(diào)控流量對用戶體驗、商家利益、成交額等指標(biāo)的影響,不利于淘寶生態(tài)的長期可持續(xù)繁榮。
曾被《經(jīng)濟(jì)學(xué)人》稱為“中國最大在線市場”的淘寶擁有世界先進(jìn)水平的在線廣告系統(tǒng)。該論文的研究聚焦于重要的淘寶移動端CPC展示廣告中的競價優(yōu)化問題。由于淘寶CPC展示廣告處于相對重要的場景,其廣告投放的優(yōu)化通常需考慮諸多因素,如反應(yīng)商家利益的投資回報率(ROI)、總成交額(GMV)、轉(zhuǎn)化率(CVR),反應(yīng)平臺用戶體驗的點擊率(CTR),以及淘寶平臺收益指標(biāo)(千次展現(xiàn)收益RPM)等。
值得一提的是,谷歌公司AdWords的ECPC也嘗試根據(jù)用戶潛在轉(zhuǎn)化率調(diào)整廣告主競價。然而,除了轉(zhuǎn)化率,ECPC無法直接優(yōu)化其它諸多對淘寶生態(tài)重要的指標(biāo)(如平臺整體GMV等)。
論文設(shè)想通過算法對于每條用戶請求,在保障優(yōu)化廣告主利益的前提下,自動地調(diào)整廣告主競價從而使競價能夠反應(yīng)該流量的真實價值。流量價值的定義上,算法融合了用戶體驗、廣告主收益以及平臺收益的整體生態(tài)指標(biāo),旨在實現(xiàn)三方共贏的商業(yè)局面?;诖?,論文提出了一種新的Optimized cost per click (OCPC)智能調(diào)價算法。
OCPC智能調(diào)價算法從數(shù)學(xué)上描述并分析了優(yōu)化廣告主訴求的條件,進(jìn)而提出了一種優(yōu)化平臺生態(tài)綜合指標(biāo)以及平臺收益的算法。事實上,該算法框架適用于多種廣告主訴求以及平臺生態(tài)指標(biāo)的優(yōu)化問題,例如用戶的瀏覽量、點擊量、轉(zhuǎn)化率等。
論文選擇了ROI以及流量質(zhì)量作為廣告主的優(yōu)化訴求,選擇GMV作為平臺生態(tài)指標(biāo),并通過調(diào)整廣告主出價優(yōu)化平臺的商業(yè)收益。
ROI(投資回報率)優(yōu)化算法
智能調(diào)價算法分析了優(yōu)化廣告主投資回報率的條件,即ROI約束。其中,定義交易轉(zhuǎn)化為c,用戶為u,廣告位a,那么在用戶和廣告的條件下產(chǎn)生轉(zhuǎn)化的條件概率為p(c|u, a)。對于一個特定的廣告計劃a,定義va為預(yù)估的筆單價。因此,單次點擊的期望GMV為。進(jìn)一步定義廣告主為每一次點擊付費(fèi)為ba,那么單次點擊的期望ROI則為公式(1):
(1)
即單次點擊的期望投資匯報率為期望GMV除以單次點擊價格。進(jìn)而,廣告a對于不同用戶和點擊的ROI如公式(2),即平均轉(zhuǎn)化率乘以比單價除以單次點擊價格,其中na是某個用戶在一段時間內(nèi)的點擊量。
(2)
公式(2)說明了ROI和一段時間內(nèi)平均轉(zhuǎn)化率p(c|u, a)之間的線性關(guān)系,因此,只需要調(diào)價幅度小于當(dāng)前流量轉(zhuǎn)化率和歷史平均流量轉(zhuǎn)化率的比值,就能從理論上保證ROI不會下降,如公式(3)所示:
(3)
從而,該算法競價優(yōu)化的原則是:對于轉(zhuǎn)化率升高的流量,提升其競價來幫助廣告主競得優(yōu)質(zhì)流量;對于轉(zhuǎn)化率下降的流量,降低競價從而節(jié)約在劣質(zhì)流量上的成本。出于調(diào)價的安全考慮,該算法設(shè)定了固定的調(diào)價范圍參數(shù),保證廣告主的調(diào)價不過高或者過低,并以此得出調(diào)價的上界和下界
如公式(4)。
(4)
綜合指標(biāo)優(yōu)化算法
在給定上下界的范圍內(nèi)優(yōu)化出價可以幫助廣告主獲得更高質(zhì)量的流量以及更高的ROI。但是,約束空間內(nèi)解的不同出價會導(dǎo)致不同的eCPM排序,并最終影響平臺收益和其它指標(biāo)的效果。因此,該算法提出了一種在eCPM排序機(jī)制下,對綜合指標(biāo)保優(yōu)的出價調(diào)整算法。其核心解決的優(yōu)化問題如公式(5)。
(5)
其中n是候選廣告的數(shù)量,pctr是預(yù)估點擊率(由阿里媽媽精準(zhǔn)技術(shù)團(tuán)隊自主研發(fā)的混合邏輯回歸算法MLR支持,可以參見雷鋒網(wǎng) AI 科技評論此前報道)。f()函數(shù)定義了系統(tǒng)期望最大化的綜合指標(biāo),典型的兩個例子如公式(6),其中,第一個目標(biāo)函數(shù)可以優(yōu)化總成交額GMV;第二個目標(biāo)函數(shù)權(quán)衡優(yōu)化總成交額GMV和廣告收益。
(6)
如公式(5)所示,我們希望在滿足廣告主訴求的調(diào)價范圍內(nèi)進(jìn)行調(diào)價,使得ECPM排序機(jī)制(如公式(5))下最優(yōu)的廣告,其綜合指標(biāo)函數(shù)f()的值也最大。該優(yōu)化問題的主要求解方法請參見KDD 2017收錄的論文原文: Han Zhu, Junqi Jin, Chang Tan, Fei Pan, Yifan Zeng, Han Li, Kun Gai. Optimized cost per click in Taobao display advertising. ACM SIGKDD 2017.
該優(yōu)化問題的設(shè)計實現(xiàn)了最終排序指標(biāo)和廣告主流量目標(biāo)的解耦。一方面,候選廣告仍然按照最大化eCPM的pctr*b標(biāo)準(zhǔn)排序,廣告主通過調(diào)價匹配流量價值,同時整體eCPM排序機(jī)制保證了廣告主出價撬動流量的能力不受影響;另一方面,廣告平臺可以通過設(shè)計不同的f()函數(shù)優(yōu)化相應(yīng)的平臺綜合指標(biāo)。
OCPC智能調(diào)價算法在離線模擬實驗和線上實際生產(chǎn)環(huán)境中都取得了明顯的效果提升。單品廣告離線模擬效果如表1所示。其中,評價指標(biāo)為RPM(廣告千次展現(xiàn)收益),GPM(千次展現(xiàn)GMV),CTR(廣告點擊率),CVR(成交轉(zhuǎn)化率),PPC(單次點擊扣費(fèi))?;鶞?zhǔn)策略是傳統(tǒng)的廣告排序方法,表中數(shù)據(jù)為該論文提出的OCPC算法相對基準(zhǔn)策略的效果提升百分比。實驗結(jié)果表明,OCPC算法明顯提升了商家千次展現(xiàn)成交額(GPM)和成交轉(zhuǎn)化率(CVR)。
OCPC算法在在線生產(chǎn)環(huán)境中也展現(xiàn)了明顯的效果提升,相比基準(zhǔn)策略,其效果提升百分比如表2。
持續(xù)一周的線上生產(chǎn)環(huán)境效果分析表明,OCPC使得67%的廣告主制定的廣告計劃(Campaign)的千次展現(xiàn)成交額(GPM)和廣告投資回報率(ROI)同時獲得了提升,如表3。另有24%的廣告計劃顯示出流量數(shù)量和質(zhì)量的置換現(xiàn)象(Quantity and quality exchange),其含義是:這類廣告主由于獲得了更多的流量,拉低整體平均ROI下跌。但是,由于其整體流量增幅高于平均ROI跌幅,這些廣告主的成交轉(zhuǎn)化數(shù)都獲得了提升。
除了單品廣告場景,該算法在淘寶移動端首頁頂部的Banner廣告中也明顯提升了商家的成交額和轉(zhuǎn)化率,如表4。從商品的類目視角分析,表5的數(shù)據(jù)表明17%的類目(占62%的瀏覽量)流量的商家GPM和ROI獲得了同時提升,27%的類目(占21%的瀏覽量)流量的GPM獲得了提升,另有30%的類目(占12%的瀏覽量)顯示出流量數(shù)量和質(zhì)量的置換(與單品廣告分析相似,其轉(zhuǎn)化效果也獲得了提升)。
論文指出,持續(xù)了一周以上的線上實驗結(jié)果表明,OCPC算法在長期的考察中展現(xiàn)了穩(wěn)定的明顯正向效果提升,為大多數(shù)廣告主以及平臺帶了經(jīng)濟(jì)效益的增長。更多詳盡的算法分析以及更多場景中OCPC效果的實驗請參閱論文原文。
該項技術(shù)在淘寶展示廣告主要場景上得到了全面應(yīng)用并取得了明顯的效果提升,單品主流場景中67%的廣告主ROI(廣告投資回報率)和GMV(商品交易總額)同時獲得了提升,另有24%的廣告主其流量增幅大于ROI降幅,即成交總量獲得了提升。該場景商家整體成交額GMV提升8.9%,CVR(成交轉(zhuǎn)化率)提升5.2%,RPM(廣告千次展現(xiàn)收益)提升6.6%。Banner CPC場景中,62%流量的商家成交額GMV和ROI同時獲得提升,21%的流量GMV獲得提升,另12%的流量成交總量獲得了提升。該場景商家總成交額GMV提升15.7%,CVR提升19%,RPM提升3.6%。
未來,阿里媽媽精準(zhǔn)技術(shù)團(tuán)隊將繼續(xù)圍繞客戶核心價值,在業(yè)務(wù)上提升營銷效率,設(shè)計更精準(zhǔn)的流量實時價值評估系統(tǒng)。通過持續(xù)優(yōu)化商家和消費(fèi)者的匹配與連接效率,提升商家的營收和消費(fèi)者的用戶體驗。技術(shù)上,該團(tuán)隊將進(jìn)一步探索基于深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等最前沿的人工智能算法,在持續(xù)支持業(yè)務(wù)效果提升的同時,為學(xué)術(shù)界、工業(yè)界貢獻(xiàn)創(chuàng)新的算法和技術(shù)解決方案。
論文原文鏈接:https://arxiv.org/abs/1703.02091
相關(guān)文章:
阿里蓋坤團(tuán)隊提出深度興趣網(wǎng)絡(luò),更懂用戶什么時候會剁手
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。