丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

本文作者: 奕欣 2017-09-09 12:15
導(dǎo)語:我們能不能基于歷史觀測數(shù)據(jù)進(jìn)行因果效應(yīng)評(píng)估?

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

via hitbullseye

雷鋒網(wǎng)AI科技評(píng)論按:ACM SIGKDD 國際會(huì)議(簡稱KDD)是由ACM的知識(shí)發(fā)現(xiàn)及數(shù)據(jù)挖掘?qū)N瘯?huì)(SIGKDD)主辦的數(shù)據(jù)挖掘研究領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議。雷鋒網(wǎng)AI科技評(píng)論今年也來到了KDD 2017現(xiàn)場做了覆蓋和報(bào)道。參與本次KDD的清華大學(xué)博士生況琨受雷鋒網(wǎng)AI科技評(píng)論獨(dú)家邀請(qǐng),介紹他與導(dǎo)師楊士強(qiáng)博士、崔鵬博士、黎波(清華大學(xué))和蔣朦(UIUC)的工作《Estimating Treatment Effect in the Wild via Differentiated Confounder Balancing》。

論文地址:http://www.kdd.org/kdd2017/papers/view/estimating-treatment-effect-in-the-wild-via-differentiated-confounder-balan

在當(dāng)今大數(shù)據(jù)時(shí)代,在廣告、醫(yī)療等各個(gè)領(lǐng)域都積累了海量歷史數(shù)據(jù)。同時(shí),大量高效的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法提出,使得我們能更有效的利用大數(shù)據(jù)對(duì)未來數(shù)據(jù)點(diǎn)進(jìn)行預(yù)測。在預(yù)測導(dǎo)向的問題上,大部分算法都取得了不錯(cuò)的效果。但是,由于絕大多數(shù)預(yù)測算法缺乏可解釋性,導(dǎo)致其很難應(yīng)用于許多實(shí)際問題上,尤其是那些需要進(jìn)行決策制定的問題。因此,如何提高這些算法的可解釋性,不管對(duì)于學(xué)術(shù)界還是工業(yè)界都十分重要。

拿醫(yī)療領(lǐng)域舉個(gè)例子。假設(shè)在整個(gè)醫(yī)療系統(tǒng)中,我們擁有 100 萬流感病人數(shù)據(jù)。對(duì)于每一位病人,我們知道其過往病史、診斷歷史、常用藥物、基因測試以及年齡性別等特征?,F(xiàn)在,醫(yī)院來了為新病人 Anna,我們知道 Anna 是亞洲人,54 歲,得了流感,伴頭疼鬧熱發(fā)燒等癥狀。Anna 問醫(yī)生,哪種治療能最有效地治療其流感。因此,醫(yī)生就需要做出決策,到底是給 Anna 服用藥物 A (Tylenol),還是藥物 B (Sudafed),或者是其他藥物。作為數(shù)據(jù)科學(xué)家,基于這些數(shù)據(jù),我們能不能利用我們的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法幫助醫(yī)生進(jìn)行正確的藥物決策呢?

當(dāng)然,最簡單的,我們可以構(gòu)造一個(gè)回歸模型,通過病人的特征(X)加上藥物決策(A/B)來回歸預(yù)測藥效(Y)。通過回歸模型學(xué)習(xí),我們能很容易地預(yù)測 Anna 在服用藥物 A 或 B 之后的藥效,并通過藥效差異來進(jìn)行藥物決策。

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

回歸模型進(jìn)行決策制定

但是,我們認(rèn)為類似于上述基于關(guān)聯(lián)分析的算法是不足以解決決策制定問題的。主要原因如下:

第一,數(shù)據(jù)中變量之間的依賴性。我們知道,在真實(shí)數(shù)據(jù)中,病人的一些特征,如收入,往往會(huì)影響病人對(duì)藥物的選擇。也就是說病人特征和藥物的選擇并不是獨(dú)立關(guān)系。而在很多關(guān)聯(lián)分析模型中,他們假設(shè)數(shù)據(jù)中變量關(guān)系是獨(dú)立的。忽略數(shù)據(jù)變量依賴性,會(huì)導(dǎo)致我們很難評(píng)估每個(gè)藥物的實(shí)際療效,很容易使得我們做出錯(cuò)誤決定。

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

關(guān)聯(lián)分析模型不足以解決決策制定問題

例如,在醫(yī)療歷史數(shù)據(jù)中,我們發(fā)現(xiàn)對(duì)于大多數(shù)身體健壯的病人,即使不服用任何藥物,最后病情恢復(fù)的也很快;而對(duì)于身體虛弱的病人,即使服用了相關(guān)的藥物,其最后療效也不是非常好?;谶@個(gè)簡單的數(shù)據(jù),關(guān)聯(lián)分析模型會(huì)挖掘出錯(cuò)誤的覺果:「不服用任何藥物對(duì)病人反而更好」。

第二個(gè)原因是:關(guān)聯(lián)并不代表因果。也就是說兩個(gè)變量之間存在關(guān)聯(lián)關(guān)系,但其并不一定存在因果關(guān)系。如果不存在因果關(guān)系,那么就不能進(jìn)行決策制定。例如,基于觀測,我們發(fā)現(xiàn)某地冰激凌銷量跟當(dāng)?shù)仄囅ɑ痤l率十分相關(guān)?;谟^測數(shù)據(jù),我們能通過冰激銷量準(zhǔn)確預(yù)測汽車熄火頻率。但是我們并不能通過控制冰激凌銷量來達(dá)到減少汽車熄火頻率的目的,原因就是冰激凌銷量跟汽車熄火之間并不存在任何因果關(guān)系。冰激凌銷量之所以和汽車熄火頻率十分相關(guān),是因?yàn)槭苎谉崽鞖庥绊憽?/p>

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

冰激凌銷量和汽車熄火頻率十分相關(guān)

因此,我們認(rèn)為關(guān)聯(lián)分析模型不足以解決決策制定問題。

因果推理(Causal Inference)是一個(gè)用于決策制定等問題的強(qiáng)大統(tǒng)計(jì)建模工具。因果推理中一個(gè)根本的問題是因果效應(yīng)評(píng)估,常用的方法是隨機(jī)對(duì)照試驗(yàn),例如 A/B Testing,通過控制兩組樣本特征一樣,然后給予不同的治療并比較其最終輸出的差異來評(píng)估藥物對(duì)患者的因果效應(yīng)。但是完全的隨機(jī)對(duì)照試驗(yàn)代價(jià)往往非常昂貴,而且在很多涉及倫理道德的問題上甚至不可行。因此,處于大數(shù)據(jù)時(shí)代的我們就在思考這樣一個(gè)問題:我們能不能基于歷史觀測數(shù)據(jù)進(jìn)行因果效應(yīng)評(píng)估?

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

因果推斷框架

這個(gè)問題的相關(guān)工作主要有如下兩塊:

  1. Propensity Score Based Methods,包括 Inverse Propensity Weight 和 Doubly Robust 方法。這些方法首先需要對(duì) Propensity Score 進(jìn)行評(píng)估,然后通過 Propensity Score 加權(quán)樣本使得不同 Treatment 組之間的特征 Confounder X 分布是一樣的(可以理解為逼近隨機(jī)對(duì)照試驗(yàn)或者 AA Testing),并進(jìn)行因果效應(yīng)評(píng)估。但是,此類方法的最大缺陷是需要先驗(yàn)知識(shí)進(jìn)行對(duì) Confounder X 和 Treatment T 之間的模型進(jìn)行假設(shè)。然而,我們知道在大數(shù)據(jù)背景下,我們常常擁有大量的觀測變量,我們很難知道變量之間的模型結(jié)構(gòu),因此我們?cè)谟?jì)算因果效應(yīng)時(shí)不能進(jìn)行模型假設(shè)。

  2. Directly Variable Balancing Methods,例如 Entropy Balancing 和 Approximate Residual Balancing 方法。這些方法的 Motivation 在于變量的分布由其矩(Moments)唯一決定,因此通過矩可以控制不同 Treatment 組間變量平衡。但是這類方法將所有的觀測變量都進(jìn)行了同等平衡,包括那些不會(huì)影響 Treatment T 的一些無關(guān)變量。然而,在大數(shù)據(jù)背景下,并不是所有的變量都需要平衡,而且不同變量需要平衡的權(quán)重也不一樣。

因此,本文認(rèn)為在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估,存在如下兩個(gè)挑戰(zhàn):

  • 一是變量之間關(guān)系和模型的未知性,導(dǎo)致我們?cè)谶M(jìn)行因果效應(yīng)評(píng)估時(shí)不能進(jìn)行模型假設(shè)。

  • 二是高維變量和噪聲數(shù)據(jù)的影響,并不是所有的變量都需要平衡,而且不同變量需要的平衡權(quán)重不一樣。

為了解決以上挑戰(zhàn),本文提出了 Differentiated Confounder Balancing 算法,通過同時(shí)學(xué)習(xí) Confounder Weights β 和 Sample Weights W 進(jìn)行因果效應(yīng)評(píng)估。其中 Confounder Weights 決定哪些觀測變量是 Confounder 以及其產(chǎn)生的 Confounding Bias 權(quán)重,而 Sample Weights 則用來控制 Treated 組(T=1)和 Control 組(T=0)之間的 Confounder X 分布相似。

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

Ideas on Differentiated Confounder Balancing Algorithm

但是我們?nèi)绾稳W(xué)習(xí)這些 Confounder Weights 和 Sample Weights 呢?

首先,學(xué)習(xí) Confounder Weights. 在因果推理框架中,X,T 和 Y 之間的一般關(guān)系可以如下表示:

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

從中我們可以得到真實(shí)的因果效應(yīng) ATT 的表達(dá)式。考慮函數(shù) f(X) 的一般形式: 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

我們從理論上發(fā)現(xiàn),我們實(shí)際評(píng)估的因果效應(yīng)清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估與實(shí)際的因果效應(yīng) ATT 之間存在一個(gè)誤差項(xiàng)。而該誤差項(xiàng)正好可以分解為每一維觀測變量 Mk 產(chǎn)生的 Confounding Bias 和相關(guān)的 Confounder Bias Weight αk. 

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

從上述推導(dǎo)中,我們發(fā)現(xiàn)如果不同的 Confounder 具有不同的 Confounder Weight αk;而且當(dāng)αk=0 時(shí),變量 Mk 就不是 Confounder,不需要進(jìn)行 Balancing。我們還發(fā)現(xiàn)在推導(dǎo)過程中的 Confounder Weights αk 正好就是函數(shù) f(X) 中變量 Mk 的相關(guān)系數(shù)。因此,我們給出如下定理:

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

其次,學(xué)習(xí) Sample Weights. 通過 Wikipedia,我們知道任何變量的矩(Moments)能唯一決定其分布。受這點(diǎn)啟發(fā),我們提出了通過變量的矩來直接進(jìn)行變量平衡,具體如下圖。在 Moments 的幫助下,我們可以通過直接變量平衡來學(xué)習(xí) Sample Weights,且并不需要任何模型假設(shè)。

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

Sample Weights Learning by Moments

綜上,我們 DCB 算法的最終目標(biāo)函數(shù)如下:

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

其中,紅框部分是用來學(xué)習(xí) Sample Weights 的,綠框部分是用來學(xué)習(xí) Confounder Weights 的。

實(shí)際上,Entropy Balancing 和 Approximate Residual Balancing 方法都是我們 DCB 算法的 Special Cases 通過將我們算法中 Confounder Weights β 設(shè)置為單位向量。因此,我們算法對(duì)于因果效應(yīng)評(píng)估更加一般化。

我們 DCB 算法的時(shí)間復(fù)雜度為 O(np),其中 n 表示樣本數(shù)量,p 表示變量維度。

在實(shí)驗(yàn)部分,我們通過三個(gè)方面對(duì)我們提出的 DCB 算法進(jìn)行了測試:Robustness Test, Accuracy Test 和 Predictive Power Test.

首先是 Robustness Test. 為了檢測我們算法的魯棒性,我們?cè)诜抡鏀?shù)據(jù)上生成了各種情景下的高維和噪聲數(shù)據(jù)。

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

上述圖表只匯報(bào)了小部分結(jié)果,更多結(jié)果詳見我們論文。從上述結(jié)果中,我們發(fā)現(xiàn),基于 Directly Estimator 在所有 setting 下都失敗了,這是因?yàn)樵摲椒ê雎粤藬?shù)據(jù)中存在的 confounding bias;基于 propensity score 的方法,IPW 和 Doubly Robust 方法當(dāng)面臨錯(cuò)誤的模型假設(shè)和高維變量時(shí)就會(huì)產(chǎn)生巨大錯(cuò)誤。ENT 和 ARB 算法由于將所有的觀測變量都當(dāng)作 Confounder 進(jìn)行同等平衡,導(dǎo)致其最后效果也不理想。而我們的 DCB 算法,通過同時(shí)優(yōu)化 Confounder Weights 和 Sample Weights,在所有 setting 下因果效應(yīng)評(píng)估性能相比基準(zhǔn)方法都有顯著性提升。說明我們的 DCB 算法的魯棒性非常好。

其次是 Accuracy Test. 這里我們將 DCB 算法應(yīng)用在真實(shí)數(shù)據(jù) Lalonde 數(shù)據(jù)集上。該數(shù)據(jù)集包含兩塊,一塊是隨機(jī)對(duì)照試驗(yàn)數(shù)據(jù),給我們提供了因果效應(yīng)的 ground truth;另一塊是觀測數(shù)據(jù),用來檢測各個(gè)算法對(duì)因果效應(yīng)評(píng)估的性能。

實(shí)驗(yàn)結(jié)果如下表:

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

從實(shí)驗(yàn)結(jié)果可以看出,我們的 DCB 算法能在各中 setting 下更準(zhǔn)確地評(píng)估因果效應(yīng)。

最后,Predictive Power Test. 為了檢測我們算法的預(yù)測能力,我們將 DCB 算法應(yīng)用于真實(shí)的在線廣告數(shù)據(jù)集中。對(duì)數(shù)據(jù)中每一維特征計(jì)算其對(duì)最后結(jié)果產(chǎn)生的因果效應(yīng),并選取因果效應(yīng)最高的 top-k 個(gè)特征對(duì)最后結(jié)果進(jìn)行預(yù)測。預(yù)測結(jié)果如下圖:

 清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

從結(jié)果中我們發(fā)現(xiàn),我們的 DCB 算法在該預(yù)測問題上達(dá)到了最有的預(yù)測準(zhǔn)確度。同時(shí),我們將我們的算法與經(jīng)典的 correlation-based features selection 方法 (MRel, mRMR) 進(jìn)行了對(duì)比,實(shí)驗(yàn)發(fā)現(xiàn) correlation-based 方法比我們 DCB 方法的效果差了很多,甚至比其他 Causality-based 方法都要差。這就說明,因果效應(yīng)評(píng)估或者因果推理能有效地提升模型的預(yù)測能力。(對(duì)于 Causality 在預(yù)測問題上的應(yīng)用可以參考我們最新的文章「On Image Classification: Correlation v.s. Causality」

總結(jié)

在本文中,我們專注于解決在無約束的大數(shù)據(jù)高維背景下如何進(jìn)行因果效應(yīng)評(píng)估。我們發(fā)現(xiàn)之前絕大多數(shù)方法抑或沒有考慮 Confounders 之間的不同,抑或需要正確的模型假設(shè),導(dǎo)致了在大數(shù)據(jù)高維背景下表現(xiàn)不佳。因此我們提出了 Differentiated Confounder Balancing 的算法并給出了理論的分析。我們的算法通過聯(lián)合優(yōu)化 Confounder Weights 和 Sample Weights 來評(píng)估因果效應(yīng)。基于仿真數(shù)據(jù)集和真實(shí)數(shù)據(jù)集的大量實(shí)驗(yàn)表明我們的方法能夠顯著地超越當(dāng)前最好的方法。同時(shí)我們的方法所選出的最重要的特征在廣告數(shù)據(jù)集的預(yù)測任務(wù)上也取得了最好的效果。

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

清華崔鵬團(tuán)隊(duì)KDD論文一作解讀:在大數(shù)據(jù)背景下進(jìn)行因果效應(yīng)評(píng)估

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說