丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給我在思考中
發(fā)送

0

重慶大學劉禮:因果學習與應用

本文作者: 我在思考中 2022-04-25 10:54
導語:因果框架如何解決“非獨立同分布”?

重慶大學劉禮:因果學習與應用

作者 | 劉禮

編輯 | 維克多

因果學習作為人工智能領域研究熱點之一,其研究進展與成果也引發(fā)了眾多關注。4月9日,在AI TIME青年科學家——AI 2000學者專場論壇上,重慶大學大數(shù)據(jù)與軟件學院教授劉禮做了《因果學習與應用》的報告。

在報告中,他從辛普森悖論入手,分析了當前機器學習面臨的困難,然后介紹了幾個主流因果框架解決“非獨立同分布”、“結合知識”的思路,以及框架的優(yōu)缺點,例如他提到:

“目前有兩套主要的因果模型:Pearl的結構因果模型,以及Rubin的潛在結果模型。兩者都可以預測、干預以及回答反事實問題,但對于“發(fā)現(xiàn)定理知識”不確定是否可行。潛在結果模型的不同之處在于,可以從數(shù)據(jù)中學習,但結合現(xiàn)有知識較為困難,結構因果模型則相反,可以結合現(xiàn)有知識,但從數(shù)據(jù)中學習的能力還亟待進一步檢驗。”

此外,他還結合自己的工作成果,提到了因果框架如何應用于圖像合成、疾病診斷、行為識別等例子,以下是演講原文,AI科技評論做了不改變原意的整理。

今天報告的內容是因果學習及其應用。該領域最著名的一個例子是辛普森悖論:在700例腎病患者中,觀察他們服藥情況,發(fā)現(xiàn)服藥男性的治愈率是93%,女性治愈率73%,不服藥的男性治愈率為87%,女性為69%。分男女組別考察,能夠得出”服藥有助于恢復”的結論,但從整體樣本考察,會發(fā)現(xiàn)不服藥的治愈率83%高于服藥的治愈率78%。

重慶大學劉禮:因果學習與應用

另外一個辛普森悖論的例子關于房價。10年前,某城市市中心的房價是8000元/平米,共銷售了1000萬平;高新區(qū)是4000元/平米,共銷售了100萬平;整體來看,該市7636元/平米;現(xiàn)在,市中心10000元/平米,銷售了200萬平;高新區(qū)是6000元/平米,銷售了2000萬平,整體來看,該市6363元/平米。因此,分區(qū)來看分別都漲了,但從整體上看,會有疑惑:為什么現(xiàn)在的房價反而跌了?

重慶大學劉禮:因果學習與應用

辛普森悖論雖然不是新提出的,但卻是各領域不可忽視“頑疾”。2019年,新冠爆發(fā)時,有學者分國家對病死率進行了統(tǒng)計,如上圖,在各個年齡段,中國的病死率都比意大利高;但整體統(tǒng)計下來,意大利卻反而更高。

這種分組和整體結論不同的情況,也是機器學習模型的困境。例如訓練數(shù)據(jù)和測試數(shù)據(jù)不滿足獨立同分布的假設,那么機器學習在分布偏移情況下很難魯棒地學習,在新的場景中很難使用現(xiàn)有的模型。

實際上,目前基于數(shù)據(jù)驅動的機器學習方法,訓練出的模型都得出的結論大多是變量和變量之間的相關關系,而不是因果關系。例如之前有項研究發(fā)現(xiàn),在某大國暴力犯罪與腌黃瓜消耗密切相關,但這種相關性并不代表因果性。

重慶大學劉禮:因果學習與應用

從因果的角度,辨析腌黃瓜和暴力犯罪之間的關系需要考慮混淆變量。如上圖,混淆變量會同時影響獨立變量和因果變量,從而造成兩者之間的偽相關。如果將傳統(tǒng)統(tǒng)計和因果推斷進行對比,有以下幾個特點:

重慶大學劉禮:因果學習與應用

在90年代,知識驅動的機器學習方法占據(jù)主流,基于人類知識,編碼成規(guī)則,讓計算機自動在規(guī)則之上進行推理。深入思考,其實西方科學的發(fā)展史就是因果問題,這套真理體系+推理體系我們從小就在學習:已知1+1=2, 1+2=3,可以推導得出1+1+1=3。

這套體系也有可能出錯,例如牛頓定律在地球上適用,但在宇宙中就失效,從而愛因斯坦提出了相對論。

東方科學發(fā)展也有幾千年,也大量地研究過因果關系。



1

超越數(shù)據(jù)驅動,邁向可解釋性

主流數(shù)據(jù)驅動的機器學習已經非常成功,無論是阿法狗,還是GPT都帶來了驚艷的效果。但有兩個缺點:沒有可解釋性、可控性差。

重慶大學劉禮:因果學習與應用

為了解決上述問題,圖靈獎獲得者朱迪亞·珀爾提出因果關系之梯。如上圖,第一層次是關聯(lián),通過概率表達描述出觀察到的一堆數(shù)據(jù)。第二層次是干預,不僅是觀察,而且是進行實驗改變,例如如果吃了阿司匹林,我的頭痛會得到治愈嗎?如果我們禁止吸煙將會發(fā)生什么?其中,吃藥和禁止吸煙都是干預手段。第三層次是反事實,在既定結果已經發(fā)生的情況,假設當初采取另一方案,則會發(fā)生什么。反事實不會得到觀察數(shù)據(jù),畢竟不存在兩個平行世界,但確實經常遇到的情況,經典的就是人們常說的“如若當初........就不會......”。

重慶大學劉禮:因果學習與應用

在概率空間層面,如何解釋?如上圖,觀察到的數(shù)據(jù),形成一個聯(lián)合分布概率表達;加入干預之后,每一個操作對應一個概率分布,因此可能解決“獨立同分布”假設帶來的缺陷。

重慶大學劉禮:因果學習與應用

反事實問題目前非常難解決,也有很多例子。黑人被警察控制事件,反事實下,就對應:如若白人被警察控制了,會發(fā)生什么?在影視劇中,也常發(fā)出如若是另外某個明星參演,票房會有什么變化。這些反事實問題沒辦法驗證,但需要回答。

重慶大學劉禮:因果學習與應用

針對此問題,目前有兩套主要的因果模型:Pearl的結構因果模型;Rubin的潛在結果模型。兩者都可以預測、干預以及回答反事實問題,對于“發(fā)現(xiàn)定理知識”目前還不確定是否可行。但潛在結果模型的不同之處在于,可以從數(shù)據(jù)中學習,但與現(xiàn)有知識相結合比較困難,而結構因果模型則相反,可以結合現(xiàn)有知識,但從數(shù)據(jù)中學習的能力還亟待進一步檢驗。

目前,因果范式有幾個問題正在解決:因果發(fā)現(xiàn)、因果推理。

重慶大學劉禮:因果學習與應用

因果發(fā)現(xiàn)需要基于已有的數(shù)據(jù)找出變量和變量之間的因果關系。目前有兩套主流的方法:基于約束以及基于評分的。這兩套方法不去詳細講述。但存在的問題是:隨著變量的增多,需要檢驗因果圖就會達到天文數(shù)字。因此,如何利用機器學習方法反過來提升因果發(fā)現(xiàn),是目前流行的問題。

在機器學習領域中,Pearl的方法本質是基于結構方程,主流方向是用它進行因果解耦。同時,也有一些非因果的方法,例如在SVM空間中進行超平面切分。

重慶大學劉禮:因果學習與應用

在因果推理層面,Pearl提出了do算子,在因果圖上給出了一系列定理和假設,用傳統(tǒng)的概率表達形式進行操作,這就讓“因果”變得可計算。Pearl同樣給出了反事實計算框架,其最重要的是“孿生網絡”,包含一個真實世界,以及一個反事實世界。Pearl這套理論其實也存在缺點,即假設因果圖是存在的,并需要包含一些先驗知識,例如方程的結構是線性還是非線性的。

因果效應評估,就是在有一堆觀察變量以及未觀察變量的情況下,如何評估出變量X對變量Y的因果效應有多大。目前主流方法包括傾向得分、工具變量等等。



2

應用例舉,因果框架符合現(xiàn)實假設

目前的圖像自動生成很多都是以條件為主的,例如給定標簽的控制、圖像的控制、文字的控制,考慮如何基于已有的觀察數(shù)據(jù)進行訓練模型、進行生成。

與基于條件的生成方法不同,基于潛在變量數(shù)據(jù)的方法目的在于解決“某些變量無法直接被觀察”的困境。

因果干預圖像合成方法,是對相應的變量進行解耦,即觀察變量變化如何導致結果變化,該方法能夠精準控制圖像的某一部分合成。

重慶大學劉禮:因果學習與應用

此外,因果方法在醫(yī)療領域有很多應用?;诮Y構函數(shù)的因果模型,設計因果發(fā)現(xiàn)框架,試圖超越分子與分子之間的關聯(lián)性,找出其因果性。具體操作分成兩步:第一步發(fā)現(xiàn)變量和變量之間,包括潛變量之間的因果圖;第二步基于因果圖,確定明確的結構函數(shù)關系。

目前,我們開發(fā)出基于貝葉斯圖學習因果模型,超越了傳統(tǒng)學習函數(shù)步驟,使用因果圖進行描述關系,也是分為兩步:第一步邊定向,需要滿足馬爾科夫等價條件,使得因果效應最大化;第二步是因果效應評估。目前,該方法已經應用在最具代表性腫瘤特征選擇這一課題上。

最后一個應用是人體行為識別。人體識別多是采用傳感器和視頻流的方式進行,會有前后的因果關系。因此,可以用格蘭杰因果方法解決時序因果中的問題。

重慶大學劉禮:因果學習與應用

最后推薦幾本書,《WHY》、《Causal Inference in Statistics》、《Causality》、《Elements of Causal Inference》、《What If》 都非常棒。其中,《Causality》目前,我們歷經3年時間已經翻譯成了中文,即將出版,請大家期待。

重慶大學劉禮:因果學習與應用

雷峰網(公眾號:雷峰網)雷峰網

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

重慶大學劉禮:因果學習與應用

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說