0
本文作者: 我在思考中 | 2022-09-01 18:53 |
2011 年圖靈獎(jiǎng)得主、因果科學(xué)之父 Judea Pearl 曾提出著名的“因果階梯”論(Pearl Causal Hierarchy,PCH)。
他認(rèn)為,因果推斷有三個(gè)層級(jí),最低的第一層級(jí)是相關(guān)(association),涉及的是預(yù)測(cè),而不涉及因果關(guān)系,只討論變量之間的關(guān)聯(lián),比如公雞打鳴與日出之間的相關(guān)關(guān)系。
第二層級(jí)是干預(yù)(intervention),涉及因果性,比如吸煙與患肺癌之間的因果關(guān)系。
第三層級(jí)是反事實(shí)(Counterfactuals),涉及的是回答諸如“如果情況不是現(xiàn)在這樣,可能會(huì)發(fā)生什么”的問題。
反事實(shí)是當(dāng)下許多因果推斷研究的熱門話題,但也出現(xiàn)不少蹭熱度的研究,一些研究對(duì)于“反事實(shí)”一詞加以不準(zhǔn)確的使用甚至濫用。
最近,一篇研究文中多次提及“反事實(shí)”的因果推斷論文在推特上被轉(zhuǎn)發(fā)后,遭到了 Judea Pearl 的批評(píng)。
這篇論文的第一作者是加州大學(xué)伯克利分校的 Michael Jordan 教授,論文中,作者研究了一種構(gòu)造算法(constructive algorithm),該算法聚焦于因果推理泛函,通過有限差分逼近統(tǒng)計(jì)泛函的 Gateaux 導(dǎo)數(shù)。在概率分布是先驗(yàn)未知但也需要從數(shù)據(jù)中估計(jì)的情況下,估計(jì)的分布產(chǎn)生經(jīng)驗(yàn)的 Gateaux 導(dǎo)數(shù),因此作者還進(jìn)一步考察了經(jīng)驗(yàn)的、數(shù)值的和分析的 Gateaux 導(dǎo)數(shù)之間的關(guān)系。在反事實(shí)均值估計(jì)的案例研究中,作者證明了有限差分與解析 Gateaux 導(dǎo)數(shù)之間的確切關(guān)系。
一個(gè)關(guān)注提供貝葉斯網(wǎng)絡(luò)軟件和服務(wù)的公司賬號(hào) @www.ar-tiste.xyz(以下稱“ar-tiste”)轉(zhuǎn)發(fā)了該論文,并評(píng)論:Michael Jordan 教授用貝葉斯網(wǎng)絡(luò)而不是 SCM 來做反事實(shí),所以他認(rèn)為可以在不用 SCM 的情況下做第三梯級(jí)(即反事實(shí))的推理計(jì)算。
SCM 是 Judea Pearl 提出的結(jié)構(gòu)因果模型(Structural Causal Models),它由表示因果知識(shí)的圖模型、反事實(shí)和干預(yù)邏輯、結(jié)構(gòu)方程組成,常被用于回答反事實(shí)問題。
而 Pearl 認(rèn)為:任何聲稱使用貝葉斯網(wǎng)絡(luò)(Rung-2,第二階梯)進(jìn)行反事實(shí)計(jì)算的人都應(yīng)該受到質(zhì)疑,證據(jù)來自第 35-36 頁(yè)(Pearl 的著作《Causality: models, reasoning, and inference》)中的示例。Jordan 的這篇論文將反事實(shí)定義為 E[Y(1)],也就是第二階梯,而不是第三階梯的反事實(shí)即 E[Y(1)|Y]。
他所引用的證據(jù)就是下面這兩頁(yè)內(nèi)容:
一位研究因果的俄羅斯研究員也參與了討論,他指出,反事實(shí)涉及的是類似于“如果治療方案不同,結(jié)果有多大可能不同?”的問題。所以,這篇論文并不是在做反事實(shí)計(jì)算。
ar-tiste 對(duì)此回應(yīng)說,他并沒有宣稱 SCM 是錯(cuò)誤的,而是認(rèn)為 SCM 是一個(gè)特例,如果做一個(gè) bnet 的全概率分布的 FUNCTIONAL Taylor 級(jí)數(shù),那么該擴(kuò)展中的主導(dǎo)項(xiàng)就是 SCM。他認(rèn)為,這也正是 Jordan 這篇論文的目的,Gateaux 導(dǎo)數(shù)是泛函導(dǎo)數(shù)。這篇論文并非一篇關(guān)于變分推理(VI)的論文。
他接著指出,“潛在結(jié)果”(Potential Outcomes,PO)是在沒有使用 SCM 的情況下做反事實(shí)計(jì)算,而 Pearl 和 Bareinboim 聲稱只能使用 SCM 做反事實(shí)計(jì)算。所以要么是這篇論文搞錯(cuò)了,要么是 Pearl 的觀點(diǎn)錯(cuò)誤。
這個(gè)說法引起了 Pearl 的強(qiáng)烈反對(duì),他表示,自己并沒有聲稱“只能使用 SCM 進(jìn)行反事實(shí)計(jì)算”,他的態(tài)度是,“如果你想了解你在做什么,你想捍衛(wèi)或檢驗(yàn)?zāi)愕募僭O(shè),那么你就需要知道反事實(shí)來源于 SCM”。
Pearl 引用了他早在 2014 年寫的一篇博客“On the First Law of Causal Inference”,文中他提到,因果分析的現(xiàn)代工具并不是新事物,而是從 SEM 框架有機(jī)繼承而來的。因此,人們可以利用 SEM 的研究來使因果分析更有效。
博客地址:http://causality.cs.ucla.edu/blog/index.php/2014/11/29/on-the-first-law-of-causal-inference/
所謂 SEM 是指“結(jié)構(gòu)方程模型”(Structural Equation Model),是一種做多元數(shù)據(jù)分析的統(tǒng)計(jì)工具,在因果研究中,在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上加入 SEM 可以進(jìn)一步構(gòu)建 SCM。Pearl 認(rèn)為,反事實(shí)的結(jié)構(gòu)性定義( structural definition)是因果推理的第一定律。
到這里,論文的作者之一 Angela Zhou 終于出面回應(yīng) Pearl :“是的,這篇論文只關(guān)注了第二階梯(干預(yù)效應(yīng),干預(yù)平均值),而根本沒有對(duì)第三階梯(反事實(shí))發(fā)表任何觀點(diǎn)”。
然而,ar-tiste 看到正主回應(yīng)后并不死心,又去搜了一下論文中的“counterfactual”一詞,發(fā)現(xiàn)一共被提及了 25 次,所以“at all”這個(gè)說法并不準(zhǔn)確...
這時(shí),另一個(gè)網(wǎng)友站出來解釋,在 PO 語(yǔ)境下,干預(yù)量和反事實(shí)量沒有區(qū)別,所以即使文中多次出現(xiàn)“反事實(shí)”一詞,論文本身也可能不涉及 Rung-3。
而 ar-tiste 認(rèn)為,這似乎暗示了在 Pearl 和 PO 兩派(SCM 和 PO 是兩種主要的因果框架)眼中,“反事實(shí)”的定義不同,但二者都是將 Y(0) 和 Y(1) 定義為反事實(shí)變量。
Pearl 則發(fā)表了他對(duì)于“反事實(shí)”的看法,他認(rèn)為,甚至是做第一階梯估計(jì)的人也會(huì)聲稱自己在研究反事實(shí),因?yàn)檫@個(gè)詞顯得更具現(xiàn)代性和前瞻性,這也是為什么他呼吁人們只在第三階梯任務(wù)中使用“反事實(shí)”這個(gè)詞的原因。
可以看出,Pearl 對(duì)于“反事實(shí)”一詞的使用非常謹(jǐn)慎,在一位不知真相的網(wǎng)友評(píng)論 Jordan 這篇論文是“優(yōu)秀的因果建模并非常有 1980 年代的風(fēng)格”時(shí),Pearl 就毫不留情地指出,他沒有從中看出一點(diǎn) 1980 年代的影子,論文沒有 d-separation,也沒有 graphoids,跟 1980 年代的圖模型是八竿子打不著。
的確,因果推斷的研究時(shí)下非常熱門,也出現(xiàn)了很多盲目追趕潮流的研究,但 Pearl 認(rèn)為:研究中將隨機(jī)對(duì)照實(shí)驗(yàn)所產(chǎn)生的的一切都稱為“反事實(shí)”的習(xí)慣是造成誤解的主要來源。
最后,論文作者 Angela Zhou 沒有給出更多解釋,她回應(yīng):論文之后的編輯版本將改稱為“干預(yù)平均值”(interventional mean),以此作為澄清。
不過,Pearl 還是將嚴(yán)謹(jǐn)態(tài)度貫徹到底,他認(rèn)為,即使是“干預(yù)平均值”在論文例 1 中的定義也并不明確。
看來,即便是在因果推斷這門看似不那么“硬”的學(xué)科中,研究者也需要保持足夠的嚴(yán)謹(jǐn)精神。
掃碼添加 AI 科技評(píng)論 微信號(hào),投稿&進(jìn)群:
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。