重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

本文作者：我在思考中

2022-02-28 10:38

導(dǎo)語(yǔ)：機(jī)器學(xué)習(xí)和因果推理之間應(yīng)該形成共識(shí)，而穩(wěn)定學(xué)習(xí)正在向?qū)崿F(xiàn)這一目標(biāo)的方向邁進(jìn)。

整理丨AI科技評(píng)論

2月23日，清華大學(xué)計(jì)算機(jī)系崔鵬副教授與斯坦福大學(xué)Susan Athey（美國(guó)科學(xué)院院士，因果領(lǐng)域國(guó)際權(quán)威）合作，在全球頂級(jí)期刊Nature Machine Intelligence（影響因子IF=15.51，2020）上發(fā)表題為“Stable Learning Establishes Some Common Ground Between Causal Inference and Machine Learning”（穩(wěn)定學(xué)習(xí)：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)）的觀點(diǎn)論文。深入探討和總結(jié)了因果推理在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域取得的關(guān)注，并對(duì)“穩(wěn)定學(xué)習(xí)”提出了系統(tǒng)性分析和展望。文章認(rèn)為，機(jī)器學(xué)習(xí)和因果推理之間應(yīng)該形成共識(shí)，而穩(wěn)定學(xué)習(xí)正在向?qū)崿F(xiàn)這一目標(biāo)的方向邁進(jìn)。

機(jī)器學(xué)習(xí)與經(jīng)濟(jì)學(xué)的碰撞，會(huì)產(chǎn)生什么樣的火花？

人工智能的目標(biāo)是讓機(jī)器像人類一樣“思考”和“決策”，機(jī)器學(xué)習(xí)是實(shí)現(xiàn)這一愿景的重要方法。那么，用機(jī)器學(xué)習(xí)的方法來(lái)解決現(xiàn)實(shí)中的決策問(wèn)題是否可行？斯坦福大學(xué)的Susan Athey在一次演講中用身邊的例子進(jìn)行了舉例：斯坦福大學(xué)的經(jīng)濟(jì)學(xué)系女教授的平均水平似乎比男教授更高，老是發(fā)不出文章的教授中女教授很少，但這很有可能是因?yàn)閿?shù)據(jù)自身的局限性，如果通過(guò)機(jī)器學(xué)習(xí)的方法編寫(xiě)程序按性別來(lái)篩選候選人，并用斯坦福的訓(xùn)練數(shù)據(jù)去推而廣之，很有可能在實(shí)際中產(chǎn)生歧視。

利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)對(duì)一項(xiàng)政策效果進(jìn)行更精準(zhǔn)的推斷，這正是諾貝爾獎(jiǎng)級(jí)別的研究成果——Susan Athey與她的丈夫Guido Imbens近年來(lái)關(guān)注的研究方向正是利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)對(duì)政策效果更精準(zhǔn)的推斷，并在融合機(jī)器學(xué)習(xí)與政策的處置效應(yīng)方面合作撰寫(xiě)了多篇文章。而Guido Imbens2021年也因此與另兩位學(xué)者分享了當(dāng)年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，評(píng)獎(jiǎng)委員會(huì)認(rèn)為，他們?cè)趧趧?dòng)經(jīng)濟(jì)學(xué)和從自然實(shí)驗(yàn)中分析因果推理方面做出了突出貢獻(xiàn)，掀起了經(jīng)濟(jì)學(xué)研究的“可信革命”。

所謂“因果推理”是計(jì)量經(jīng)濟(jì)學(xué)中近年來(lái)得到重視的一個(gè)重要概念。傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)一般集中在統(tǒng)計(jì)推理方面，重視變量之間的相關(guān)性而忽視了當(dāng)中的因果關(guān)系；因果推斷則是將相關(guān)性與因果性進(jìn)行獨(dú)立分析，科學(xué)地識(shí)別變量間的因果關(guān)系。在機(jī)器學(xué)習(xí)領(lǐng)域也存在類似的問(wèn)題，目前大多數(shù)機(jī)器學(xué)習(xí)模型注重各因素之間的相關(guān)性分析，由此衍生的“泛化性”和“可信性”正是當(dāng)前機(jī)器學(xué)習(xí)需要面對(duì)的兩大問(wèn)題。

在大數(shù)據(jù)時(shí)代，人們認(rèn)為可以利用更大的機(jī)器或者更多數(shù)據(jù)解決問(wèn)題，但很多時(shí)候問(wèn)題的答案并不在數(shù)據(jù)中。這也正是機(jī)器學(xué)習(xí)難以在實(shí)際場(chǎng)景中應(yīng)用于決策的原因：機(jī)器學(xué)習(xí)存在缺乏可解釋性和未知環(huán)境下的穩(wěn)定性的問(wèn)題，既難以預(yù)測(cè)結(jié)構(gòu)變化之后的結(jié)果，也不能對(duì)結(jié)果進(jìn)行合理的解釋。

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

（人工智能的兩大問(wèn)題：缺乏可解釋性和穩(wěn)定性，來(lái)自崔鵬的報(bào)告ppt）

Susan Athey在2017年為《Science》撰寫(xiě)的綜述性文章《Beyond Prediction：Using big data for policyproblems》中總結(jié)，在做出預(yù)測(cè)和做出決策之間存在許多差距，為了優(yōu)化數(shù)據(jù)驅(qū)動(dòng)的決策，需要理解基本假設(shè)。而這也正是解決機(jī)器學(xué)習(xí)兩大問(wèn)題的有效途徑。

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

（Susan 2017年為《Science》撰寫(xiě)的綜述性文章）

在機(jī)器學(xué)習(xí)過(guò)程中帶來(lái)的關(guān)聯(lián)統(tǒng)計(jì)被認(rèn)為是導(dǎo)致目前的機(jī)器學(xué)習(xí)缺乏可解釋性和穩(wěn)定性的重要原因。現(xiàn)有的大部分機(jī)器學(xué)習(xí)方法都需要IID假設(shè)，即訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)應(yīng)當(dāng)是獨(dú)立同分布的。然而在現(xiàn)實(shí)中這一假設(shè)很難滿足。以我們熟悉的圖片“貓狗檢測(cè)”為例，如果訓(xùn)練數(shù)據(jù)的大部分圖片中狗位于草地上，模型對(duì)“水中的狗”這一極端樣例的檢測(cè)可能會(huì)完全失效，甚至可能出現(xiàn)“指貓為狗”的錯(cuò)誤，把在草地上的貓錯(cuò)認(rèn)為狗。

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

（來(lái)自崔鵬的報(bào)告ppt）

當(dāng)下的人工智能技術(shù)往往不能很好地泛化到未知的環(huán)境，是因?yàn)楝F(xiàn)有大部分機(jī)器學(xué)習(xí)模型主要是關(guān)聯(lián)驅(qū)動(dòng)的，這些模型通常只做到了知其“然”（即關(guān)聯(lián)性）而不知其“所以然”（即因果性）。將因果推理的思想推廣到機(jī)器學(xué)習(xí)領(lǐng)域，去除關(guān)聯(lián)中的虛假關(guān)聯(lián)，使用因果關(guān)聯(lián)指導(dǎo)模型學(xué)習(xí)，是提升模型在未知環(huán)境下穩(wěn)定性根本路徑之一。

值得一提的是，從因果角度出發(fā)，可解釋性和穩(wěn)定性之間存在一定的內(nèi)在關(guān)系，即通過(guò)優(yōu)化模型的穩(wěn)定性亦可提升其可解釋性，從而解決當(dāng)前人工智能技術(shù)在落地中面臨的困境。

基于此，清華大學(xué)崔鵬團(tuán)隊(duì)從2016年起開(kāi)始深入研究如何將因果推理與機(jī)器學(xué)習(xí)相結(jié)合，并最終形成了“穩(wěn)定學(xué)習(xí)”（Stable Learning）的研究方向。穩(wěn)定學(xué)習(xí)有望彌補(bǔ)機(jī)器學(xué)習(xí)模型的“預(yù)測(cè)”到經(jīng)濟(jì)生活等現(xiàn)實(shí)“決策”之間的鴻溝，隨著對(duì)因果分析研究的進(jìn)一步深入，以穩(wěn)定學(xué)習(xí)為代表的因果分析建模技術(shù)將成為人工智能發(fā)展的突破口，幫助我們從數(shù)據(jù)中推斷出因果關(guān)系并進(jìn)行有效檢驗(yàn)，從而做出更好的決策。

穩(wěn)定學(xué)習(xí)：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)

摘要

因果推理近年來(lái)在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域引起了廣泛關(guān)注。它通常被定位為一個(gè)獨(dú)特的研究領(lǐng)域，可以將機(jī)器學(xué)習(xí)的范圍從預(yù)測(cè)建模擴(kuò)展到干預(yù)和決策。而從作者的角度來(lái)看，即便對(duì)于機(jī)器學(xué)習(xí)所擅長(zhǎng)的預(yù)測(cè)類問(wèn)題，如果對(duì)預(yù)測(cè)穩(wěn)定性、可解釋性和公平性提出較高要求，那么因果統(tǒng)計(jì)的思想對(duì)于改善機(jī)器學(xué)習(xí)、預(yù)測(cè)建模也變得不可或缺。基于此，作者提出了穩(wěn)定學(xué)習(xí)的概念和框架，以彌合因果推理中傳統(tǒng)精確建模與機(jī)器學(xué)習(xí)中的黑盒方法之間的鴻溝。本文闡明了機(jī)器學(xué)習(xí)模型的風(fēng)險(xiǎn)來(lái)源，討論了將因果關(guān)系引入機(jī)器學(xué)習(xí)的必要性，從因果推理和統(tǒng)計(jì)學(xué)習(xí)兩個(gè)視角闡述了穩(wěn)定學(xué)習(xí)的基本思想和最新進(jìn)展，并討論了穩(wěn)定學(xué)習(xí)與可解釋性和公平性問(wèn)題的關(guān)系。

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

當(dāng)前機(jī)器學(xué)習(xí)的主要風(fēng)險(xiǎn)

論文指出，機(jī)器學(xué)習(xí)技術(shù)的優(yōu)化目標(biāo)是預(yù)測(cè)的精度和效率，而錯(cuò)誤預(yù)測(cè)的潛在風(fēng)險(xiǎn)往往被忽視。對(duì)于預(yù)測(cè)點(diǎn)擊量或?qū)D像進(jìn)行分類等應(yīng)用，模型可以頻繁更新，錯(cuò)誤的代價(jià)也不會(huì)太高。因此，這些應(yīng)用領(lǐng)域非常適合結(jié)合持續(xù)性能監(jiān)控的黑盒技術(shù)，這也是近年來(lái)機(jī)器學(xué)習(xí)得以快速發(fā)展的基礎(chǔ)。

然而，近年來(lái)機(jī)器學(xué)習(xí)被應(yīng)用于醫(yī)療健康、工業(yè)制造、金融和司法等高風(fēng)險(xiǎn)領(lǐng)域，在這些領(lǐng)域，機(jī)器學(xué)習(xí)算法犯下的錯(cuò)誤可能會(huì)帶來(lái)巨大的風(fēng)險(xiǎn)。尤其是當(dāng)算法預(yù)測(cè)在決策過(guò)程中發(fā)揮重要作用時(shí)，錯(cuò)誤會(huì)對(duì)安全、道德和正義等社會(huì)問(wèn)題產(chǎn)生重大后果。因此，缺乏穩(wěn)定性、可解釋性和公平保障是當(dāng)今機(jī)器學(xué)習(xí)中亟需解決的最關(guān)鍵和最緊迫的議題。

虛假相關(guān)性：風(fēng)險(xiǎn)的主要來(lái)源

如圖所示，相關(guān)性有三種來(lái)源，即由因果性導(dǎo)致的相關(guān)性、干擾變量導(dǎo)致的相關(guān)性、由樣本選擇偏差導(dǎo)致的相關(guān)性。在這三種相關(guān)性中，只有由因果性導(dǎo)致的相關(guān)性是可以保證在各種環(huán)境下穩(wěn)定成立、且可以被解釋的。而目前的神經(jīng)網(wǎng)絡(luò)模型并沒(méi)有對(duì)特征是否存在因果性加以區(qū)分，這也是導(dǎo)致模型性能不穩(wěn)定的重要原因。

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

（相關(guān)性的三種來(lái)源）

論文進(jìn)一步論述了機(jī)器學(xué)習(xí)可以避免由因果推理的基本問(wèn)題引起的可驗(yàn)證性等挑戰(zhàn)和局限性，并認(rèn)為，機(jī)器學(xué)習(xí)和因果推理之間應(yīng)該形成共識(shí)基礎(chǔ)，穩(wěn)定學(xué)習(xí)的框架正是實(shí)現(xiàn)這一目標(biāo)的路徑之一。

穩(wěn)定學(xué)習(xí)：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)

論文還進(jìn)一步闡述了穩(wěn)定學(xué)習(xí)的定位與發(fā)展脈絡(luò)，并比較了與常見(jiàn)的獨(dú)立同分布模型和遷移學(xué)習(xí)模型的異同：

重磅！Nature子刊發(fā)布穩(wěn)定學(xué)習(xí)觀點(diǎn)論文：建立因果推理和機(jī)器學(xué)習(xí)的共識(shí)基礎(chǔ)

獨(dú)立同分布模型的訓(xùn)練和測(cè)試都在相同分布的數(shù)據(jù)下完成，測(cè)試目標(biāo)是提升模型在測(cè)試集上的準(zhǔn)確度，對(duì)測(cè)試集環(huán)境有較高的要求；
遷移學(xué)習(xí)同樣期望提升模型在測(cè)試集上的準(zhǔn)確度，雖然允許測(cè)試集的樣本分布與訓(xùn)練集不同，但要求測(cè)試集樣本分布已知；
穩(wěn)定學(xué)習(xí)無(wú)需測(cè)試數(shù)據(jù)集與訓(xùn)練數(shù)據(jù)來(lái)自同一分布，并且不假設(shè)測(cè)試數(shù)據(jù)分布已知。測(cè)試目標(biāo)是在保證模型平均準(zhǔn)確度的前提下，降低模型性能在各種不同樣本分布下的準(zhǔn)確率方差。與上述學(xué)習(xí)模式相比，穩(wěn)定學(xué)習(xí)的目標(biāo)更接近現(xiàn)實(shí)的問(wèn)題設(shè)置，理論上，穩(wěn)定學(xué)習(xí)可以在不同分布的測(cè)試集下都有較好的性能表現(xiàn)。

結(jié)論

文章最后提出，如果我們希望機(jī)器學(xué)習(xí)算法能被進(jìn)一步應(yīng)用，需要解決穩(wěn)定性、可解釋性和公平性問(wèn)題，而這些問(wèn)題是當(dāng)今學(xué)習(xí)范式的根本局限，需要從根本上加以解決。盡管業(yè)內(nèi)對(duì)預(yù)測(cè)、相關(guān)性和因果關(guān)系的基礎(chǔ)仍存在爭(zhēng)論，因果推理，尤其是在觀察研究中所取得的一些最新進(jìn)展已經(jīng)可以為機(jī)器學(xué)習(xí)提供更多的見(jiàn)解和理論支持。作為一種新的學(xué)習(xí)范式，穩(wěn)定學(xué)習(xí)試圖結(jié)合這兩個(gè)方向之間的共識(shí)基礎(chǔ)。如何合理地放松嚴(yán)格的假設(shè)，以匹配更多具有挑戰(zhàn)性的真實(shí)應(yīng)用場(chǎng)景，并在不犧牲預(yù)測(cè)能力的情況下使機(jī)器學(xué)習(xí)更可信，是未來(lái)穩(wěn)定學(xué)習(xí)需要解決的關(guān)鍵問(wèn)題。

論文完整內(nèi)容參見(jiàn)Nature網(wǎng)站：https://www.nature.com/articles/s42256-022-00445-z

作者簡(jiǎn)介

崔鵬

清華大學(xué)長(zhǎng)聘副教授。于2010年獲得清華大學(xué)博士學(xué)位，研究興趣包括大數(shù)據(jù)環(huán)境下的因果推理與穩(wěn)定預(yù)測(cè)、網(wǎng)絡(luò)表征學(xué)習(xí)，及其在智慧醫(yī)療、商業(yè)決策等場(chǎng)景中的應(yīng)用。從2016年起，崔鵬與團(tuán)隊(duì)開(kāi)始深入研究如何將因果推理與機(jī)器學(xué)習(xí)相結(jié)合，并最終形成了“穩(wěn)定學(xué)習(xí)”（Stable Learning）的研究方向。他在數(shù)據(jù)挖掘和多媒體領(lǐng)域的著名會(huì)議和期刊上發(fā)表了150多篇論文，并先后獲得7項(xiàng)國(guó)際會(huì)議及期刊最佳論文獎(jiǎng)。曾獲得CCF-IEEE CS青年科學(xué)家獎(jiǎng)，國(guó)家自然科學(xué)二等獎(jiǎng)，以及省部級(jí)一等獎(jiǎng)3項(xiàng)。目前是ACM杰出會(huì)員，CCF杰出會(huì)員以及IEEE高級(jí)會(huì)員。

Susan Athey

斯坦福大學(xué)商學(xué)院教授，美國(guó)科學(xué)院院士，美國(guó)藝術(shù)與科學(xué)院院士，美國(guó)經(jīng)濟(jì)學(xué)會(huì)主席，約翰·貝茨·克拉克獎(jiǎng)（該獎(jiǎng)項(xiàng)也被視為諾內(nèi)爾經(jīng)濟(jì)學(xué)獎(jiǎng)的風(fēng)向標(biāo)）的第一位女性獲得者。她曾在微軟擔(dān)任咨詢首席經(jīng)濟(jì)學(xué)家六年，目前是斯坦福大學(xué)斯坦福經(jīng)濟(jì)政策研究所高級(jí)研究員、以人為本人工智能研究所副主任、 Golub Capital 社會(huì)影響實(shí)驗(yàn)室主任。Susan Athey本科期間在杜克大學(xué)同時(shí)主修經(jīng)濟(jì)學(xué)、數(shù)學(xué)與計(jì)算機(jī)科學(xué)三個(gè)專業(yè)，目前專注于數(shù)字化經(jīng)濟(jì)學(xué)、市場(chǎng)設(shè)計(jì)以及計(jì)量經(jīng)濟(jì)學(xué)與機(jī)器學(xué)習(xí)領(lǐng)域的交叉領(lǐng)域研究，是因果領(lǐng)域的國(guó)際權(quán)威。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

我在思考中

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門(mén)文章