丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給隔壁王大喵
發(fā)送

0

模型可解釋性差?你考慮了各種不確定性了嗎?

本文作者: 隔壁王大喵 編輯:楊曉凡 2018-08-08 09:41
導(dǎo)語:本文作者介紹了數(shù)據(jù)科學(xué)中模型不確定性的問題,并探索了如何利用不確定性來調(diào)試模型。

雷鋒網(wǎng) AI 科技評論按:本文作者是來自 Taboola 的數(shù)據(jù)科學(xué)家 Inbar Naor,她的研究領(lǐng)域是探索深度學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用,在本文作者介紹了數(shù)據(jù)科學(xué)中模型不確定性的問題,并探索了如何利用不確定性來調(diào)試模型。雷鋒網(wǎng) AI 科技評論根據(jù)原文進(jìn)行了編譯。

模型可解釋性差?你考慮了各種不確定性了嗎?

當(dāng)深度神經(jīng)網(wǎng)絡(luò)(DNN)變得越來越強(qiáng)大的時候,它們的復(fù)雜性也在一并與日俱增,而這種復(fù)雜性也給研究員帶來了一系列新的挑戰(zhàn),其中就包括模型的可解釋性。

可解釋性對于構(gòu)建更加強(qiáng)大且具有抵抗對抗性攻擊能力的模型而言至關(guān)重要。此外,當(dāng)我們需要為一個全新的、還未得到深入研究的領(lǐng)域設(shè)計模型時,如果我們能夠解釋模型的運(yùn)行機(jī)制,這將有助于我們更好地去設(shè)計和分析模型。

在過去幾年里,因?yàn)橐庾R到了模型可解釋性的重要作用,研究員們已經(jīng)研究出了好幾種方法,并且在去年的 NIPS 會議中也有一個專門的研究展示會(workshop) 負(fù)責(zé)討論相關(guān)主題。提供模型可解釋性的方法包括:

不過在開始深入探究如何使用不確定性來調(diào)試和解釋模型之前,讓我們先來理解為什么不確定性如此重要。

為何我們需要關(guān)注不確定性?

一個顯著的例子就是高風(fēng)險應(yīng)用。假設(shè)你正在設(shè)計一個模型,用以輔助醫(yī)生決定患者的最佳治療方案。在這種情況下,我們不僅要關(guān)注模型預(yù)測結(jié)果的準(zhǔn)確性,還要關(guān)注模型對預(yù)測結(jié)果的確定性程度。如果結(jié)果的不確定性過高,那么醫(yī)生應(yīng)該進(jìn)行慎重考慮。

自動駕駛汽車是另外一個有趣的例子。當(dāng)模型不確定道路上是否有行人時,我們可以使用此信息來減慢車速或者是觸發(fā)警報,以便于駕駛員進(jìn)行處理。

不確定性也可以幫助我們解決因?yàn)閿?shù)據(jù)樣本(Data examples)而導(dǎo)致的問題。如果模型沒有學(xué)習(xí)過與目標(biāo)樣本相似的數(shù)據(jù),那么它對目標(biāo)樣本的預(yù)測結(jié)果最好是「對不起,我不清楚」。這樣就可以避免諸如谷歌照片之前將非洲裔美國人誤認(rèn)為大猩猩這樣的尷尬錯誤。這種錯誤有時是因?yàn)橛?xùn)練集不夠多樣化而導(dǎo)致的。

不確定性的最后一種應(yīng)用方式是,它可以作為從業(yè)者調(diào)試模型的工具,而這也是本文的重點(diǎn)。我們稍后會深入探討這個問題,但是在這之前,讓我們先來了解一下不同類型的不確定性。

不確定性的類型

當(dāng)前存在有不同類型的不確定性和建模方式,并且每種都有不同的用途。

模型不確定性,也就是認(rèn)知不確定性(Epistemic uncertainty):假設(shè)你只有一個數(shù)據(jù)點(diǎn),并且你還想知道哪種線性模型最能解釋你的數(shù)據(jù)。但實(shí)際情況是,這時你是無法確定哪條線是正確的——我們需要更多的數(shù)據(jù)!

模型可解釋性差?你考慮了各種不確定性了嗎?

左邊:數(shù)據(jù)不足導(dǎo)致了高度不確定性。右邊:數(shù)據(jù)越多不確定性越小。

認(rèn)知不確定性解釋了模型參數(shù)的不確定性。我們并不確定哪種模型權(quán)重能夠最好地描述數(shù)據(jù),但是擁有更多的數(shù)據(jù)卻能降低這種不確定性。這種不確定性在高風(fēng)險應(yīng)用和處理小型稀疏數(shù)據(jù)時非常重要。

模型可解釋性差?你考慮了各種不確定性了嗎?

舉個例子,假設(shè)你想要建立一個能夠判斷輸入圖像中的動物是否有可能會吃掉你的模型。然后你的模型只在包含了獅子和長頸鹿的數(shù)據(jù)集上進(jìn)行訓(xùn)練,而現(xiàn)在給出一張僵尸的圖片作為輸入。由于該模型沒有學(xué)習(xí)過僵尸的圖片,因此預(yù)測結(jié)果的不確定性會很高。這種不確定性屬于模型的結(jié)果,然后如果你在數(shù)據(jù)集中給出了更多的僵尸圖片,那么模型的不確定性將會降低。

數(shù)據(jù)不確定性或者稱為隨機(jī)不確定性(Aleatoric uncertainty),指的是觀測中固有的噪音。有時事件本身就是隨機(jī)的,所以在這種情況下,獲取更多的數(shù)據(jù)對我們并沒有幫助,因?yàn)樵肼晫儆跀?shù)據(jù)固有的。

為了理解這一點(diǎn),讓我們回到判別食肉動物的模型中。我們的模型可以判斷出一張圖像中存在獅子,因此會預(yù)測出你可能被吃掉。但是,如果獅子現(xiàn)在并不餓呢?這種不確定性就來自于數(shù)據(jù)。另一個例子則是,有兩條看起來一樣的蛇,但是其中一條有毒,另一條則沒有毒。

隨機(jī)不確定性可以分為兩類:

  1. 同方差不確定性(Homoscedastic uncertainty):這時所有輸入具有相同的不確定性。

  2. 異方差不確定性(Heteroscedastic uncertainty):這種不確定性取決于具體的輸入數(shù)據(jù)。例如,對于預(yù)測圖像中深度信息的模型,毫無特征的平面墻(Featureless wall)將比擁有強(qiáng)消失線(Vanishing lines)的圖像具有更高的不確定性。

測量不確定性(Measurement uncertainty):另一個不確定性的來源是測量本身。當(dāng)測量存在噪聲時,不確定性將增加。在上述判別食肉動物的模型中,如果某些圖像是通過質(zhì)量較差的攝像機(jī)拍攝的話,那么就有可能會損害模型的置信度?;蛘咴谂臄z一只憤怒河馬的過程中,由于我們是邊跑邊拍的,結(jié)果導(dǎo)致了成像模糊。

標(biāo)簽噪聲(Noisy labels):在監(jiān)督學(xué)習(xí)中我們使用標(biāo)簽來訓(xùn)練模型。而如果標(biāo)簽本身帶有噪聲,那么不確定性也會增加。

不過當(dāng)前也存在許多方法可以實(shí)現(xiàn)對各種類型的不確定性進(jìn)行建模。這些方法將在本系列的后續(xù)文章中進(jìn)行介紹?,F(xiàn)在,假設(shè)有一個黑盒模型暴露了自己對預(yù)測結(jié)果的不確定性,那我們該如果借助這點(diǎn)來調(diào)試模型呢?

讓我們以 Taboola 中的一個模型為例,該模型可用于預(yù)測用戶點(diǎn)擊某個推薦內(nèi)容的可能性。

使用不確定性調(diào)試模型

該模型具有許多由嵌入向量表示的分類特征,然而它卻難以學(xué)習(xí)稀有值的通用嵌入向量(Generalized embedding)。解決此問題的常用方法是,使用特殊的 Out of  Vocabulary(OOV) 嵌入向量。

想想一篇文章的廣告客戶,如果所有稀有的廣告客戶都共享同一個 OOV 嵌入向量,那么從模型的角度來看,它們基本上就是同一個廣告客戶。此 OOV 廣告客戶有許多不同的商品,每個商品都有不同的點(diǎn)擊通過率(CTR)。如果我們僅使用廣告客戶作為點(diǎn)擊通過率的預(yù)測因子,那么 OOV 將產(chǎn)生很高的不確定性。

為了驗(yàn)證模型輸出 OOV 的高度不確定性,我們采用了驗(yàn)證集并將所有廣告客戶嵌入向量轉(zhuǎn)換為 OOV。接下來,我們檢查了向量轉(zhuǎn)換前后模型的不確定性。正如預(yù)期那樣,由于向量的轉(zhuǎn)換,模型的不確定性增加了。如果給予信息豐富的廣告客戶嵌入向量,該模型的不確定性將降低。

模型可解釋性差?你考慮了各種不確定性了嗎?

我們可以針對不同的特征重復(fù)這一點(diǎn),然后找出那些在采用 OOV 嵌入向量替換時導(dǎo)致較低不確定性的特征。這些特征都是不提供信息的,或者是因?yàn)槲覀儗⑺鼈兲峁┙o模型的方式不對。

我們甚至可以采用更精細(xì)的粒度:某些廣告客戶在不同商品的點(diǎn)擊通過率之間存在著較高的可變性,而其他廣告客戶的點(diǎn)擊通過率則大致相同。我們希望該模型對第一類廣告客戶具有更高的不確定性。因此,一種有用的分析策略是,關(guān)注廣告客戶中不確定性和點(diǎn)擊通過率可變性之間的相關(guān)性。如果相關(guān)性不是正的,則意味著模型未能了解與每個廣告客戶相關(guān)聯(lián)的不確定性。該工具允許我們了解訓(xùn)練過程或模型架構(gòu)中是否出了問題,并指示我們是否應(yīng)該進(jìn)一步調(diào)試它。

我們可以執(zhí)行類似的分析,然后看看與特定事項(xiàng)相關(guān)的不確定性是否會減少我們展示它的次數(shù)(即向更多的用戶/地方展示)。同樣,我們希望模型變得更加確定,如果模型依然不確定,我們將繼續(xù)調(diào)試。

另一個很酷的例子就是標(biāo)題特征:帶有罕見詞匯的獨(dú)特標(biāo)題應(yīng)該會帶來很高的模型不確定性。這是由于模型缺乏相關(guān)學(xué)習(xí)經(jīng)驗(yàn)的結(jié)果。我們可以從驗(yàn)證集中找出那些含有罕見詞匯的標(biāo)題,并估計模型在這些標(biāo)題上的不確定性。然后我們將使用其中一個標(biāo)題重新訓(xùn)練模型,再觀察模型在這些標(biāo)題上的不確定性是否有所降低。從下面圖表中我們能夠獲得更好的了解。

模型可解釋性差?你考慮了各種不確定性了嗎?

結(jié)束語

不確定性在許多領(lǐng)域都是一個大問題。在特定任務(wù)中明晰問題屬于哪種類型的不確定性很重要的。一旦你知道如何建模,就可以通過各種方式使用它們。在這篇文章中,我們討論了如何使用它們來調(diào)試模型。在下一篇文章中,我們將討論從模型中獲得不確定性估計的不同方法。

Via 《Using Uncertainty to Interpret your Model》,由雷鋒網(wǎng) AI 科技評論編譯。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

模型可解釋性差?你考慮了各種不確定性了嗎?

分享:
相關(guān)文章

知情人士

我也是個旅途的浪人
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說