0
本文作者: 肖漫 | 2019-10-15 15:50 |
人工智能發(fā)展至今天,利用 AI 來(lái)分類圖片庫(kù)已經(jīng)不是什么稀奇的事情了。但是,圖片并不都是單一的個(gè)人自拍或是單一物體,而是包含多種背景要素,例如多人合影、風(fēng)景山水照等。那么,AI 是如何讓圖片分類器識(shí)別并做出決策將各種圖片進(jìn)行分類的呢?
針對(duì)這一問(wèn)題,國(guó)外媒體的相關(guān)報(bào)道通過(guò)對(duì)相關(guān)論文的解讀作出了解釋,雷鋒網(wǎng)對(duì)其進(jìn)行不改變?cè)獾木幾g。
【 圖片來(lái)源:Google 所有者:Google 】
人們通常會(huì)認(rèn)為 ,隨著 AI 系統(tǒng)復(fù)雜性的增加,它的可解釋性會(huì)變得越來(lái)越差。但是,研究人員開始用函數(shù)庫(kù)來(lái)挑戰(zhàn)這一想法,比如解釋深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)框架 PyTorch 是如何做決定的 Facebook 的 Captum、IBM 的 AI Explainability 360 工具包、以及微軟的 InterpretML。
為了使 AI 的決策更加透明,Google 和斯坦福的一個(gè)研究團(tuán)隊(duì)近期開發(fā)了一個(gè)機(jī)器學(xué)習(xí)模型——基于概念的自動(dòng)解釋(雷鋒網(wǎng)按: Automated Concept-based Explanation ,ACE),這個(gè)模型能夠自動(dòng)提取出“對(duì)人類有意義”的視覺概念,為模型的預(yù)測(cè)提供信息。
正如研究人員在其論文中解釋的那樣,大多數(shù)機(jī)器學(xué)習(xí)解釋方法會(huì)改變單個(gè)特征(例如像素、超級(jí)像素、單詞向量),去接近于每一個(gè)目標(biāo)模型。不過(guò),這是一種不完美的方法,因?yàn)樗苋菀资艿揭恍┹斎胱兓挠绊?,哪怕是最小的變化?/p>
和大多數(shù)機(jī)器學(xué)習(xí)解釋方法形成對(duì)比的是 ACE 識(shí)別高級(jí)概念的方法:它在提取概念并確定每個(gè)概念重要性之前,會(huì)將一個(gè)訓(xùn)練過(guò)的分類器和一個(gè)類別的一組圖像作為輸入。具體來(lái)說(shuō),就是 ACE 片段圖像在將類似片段作為相同概念進(jìn)行分組,并將最重要的概念返回之前,有著多個(gè)決議去捕獲多個(gè)層次的紋理、對(duì)象部分以及對(duì)象。
為了測(cè)試 ACE 的魯棒性,該研究團(tuán)隊(duì)使用了 Google 的 Inception-V3 圖像分類器模型,讓其在 ImageNet 數(shù)據(jù)集上訓(xùn)練,并從數(shù)據(jù)集中的 1000 個(gè)類中選擇 100 個(gè)類的子集來(lái)應(yīng)用 ACE。
研究團(tuán)隊(duì)指出,被標(biāo)記為重要的概念往往是遵從人的直覺的,例如,在檢測(cè)警車時(shí),執(zhí)法部門的標(biāo)識(shí)比地面上的瀝青顯得更為重要。不過(guò),情況也不都是如此,在一些區(qū)別性不明顯的案例中就有所體現(xiàn)。比如,預(yù)測(cè)籃球圖像時(shí),更為重要的是球員的球衣,而不是籃球。
另外,研究人員表示,他們通過(guò)人類實(shí)驗(yàn)驗(yàn)證了其意義和一致性,并進(jìn)一步證實(shí)了 ACE 的確是攜帶著顯著的預(yù)測(cè)信號(hào)。同時(shí),研究人員還指出,他們的方法...自動(dòng)將輸入特性分組為高級(jí)概念;一些有意義的概念作為連貫的示例出現(xiàn),這對(duì)于正確預(yù)測(cè)它們所呈現(xiàn)的圖像非常重要。
值得一提的是,研究人員也承認(rèn)了 ACE 絕非是完美的,因?yàn)樗€難以有效地提取異常復(fù)雜或困難的概念。但是,他們認(rèn)為,ACE 對(duì)模型的學(xué)習(xí)相關(guān)性提供的洞見會(huì)促進(jìn)機(jī)器學(xué)習(xí)的安全使用。
雷鋒網(wǎng)注:本文編譯自 KYLE WIGGERS 發(fā)表在 venturebeat 上的文章。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。