丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給楊文
發(fā)送

0

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

本文作者: 楊文 2018-01-30 10:54
導(dǎo)語(yǔ):對(duì)抗樣本的攻和防

雷鋒網(wǎng)AI研習(xí)社按:對(duì)抗樣本是一類(lèi)被惡意設(shè)計(jì)來(lái)攻擊機(jī)器學(xué)習(xí)模型的樣本。它們與真實(shí)樣本的區(qū)別幾乎無(wú)法用肉眼分辨,但是卻會(huì)導(dǎo)致模型進(jìn)行錯(cuò)誤的判斷。本文就來(lái)大家普及一下對(duì)抗樣本的基礎(chǔ)知識(shí),以及如何做好對(duì)抗樣本的攻與防。

在近期雷鋒網(wǎng)AI研習(xí)社舉辦的線(xiàn)上公開(kāi)課上,來(lái)自清華大學(xué)的在讀博士生廖方舟分享了他們團(tuán)隊(duì)在 NIPS 2017 上一個(gè)對(duì)抗樣本攻防大賽中提到的兩個(gè)新方法,這兩個(gè)方法在大賽中分別獲得了攻擊方和防守方的第一名。點(diǎn)擊可視頻回放

廖方舟,清華大學(xué)化學(xué)系學(xué)士,生醫(yī)系在讀博士。研究方向?yàn)橛?jì)算神經(jīng)學(xué),神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺(jué)。參加多次 Kaggle 競(jìng)賽,是 Data Science Bowl 2017 冠軍,NIPS 2017 對(duì)抗樣本比賽冠軍。Kaggle 最高排名世界第10。

分享主題:

動(dòng)量迭代攻擊和高層引導(dǎo)去噪:產(chǎn)生和防御對(duì)抗樣本的新方法

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

分享內(nèi)容:

大家好,我是廖方舟,今天分享的主題是對(duì)抗樣本的攻和防。對(duì)抗樣本的存在會(huì)使得深度學(xué)習(xí)在安全敏感性領(lǐng)域的應(yīng)用收到威脅,如何對(duì)其進(jìn)行有效的防御是很重要的研究課題。 我將從以下幾方面做分享。

  • 什么是對(duì)抗樣本

  • 傳統(tǒng)的攻擊方法

  • 傳統(tǒng)的防守方法

  • 動(dòng)量迭代攻擊

  • 去噪方法

  • 高層引導(dǎo)去噪方法

什么是對(duì)抗樣本

對(duì)抗樣本的性質(zhì)不僅僅是圖片所擁有的性質(zhì),也不僅僅是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)獨(dú)有的性質(zhì)。因此它是把機(jī)器學(xué)習(xí)模型應(yīng)用到一些安全敏感性領(lǐng)域里的一個(gè)障礙。

當(dāng)時(shí),機(jī)器學(xué)習(xí)大牛Good fellow找了些船、車(chē)圖片,他想逐漸加入一些特征,讓模型對(duì)這些船,車(chē)的識(shí)別逐漸變成飛機(jī),到最后發(fā)現(xiàn)人眼觀測(cè)到的圖片依然是船、車(chē),但模型已經(jīng)把船、車(chē)當(dāng)做飛機(jī)。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

我們之前的工作發(fā)現(xiàn)樣本不僅僅是對(duì)最后的預(yù)測(cè)產(chǎn)生誤導(dǎo),對(duì)特征的提取也產(chǎn)生誤導(dǎo)。這是一個(gè)可視化的過(guò)程。

當(dāng)把一個(gè)正常樣本放到神經(jīng)網(wǎng)絡(luò)后,神經(jīng)元會(huì)專(zhuān)門(mén)觀察鳥(niǎo)的頭部,但我們給它一些對(duì)抗樣本,這些對(duì)抗樣本也都全部設(shè)計(jì)為鳥(niǎo),就發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)提取出來(lái)的特征都是亂七八糟,和鳥(niǎo)頭沒(méi)有太大的關(guān)系。也就是說(shuō)欺騙不是從最后才發(fā)生的,欺騙在從模型的中間就開(kāi)始產(chǎn)生的。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

下圖是最簡(jiǎn)單的攻擊方法——Fast Gradient Sign Method 

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

除了FGSM單步攻擊的方法,它的一個(gè)延伸就是多步攻擊,即重復(fù)使用FGSM。由于有一個(gè)最大值的限制,所以單步的步長(zhǎng)也會(huì)相應(yīng)縮小。比如這里有一個(gè)攻擊三步迭代,每一步迭代的攻擊步長(zhǎng)也會(huì)相應(yīng)縮小。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

產(chǎn)生圖片所用的CNN和需要攻擊的CNN是同一個(gè),我們稱(chēng)為白盒攻擊。與之相反的攻擊類(lèi)型稱(chēng)為黑盒攻擊,也就是對(duì)需要攻擊的模型一無(wú)所知。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

以上所說(shuō)的都是Non Targeted, 只要最后得到的目標(biāo)預(yù)測(cè)不正確就可以了。另一種攻擊Targeted FGSM,目標(biāo)是不僅要分的不正確,而且還要分到指定的類(lèi)型。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

一個(gè)提高黑盒攻擊成功率行之有效的辦法,是攻擊一個(gè)集合。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

而目前為止一個(gè)行之有效的防守策略就是對(duì)抗訓(xùn)練。在模型訓(xùn)練過(guò)程中,訓(xùn)練樣本不僅僅是干凈樣本,而是干凈樣本加上對(duì)抗樣本。隨著模型訓(xùn)練越來(lái)越多,一方面干凈圖片的準(zhǔn)確率會(huì)增加,另一方面,對(duì)對(duì)抗樣本的魯棒性也會(huì)增加。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

下面簡(jiǎn)單介紹一下NIPS 2017 上的這個(gè)比賽規(guī)則

比賽結(jié)構(gòu)

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

兩個(gè)限制條件:容忍范圍不能太大;不能花太長(zhǎng)時(shí)間產(chǎn)生一個(gè)對(duì)抗樣本,或者防守一個(gè)對(duì)抗樣本

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

FGSM算法結(jié)果

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

圖中綠色模型為攻擊范圍,最后兩欄灰色是黑盒模型,隨著迭代數(shù)量的增加, 攻擊成功率反而上升。這就給攻擊造成了難題。

我們解決的辦法就是在迭代與迭代中間加入動(dòng)量

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

加入動(dòng)量之后,白盒攻擊變強(qiáng)了,而且對(duì)黑盒模型攻擊的成功率也大大提升了。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

總結(jié):

以前方法(iterative attack)的弱點(diǎn)是在迭代數(shù)量增多的情況下,它們的遷移性,也就是黑盒攻擊性會(huì)減弱,在我們提出加入動(dòng)量之后,這個(gè)問(wèn)題得到了解決,可以很放心使用非常多的迭代數(shù)量進(jìn)行攻擊。

在NIPS 2017 比賽上得到最高的分?jǐn)?shù)

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

需要提到的一點(diǎn),上面提到的都是Non-targeted , 在Targeted攻擊里面,這個(gè)策略有所不同。在Targeted攻擊里面,基本沒(méi)有觀察到遷移性,也就是黑盒成功率一直很差,即便是加入動(dòng)量,它的遷移程度也非常差。

下面講一下防守

首先想到的就是去噪聲,我們嘗試用了一些傳統(tǒng)的去噪方法(median filter 、BM3D)效果都不好。之后我們嘗試使用了兩個(gè)不同架構(gòu)的神經(jīng)網(wǎng)絡(luò)去噪。一個(gè)是 Denoising Autoencoder,另一個(gè)是Denoising Additive U-Net。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

我們的訓(xùn)練樣本是從ImageNet數(shù)據(jù)集中取了三萬(wàn)張圖片 ,使用了七個(gè)不同的攻擊方法對(duì)三萬(wàn)張圖片攻擊,得到21萬(wàn)張對(duì)抗樣本圖片以及三萬(wàn)張對(duì)應(yīng)的原始圖片。除了訓(xùn)練集,我們還做了兩個(gè)測(cè)試集。一個(gè)白盒攻擊測(cè)試集和一個(gè)黑盒攻擊測(cè)試集。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

訓(xùn)練效果

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

我們發(fā)現(xiàn)經(jīng)過(guò)去噪以后,正確率反而有點(diǎn)下降。我們分析了一下原因,輸入一個(gè)干凈圖片,再輸入一個(gè)對(duì)抗圖片,然后計(jì)算每一層網(wǎng)絡(luò)在這兩張圖片上表示的差距,我們發(fā)現(xiàn)這個(gè)差距是逐層放大的。

圖中藍(lán)線(xiàn)發(fā)現(xiàn)放大的幅度非常大,圖中紅線(xiàn)是去噪過(guò)后的圖片,仍然在放大,導(dǎo)致最后還是被分錯(cuò)。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

為了解決這個(gè)問(wèn)題,我們提出了經(jīng)過(guò)改良后的網(wǎng)絡(luò) HGD

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

HGD 的幾個(gè)變種

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

和之前的方法相比,改良后的網(wǎng)絡(luò) HGD防守準(zhǔn)確率得到很大的提升

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

HGD 有很好的遷移性

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

最后比賽中,我們集成了四個(gè)不同的模型,以及訓(xùn)練了他們各自的去噪, ,最終把它們合并起來(lái)提交了上去。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

HGD網(wǎng)絡(luò)總結(jié)

優(yōu)點(diǎn):

  • 效果顯著比其他隊(duì)伍的模型好。

  • 比前人的方法使用更少的訓(xùn)練圖片和更少的訓(xùn)練時(shí)間。

  • 可遷移。

缺點(diǎn):

  • 還依賴(lài)于微小變化的可測(cè)量

  • 問(wèn)題并沒(méi)有完全解決

  • 仍然會(huì)受到白盒攻擊,除非假設(shè)對(duì)手不知道HGD的存在

雷鋒網(wǎng)AI慕課學(xué)院提供了本次分享的視頻回放:http://www.mooc.ai/open/course/383

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

清華大學(xué)廖方舟:產(chǎn)生和防御對(duì)抗樣本的新方法 | 分享總結(jié)

分享:
相關(guān)文章

編輯&記者

AI科技評(píng)論員,微信:yeohandwin
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)