如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件

本文作者：李勤

2016-09-08 10:03

導(dǎo)語：基于深度學(xué)習(xí)的解決方案對大幅和輕微修改的惡意代碼的檢測識別率超過99%。

這是一個悲傷的故事，你可能經(jīng)歷過。

你又熱又渴，看到桌子上有一瓶看起來像水的東西，來不及思考，揭開瓶蓋喝了一大口。哦！漏！是油！

時間回到10秒前，我們重來一次。

這一次，額外的劇情是，你有一個看不慣的死敵和你一起?。ㄟ@種情況在合租大軍中很容易出現(xiàn)），他放了一瓶類似水的不明液體在桌上。

你又進(jìn)來了，有累又熱又渴，這一次你又端起來這瓶液體。這一次，你仔細(xì)分析了這種物質(zhì)、形狀和體積，你利用曾經(jīng)的斗爭經(jīng)驗再次判斷，然后信心滿滿地做出了正確選擇，完美地躲避了這場惡作劇——一瓶100%純尿。

如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件

福音來了

如果我把這瓶看似是水的東西放置在傳統(tǒng)的計算機(jī)視覺模塊下分析，可以輕易識別出來它的成分。如果我手欠，非得手抓瓶子再來試一次，由于手指光榮出鏡，傳統(tǒng)的計算機(jī)視覺模塊突然無法識別了。但是，如果我機(jī)智地把系統(tǒng)升級，加入人工智能模塊，即所謂的深度學(xué)習(xí)技術(shù)，那么即使手指出鏡，這瓶液體也可以被識別出來。這就是在微小變化下，深度學(xué)習(xí)的好處——即使只能讀取部分?jǐn)?shù)據(jù)，大部分圖像被遮蓋，也能正確識別。

深度學(xué)習(xí)，就像人們所熟知的神經(jīng)網(wǎng)絡(luò)，受到大腦激勵，不斷增強(qiáng)學(xué)習(xí)識別物體的能力。以視覺識別為例，我們的大腦可以通過感官輸入獲得原始數(shù)據(jù)，同時進(jìn)一步自主學(xué)習(xí)更高級別的特點(diǎn)。同樣，在深度學(xué)習(xí)中，原始數(shù)據(jù)從深度神經(jīng)網(wǎng)絡(luò)中讀取，憑此學(xué)習(xí)如何識別物體。機(jī)器學(xué)習(xí)，從另一個角度而言，需要通過機(jī)器學(xué)習(xí)模塊，手動選擇特征進(jìn)行處理。結(jié)果，這種處理過程耗時長，準(zhǔn)確性受到人工錯誤的制約。深度學(xué)習(xí)則更復(fù)雜、精密、自主學(xué)習(xí)能力強(qiáng)，能保證高準(zhǔn)確率及超快的處理速度。

網(wǎng)絡(luò)安全與圖像識別相似，99%以上的新威脅和惡意軟件實際上來源于此前已經(jīng)存在的威脅和惡意軟件的輕微“突變”。據(jù)說，即便是那1%的完全嶄新的新威脅和惡意軟件，也只是已存危機(jī)的大量“突變”而已。但是，盡管如此，即使是那些最前沿的，結(jié)合使用動態(tài)分析及傳統(tǒng)機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)安全技術(shù)，也在檢測大量新的惡意軟件上遭遇重重困難，結(jié)果就是各類企業(yè)和組織極易遭受數(shù)據(jù)泄露、數(shù)據(jù)盜竊、惡意軟件的扣押勒索和數(shù)據(jù)損壞。

福音來了，我們可以通過深度學(xué)習(xí)應(yīng)用來解決這些問題，捍衛(wèi)網(wǎng)絡(luò)安全。

兩類老辦法"然并卵"

我們先簡單回顧下檢測惡意軟件方案的歷史。

基于簽名的解決方案是最古老的惡意軟件檢測形式，它們也被稱為傳統(tǒng)的解決方案。為了檢測惡意軟件，防病毒引擎將一個身份不明的代碼塊的內(nèi)容與它的數(shù)據(jù)庫中已知的惡意軟件簽名相比較。如果與已知惡意軟件簽名不匹配，那么就要靠手動調(diào)整的啟發(fā)式算法來生成一個新的手工簽名，然后更新發(fā)布。

這個過程十分耗時，有時簽名是在初步檢測的數(shù)月后才發(fā)布。因此，這種檢測方法無法與時俱進(jìn)，跟不上每天產(chǎn)生百萬個新的惡意軟件變種的節(jié)奏，這也導(dǎo)致了企業(yè)和組織容易受到新的及已經(jīng)被檢測到卻沒有發(fā)布簽名的威脅襲擊。

用基于代碼行為特點(diǎn)的啟發(fā)式技術(shù)來識別惡意軟件，產(chǎn)生了基于行為的解決方案。該惡意軟件檢測技術(shù)分析了惡意軟件運(yùn)行時的行為，而非針對惡意軟件代碼本身的硬編碼。這種惡意軟件檢測方法的主要限制是，它僅能在惡意行動已經(jīng)開始時發(fā)現(xiàn)惡意軟件。結(jié)果，預(yù)防被推遲，有時甚至就是處理得太遲。

如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件

沙箱解決方案則是基于行為檢測方法的發(fā)展。這些解決方案在一個虛擬的環(huán)境中執(zhí)行惡意軟件，以確定該文件是否惡意，而非檢測運(yùn)行時的行為指紋。雖然這種技術(shù)已被證明在檢測精度上相當(dāng)有效，但是由于過程耗時長，因此實時保護(hù)成本高。此外，新類型的惡意代碼可以通過拖延執(zhí)行逃避沙箱檢測，從而構(gòu)成新的挑戰(zhàn)。

深度學(xué)習(xí)檢測效果顯著

使用人工智能偵測惡意軟件的方法應(yīng)運(yùn)而生。

結(jié)合人工智能，打造更復(fù)雜的檢測能力是網(wǎng)絡(luò)安全解決方案演變之路上的最新一步?；跈C(jī)器學(xué)習(xí)的惡意軟件檢測方法應(yīng)用更詳細(xì)的算法，根據(jù)手動工程的特點(diǎn)來判斷一個文件的行為是惡意還是合法。然而，這個過程費(fèi)時長，需要大量人力在文件分級過程中來確定技術(shù)參數(shù)、變量或特點(diǎn)，在文件分類過程中的重點(diǎn)。此外，惡意軟件檢測率仍然離100%識別很遠(yuǎn)。

人工智能的深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個高級分支，也被稱為“神經(jīng)網(wǎng)絡(luò)”，因為它與人類大腦的工作方式如出一轍。高級認(rèn)知任務(wù)在人類大腦的外部皮層進(jìn)行，而我們有數(shù)十億個的神經(jīng)元，這些神經(jīng)元可以通過各種類型的數(shù)據(jù)進(jìn)行學(xué)習(xí)。由于深度神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)中的第一算法單元，不需要手動工程特征，因此這是深度學(xué)習(xí)的偉大革命。不僅不需要手動工程，它們還可以通過對原始數(shù)據(jù)處理高層次特征進(jìn)行處理，自主學(xué)習(xí)識別對象，這種方式和人類大腦通過感官輸入處理原始原始數(shù)據(jù)進(jìn)行學(xué)習(xí)十分相似。

來，看我的手勢，完美！

如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件

當(dāng)應(yīng)用到網(wǎng)絡(luò)安全時，在沒有任何人工干預(yù)下，如預(yù)先告訴它這個文件是惡意還是合法的，深度學(xué)習(xí)的核心引擎一直在這種情況下不斷學(xué)習(xí)升級，在檢測首次發(fā)現(xiàn)的惡意軟件時，與傳統(tǒng)機(jī)器學(xué)習(xí)相比，基于深度學(xué)習(xí)的解決方案呈現(xiàn)出十分突破性的成果。

在基于公開已知的數(shù)據(jù)庫的端點(diǎn)的真正環(huán)境測試中，移動和APT惡意軟件的檢測率也十分顯著。例如，基于深度學(xué)習(xí)的解決方案對大幅和輕微修改的惡意代碼的檢測識別率超過99%。這些結(jié)果與深度學(xué)習(xí)在其他領(lǐng)域的表現(xiàn)是一致的，如計算機(jī)視覺、語音識別和文本理解。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

李勤

編輯、作者

跟蹤互聯(lián)網(wǎng)安全、黑客、極客。微信：qinqin0511。

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章

如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件

如果深度學(xué)習(xí)能識別一杯尿，那它也能用來識別惡意軟件