1
這是一個悲傷的故事,你可能經歷過。
你又熱又渴,看到桌子上有一瓶看起來像水的東西,來不及思考,揭開瓶蓋喝了一大口。哦!漏!是油!
時間回到10秒前,我們重來一次。
這一次,額外的劇情是,你有一個看不慣的死敵和你一起住(這種情況在合租大軍中很容易出現),他放了一瓶類似水的不明液體在桌上。
你又進來了,有累又熱又渴,這一次你又端起來這瓶液體。這一次,你仔細分析了這種物質、形狀和體積,你利用曾經的斗爭經驗再次判斷,然后信心滿滿地做出了正確選擇,完美地躲避了這場惡作劇——一瓶100%純尿。
福音來了
如果我把這瓶看似是水的東西放置在傳統(tǒng)的計算機視覺模塊下分析,可以輕易識別出來它的成分。如果我手欠,非得手抓瓶子再來試一次,由于手指光榮出鏡,傳統(tǒng)的計算機視覺模塊突然無法識別了。但是,如果我機智地把系統(tǒng)升級,加入人工智能模塊,即所謂的深度學習技術,那么即使手指出鏡,這瓶液體也可以被識別出來。這就是在微小變化下,深度學習的好處——即使只能讀取部分數據,大部分圖像被遮蓋,也能正確識別。
深度學習,就像人們所熟知的神經網絡,受到大腦激勵,不斷增強學習識別物體的能力。以視覺識別為例,我們的大腦可以通過感官輸入獲得原始數據,同時進一步自主學習更高級別的特點。同樣,在深度學習中,原始數據從深度神經網絡中讀取,憑此學習如何識別物體。機器學習,從另一個角度而言,需要通過機器學習模塊,手動選擇特征進行處理。結果,這種處理過程耗時長,準確性受到人工錯誤的制約。深度學習則更復雜、精密、自主學習能力強,能保證高準確率及超快的處理速度。
網絡安全與圖像識別相似,99%以上的新威脅和惡意軟件實際上來源于此前已經存在的威脅和惡意軟件的輕微“突變”。據說,即便是那1%的完全嶄新的新威脅和惡意軟件,也只是已存危機的大量“突變”而已。但是,盡管如此,即使是那些最前沿的,結合使用動態(tài)分析及傳統(tǒng)機器學習的網絡安全技術,也在檢測大量新的惡意軟件上遭遇重重困難,結果就是各類企業(yè)和組織極易遭受數據泄露、數據盜竊、惡意軟件的扣押勒索和數據損壞。
福音來了,我們可以通過深度學習應用來解決這些問題,捍衛(wèi)網絡安全。
兩類老辦法"然并卵"
我們先簡單回顧下檢測惡意軟件方案的歷史。
基于簽名的解決方案是最古老的惡意軟件檢測形式,它們也被稱為傳統(tǒng)的解決方案。為了檢測惡意軟件,防病毒引擎將一個身份不明的代碼塊的內容與它的數據庫中已知的惡意軟件簽名相比較。如果與已知惡意軟件簽名不匹配,那么就要靠手動調整的啟發(fā)式算法來生成一個新的手工簽名,然后更新發(fā)布。
這個過程十分耗時,有時簽名是在初步檢測的數月后才發(fā)布。因此,這種檢測方法無法與時俱進,跟不上每天產生百萬個新的惡意軟件變種的節(jié)奏,這也導致了企業(yè)和組織容易受到新的及已經被檢測到卻沒有發(fā)布簽名的威脅襲擊。
用基于代碼行為特點的啟發(fā)式技術來識別惡意軟件,產生了基于行為的解決方案。該惡意軟件檢測技術分析了惡意軟件運行時的行為,而非針對惡意軟件代碼本身的硬編碼。這種惡意軟件檢測方法的主要限制是,它僅能在惡意行動已經開始時發(fā)現惡意軟件。結果,預防被推遲,有時甚至就是處理得太遲。
沙箱解決方案則是基于行為檢測方法的發(fā)展。這些解決方案在一個虛擬的環(huán)境中執(zhí)行惡意軟件,以確定該文件是否惡意,而非檢測運行時的行為指紋。雖然這種技術已被證明在檢測精度上相當有效,但是由于過程耗時長,因此實時保護成本高。此外,新類型的惡意代碼可以通過拖延執(zhí)行逃避沙箱檢測,從而構成新的挑戰(zhàn)。
深度學習檢測效果顯著
使用人工智能偵測惡意軟件的方法應運而生。
結合人工智能,打造更復雜的檢測能力是網絡安全解決方案演變之路上的最新一步?;跈C器學習的惡意軟件檢測方法應用更詳細的算法,根據手動工程的特點來判斷一個文件的行為是惡意還是合法。然而,這個過程費時長,需要大量人力在文件分級過程中來確定技術參數、變量或特點,在文件分類過程中的重點。此外,惡意軟件檢測率仍然離100%識別很遠。
人工智能的深度學習是機器學習的一個高級分支,也被稱為“神經網絡”,因為它與人類大腦的工作方式如出一轍。高級認知任務在人類大腦的外部皮層進行,而我們有數十億個的神經元,這些神經元可以通過各種類型的數據進行學習。由于深度神經網絡是機器學習中的第一算法單元,不需要手動工程特征,因此這是深度學習的偉大革命。不僅不需要手動工程,它們還可以通過對原始數據處理高層次特征進行處理,自主學習識別對象,這種方式和人類大腦通過感官輸入處理原始原始數據進行學習十分相似。
來,看我的手勢,完美!
當應用到網絡安全時,在沒有任何人工干預下,如預先告訴它這個文件是惡意還是合法的,深度學習的核心引擎一直在這種情況下不斷學習升級,在檢測首次發(fā)現的惡意軟件時,與傳統(tǒng)機器學習相比,基于深度學習的解決方案呈現出十分突破性的成果。
在基于公開已知的數據庫的端點的真正環(huán)境測試中,移動和APT惡意軟件的檢測率也十分顯著。例如,基于深度學習的解決方案對大幅和輕微修改的惡意代碼的檢測識別率超過99%。這些結果與深度學習在其他領域的表現是一致的,如計算機視覺、語音識別和文本理解。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。