0
本文作者: 郭佳 | 2017-12-24 11:19 |
無人機送貨、叮咚家庭助手、智慧物流、智慧供應鏈……近兩年,主打“技術開啟商業(yè)智能化”概念的京東,落地了眾多相關產品和實際應用,其中大數據成為重要的助推力。
當大數據滲透到越來越多的智能應用場景中時,安全的重要性不言而喻。比如,給我送貨的無人機會被劫持嗎?叮咚會不會被黑客利用花我的錢為他買東西?在12月21日舉行的京東安全峰會中,來自京東硅谷研發(fā)中心安全實驗室的架構師楊錦,對網絡安全攻防雙方使用 AI 的情況與應用,進行了講解。
楊錦此前曾在安全公司 FireEye 和谷歌都有過工作經歷,她為何選擇加盟京東?目前 AI 在攻防對抗中是一個怎樣的狀況?京東安全未來將在何處發(fā)力?在演講之后,她接受了雷鋒網的獨家專訪。
隨著近年來安全事件的頻發(fā),中國各大互聯網公司都在滿世界挖人。
此前,雷鋒網就報道過硅谷安全教父弓峰敏加盟滴滴的消息,其中提到弓峰敏團隊加盟原因,正是看上了滴滴所能提供的“大數據集”。
其團隊的技術要求與業(yè)務數據密切交互,而利用滴滴的框架和資源,團隊能更方便地去展開技術研究。
“擁有大數據”這個理由,同樣也是楊錦加入京東的原因之一。
京東目前有 2 億多的活躍用戶,16 萬第三方賣家,每天能產生 20 Petabytes的數據,這個數據無論從數量還是質量上來說,都很吸引人。
楊錦告訴雷鋒網,海量精準的大數據和豐富明確的應用場景,是 AI 在安全產生價值的兩個重要條件。無論是語音交互、圖像感知還是自然語言識別,其實都是通過機器對于大數據的學習。
與此同時,目前京東的智能音箱、無人車、無人機、智能供應鏈等新技術和產品也提供了明確的應用場景,這對于搞安全的人來說,非常有吸引力。
與國內近兩年興起的“安全熱”不同,由于美國的互聯網公司起步較早,遭受網絡攻擊的“經驗”也多,多年來對網絡安全都非常重視,積累了很多安全人才。楊錦說,在硅谷做安全很多就是中國人。從這點來說,隨著國內互聯網公司的快速發(fā)展,去硅谷“挖人”的也越來越多。
與此同時,由于國內龐大的市場和豐富的應用數據,尤其是人工智能方面的飛速發(fā)展,安全研究人員在這片“土壤”中,也能挖掘出更多 AI 安全的價值。
人工智能在攻防對抗中究竟處于什么階段?在峰會現場,楊錦以一個簡歷網站的反爬蟲為例,講了安全人員同黑產過招的幾個回合。
對于基礎的爬蟲行為,安全人員先開始只看對方的 IP、請求量、User Agent(用戶代理,簡稱 UA,是一個特殊字符串頭,使得服務器能夠識別用戶使用的操作系統及版本、CPU 類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言等信息),根據這三個特征制定規(guī)則,封掉異常行為。
黑產在判斷出這些簡單的防守規(guī)則后,改變了進攻套路。把 User Agent 偽裝成正常的百度爬蟲,讓防守方無法識別,并且通過 IP 代理的方式進行下一步的爬取。
接下來安全人員開始用頻率進行限制去攔截異常行為,并且寫了一個小腳本來把白名單加進去,來判斷爬蟲是不是來自百度的服務器。
隨著防守方的規(guī)則變化,黑產也繼續(xù)出新招,運用云端多IP的能力進行無規(guī)律的隨機慢爬,從而規(guī)避掉之前用頻率做防守的規(guī)則。
要防黑產這招,可能導致防守方對正常用戶的“誤殺”。所以防守方干脆推一個驗證碼,來識別你到底是人還是機器在做爬取的工作,但在這方面黑產也有相應的對策。
對于驗證碼的識別,雷鋒網此前也報道過一秒分辨出楊臣剛、王大治和孫楠,這個黑產居然用AI 來"打碼",當 AI 賦能黑產,智能爬蟲的威力也顯現出來。據楊錦透露,這些打碼平臺識別一次驗證碼的收費大概在0.15分左右,但有的打碼平臺在被端掉之前的 3 個月內做過 250 多億次的識別,收入可觀。
在攻防對抗快速升級的情況下,今天行之有效的防守措施,可能明天就失效了,沒有一種簡單方式是能夠一招制敵的。楊錦認為,對于防守方來說,未來使用 AI 深度學習的策略和框架,可以對攻擊行為進行全方位的識別,以至于達到實時辨別和封殺的效果。
在演講現場,楊錦重點提到去年 DARPA 舉辦的一場 CGC 比賽,雷鋒網此前也進行過報道走近首屆DARPA網絡安全大賽,其展現了基于AI的攻防對抗的,揭示出未來安全極有可能是攻防機器人之間利用AI的自主自動對抗。
簡單來說就是機器之間的CTF比賽,AI VS AI,通過一系列的可視化指標,機器展示了在快速識別和利用對手的弱點的同時,發(fā)現并修補有缺陷的代碼的能力。除了機器人之間的比賽,此后冠軍隊的 Mayhem 系統還參加了與真人戰(zhàn)隊的CTF比賽。
雖然在最后人機混合的CTF比賽,冠軍是由真人戰(zhàn)隊 CMU PPP 獲得,不過由 CMU PPP 主力參與開發(fā)的機器人 Mayhem 在比賽中還是打敗了其他幾支真人隊伍。
這次CGC比賽歐美安全圈引起的震動非常大,很多新聞媒體的報告都是以未來機器人是否能代替安全研究人員為焦點討論。
楊錦告訴雷鋒網,真正了解安全且能夠合理運用AI技術的安全研究人員,將有能力建造強大的機器系統,這才是AI安全威力升級關鍵所在,也是安全人員的事業(yè)發(fā)展方向。
由于AI技術對于攻防雙方來說都是新的賦能,如果不重視 AI 在防守方的發(fā)展,攻擊方在AI方面的進展會造成全新的威脅,而這些新威脅卻是傳統安全手段完全無法防范的。
在這種情況下,楊錦透露,AI安全已經成為京東安全重點發(fā)力的方向,目前主要在京東硅谷安全實驗室開展。
京東安全不同于 BAT 安全,由于有著充分大量的 B2C 情景,需要重視B端風險。 不同于傳統安全,AI安全關注京東新零售情景下的各項業(yè)務,以及IOT發(fā)展中的綜合風險問題,強調采用系統觀點,使AI技術與業(yè)務安全深入結合,為業(yè)務健康開展保駕護航。
AI安全的原理是,正常業(yè)務或內外部的技術行為都會留下數據信息痕跡,利用這些信息痕跡,采用AI等分析手段,可以揭示出數據背后的客觀事實,消除風險,對抗來自對手的AI攻擊。
楊錦所講的例子其實換句話說就是,當 AI 賦能攻擊方時,安全研究人員所面對的挑戰(zhàn)將會非常大。該如何應對?她從業(yè)務安全開始講起。
京東是一個電商平臺,涉及業(yè)務安全有8個主要流程,用戶的注冊、登錄、實名認證、商品瀏覽、下單、支付、評價和推廣營銷,這些領域都有攻擊方的窺探和攻擊。
以抵抗羊毛黨為例, 楊錦和團隊會先搜集信息,主要有對黑產的活動監(jiān)控信息,和對內部重要數據的聯合打通。通過自然語言理解以及各種聚類算法,抽出重要的信息。
在這個過程中,如何能提供給 AI 切實有效的數據是關鍵點,這時候同業(yè)務部門的配合就會非常重要。
在提取出黑產活動的信息后,他們會根據這些信息進行預警和攔截,在攔截完畢以后,會得到業(yè)務部門的反饋,此次攔截正確與否,再反饋到數據中進行打標,這時候的數據才可以運用到 AI 的算法中進行深度學習。通過這樣的循環(huán),來提高防守能力,攔截黑產訂單。
相比于人工,這樣可以達到智能化、完全化和零配制的目的。
楊錦說,類似這樣的方式同樣可以運用到防止對公司進行整體經營情況的窺探和利用。與黑產的相關的攻防對抗一直在不斷的演進當中。
今年5月,京東 CEO 劉強東曾在自己的媒體賬號上為即將上市的智能冰箱打 call 。其可通過內置雙攝像頭和圖像識別技術,知道冰箱內部的情況,并管理其中的食材,比如提醒食材的有效期,根據食材推薦食譜,學習用戶的飲食和購物習慣,并提供在京東快速下單購買材料的通道。
對此,財經作家吳曉波曾預言,未來大數據將是京東最值錢的資產。
窺一斑而知全豹,智能冰箱的背后,是京東在 AI 和 IOT 等方面的大力布局,當互聯網公司在掌握了用戶、商家、生產等方面的數據后,安全也稱為智能化環(huán)節(jié)中重要的一環(huán)。
在采訪楊錦時,她也告訴雷鋒網,目前京東在硅谷的研發(fā)中心、大數據、AI、智慧供應鏈、平臺產品研發(fā)、智慧物流、安全等部門都在密切協作, AI 使用于安全,已經是一個現實了,因為攻擊方已經在使用各種技術,防守方也在利用 AI 新的利器,與攻擊方進行較量。
部分內容來自2017京東安全峰會
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。