京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

本文作者：郭佳

2017-12-24 11:19

導(dǎo)語(yǔ)：擁有大數(shù)據(jù)和場(chǎng)景應(yīng)用優(yōu)勢(shì)的京東，將如何發(fā)揮 AI 在安全方面的作用？

無(wú)人機(jī)送貨、叮咚家庭助手、智慧物流、智慧供應(yīng)鏈……近兩年，主打“技術(shù)開(kāi)啟商業(yè)智能化”概念的京東，落地了眾多相關(guān)產(chǎn)品和實(shí)際應(yīng)用，其中大數(shù)據(jù)成為重要的助推力。

當(dāng)大數(shù)據(jù)滲透到越來(lái)越多的智能應(yīng)用場(chǎng)景中時(shí)，安全的重要性不言而喻。比如，給我送貨的無(wú)人機(jī)會(huì)被劫持嗎？叮咚會(huì)不會(huì)被黑客利用花我的錢為他買東西？在12月21日舉行的京東安全峰會(huì)中，來(lái)自京東硅谷研發(fā)中心安全實(shí)驗(yàn)室的架構(gòu)師楊錦，對(duì)網(wǎng)絡(luò)安全攻防雙方使用 AI 的情況與應(yīng)用，進(jìn)行了講解。

楊錦此前曾在安全公司 FireEye 和谷歌都有過(guò)工作經(jīng)歷，她為何選擇加盟京東？目前 AI 在攻防對(duì)抗中是一個(gè)怎樣的狀況？京東安全未來(lái)將在何處發(fā)力？在演講之后，她接受了雷鋒網(wǎng)的獨(dú)家專訪。

為何棄谷歌，選京東

隨著近年來(lái)安全事件的頻發(fā)，中國(guó)各大互聯(lián)網(wǎng)公司都在滿世界挖人。

此前，雷鋒網(wǎng)就報(bào)道過(guò)硅谷安全教父弓峰敏加盟滴滴的消息，其中提到弓峰敏團(tuán)隊(duì)加盟原因，正是看上了滴滴所能提供的“大數(shù)據(jù)集”。

其團(tuán)隊(duì)的技術(shù)要求與業(yè)務(wù)數(shù)據(jù)密切交互，而利用滴滴的框架和資源，團(tuán)隊(duì)能更方便地去展開(kāi)技術(shù)研究。

“擁有大數(shù)據(jù)”這個(gè)理由，同樣也是楊錦加入京東的原因之一。

京東目前有 2 億多的活躍用戶，16 萬(wàn)第三方賣家，每天能產(chǎn)生 20 Petabytes的數(shù)據(jù)，這個(gè)數(shù)據(jù)無(wú)論從數(shù)量還是質(zhì)量上來(lái)說(shuō)，都很吸引人。

楊錦告訴雷鋒網(wǎng)，海量精準(zhǔn)的大數(shù)據(jù)和豐富明確的應(yīng)用場(chǎng)景，是 AI 在安全產(chǎn)生價(jià)值的兩個(gè)重要條件。無(wú)論是語(yǔ)音交互、圖像感知還是自然語(yǔ)言識(shí)別，其實(shí)都是通過(guò)機(jī)器對(duì)于大數(shù)據(jù)的學(xué)習(xí)。

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

與此同時(shí)，目前京東的智能音箱、無(wú)人車、無(wú)人機(jī)、智能供應(yīng)鏈等新技術(shù)和產(chǎn)品也提供了明確的應(yīng)用場(chǎng)景，這對(duì)于搞安全的人來(lái)說(shuō)，非常有吸引力。

與國(guó)內(nèi)近兩年興起的“安全熱”不同，由于美國(guó)的互聯(lián)網(wǎng)公司起步較早，遭受網(wǎng)絡(luò)攻擊的“經(jīng)驗(yàn)”也多，多年來(lái)對(duì)網(wǎng)絡(luò)安全都非常重視，積累了很多安全人才。楊錦說(shuō)，在硅谷做安全很多就是中國(guó)人。從這點(diǎn)來(lái)說(shuō)，隨著國(guó)內(nèi)互聯(lián)網(wǎng)公司的快速發(fā)展，去硅谷“挖人”的也越來(lái)越多。

與此同時(shí)，由于國(guó)內(nèi)龐大的市場(chǎng)和豐富的應(yīng)用數(shù)據(jù)，尤其是人工智能方面的飛速發(fā)展，安全研究人員在這片“土壤”中，也能挖掘出更多 AI 安全的價(jià)值。

攻擊者對(duì) AI 運(yùn)用得 666

人工智能在攻防對(duì)抗中究竟處于什么階段？在峰會(huì)現(xiàn)場(chǎng)，楊錦以一個(gè)簡(jiǎn)歷網(wǎng)站的反爬蟲(chóng)為例，講了安全人員同黑產(chǎn)過(guò)招的幾個(gè)回合。

對(duì)于基礎(chǔ)的爬蟲(chóng)行為，安全人員先開(kāi)始只看對(duì)方的 IP、請(qǐng)求量、User Agent（用戶代理，簡(jiǎn)稱 UA，是一個(gè)特殊字符串頭，使得服務(wù)器能夠識(shí)別用戶使用的操作系統(tǒng)及版本、CPU 類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語(yǔ)言等信息），根據(jù)這三個(gè)特征制定規(guī)則，封掉異常行為。

黑產(chǎn)在判斷出這些簡(jiǎn)單的防守規(guī)則后，改變了進(jìn)攻套路。把 User Agent 偽裝成正常的百度爬蟲(chóng)，讓防守方無(wú)法識(shí)別，并且通過(guò) IP 代理的方式進(jìn)行下一步的爬取。

接下來(lái)安全人員開(kāi)始用頻率進(jìn)行限制去攔截異常行為，并且寫(xiě)了一個(gè)小腳本來(lái)把白名單加進(jìn)去，來(lái)判斷爬蟲(chóng)是不是來(lái)自百度的服務(wù)器。

隨著防守方的規(guī)則變化，黑產(chǎn)也繼續(xù)出新招，運(yùn)用云端多IP的能力進(jìn)行無(wú)規(guī)律的隨機(jī)慢爬，從而規(guī)避掉之前用頻率做防守的規(guī)則。

要防黑產(chǎn)這招，可能導(dǎo)致防守方對(duì)正常用戶的“誤殺”。所以防守方干脆推一個(gè)驗(yàn)證碼，來(lái)識(shí)別你到底是人還是機(jī)器在做爬取的工作，但在這方面黑產(chǎn)也有相應(yīng)的對(duì)策。

對(duì)于驗(yàn)證碼的識(shí)別，雷鋒網(wǎng)此前也報(bào)道過(guò)一秒分辨出楊臣剛、王大治和孫楠，這個(gè)黑產(chǎn)居然用AI 來(lái)"打碼"，當(dāng) AI 賦能黑產(chǎn)，智能爬蟲(chóng)的威力也顯現(xiàn)出來(lái)。據(jù)楊錦透露，這些打碼平臺(tái)識(shí)別一次驗(yàn)證碼的收費(fèi)大概在0.15分左右，但有的打碼平臺(tái)在被端掉之前的 3 個(gè)月內(nèi)做過(guò) 250 多億次的識(shí)別，收入可觀。

在攻防對(duì)抗快速升級(jí)的情況下，今天行之有效的防守措施，可能明天就失效了，沒(méi)有一種簡(jiǎn)單方式是能夠一招制敵的。楊錦認(rèn)為，對(duì)于防守方來(lái)說(shuō)，未來(lái)使用 AI 深度學(xué)習(xí)的策略和框架，可以對(duì)攻擊行為進(jìn)行全方位的識(shí)別，以至于達(dá)到實(shí)時(shí)辨別和封殺的效果。

安全人員怎么辦

在演講現(xiàn)場(chǎng)，楊錦重點(diǎn)提到去年 DARPA 舉辦的一場(chǎng) CGC 比賽，雷鋒網(wǎng)此前也進(jìn)行過(guò)報(bào)道走近首屆DARPA網(wǎng)絡(luò)安全大賽，其展現(xiàn)了基于AI的攻防對(duì)抗的，揭示出未來(lái)安全極有可能是攻防機(jī)器人之間利用AI的自主自動(dòng)對(duì)抗。

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

簡(jiǎn)單來(lái)說(shuō)就是機(jī)器之間的CTF比賽，AI VS AI，通過(guò)一系列的可視化指標(biāo)，機(jī)器展示了在快速識(shí)別和利用對(duì)手的弱點(diǎn)的同時(shí)，發(fā)現(xiàn)并修補(bǔ)有缺陷的代碼的能力。除了機(jī)器人之間的比賽，此后冠軍隊(duì)的 Mayhem 系統(tǒng)還參加了與真人戰(zhàn)隊(duì)的CTF比賽。

雖然在最后人機(jī)混合的CTF比賽，冠軍是由真人戰(zhàn)隊(duì) CMU PPP 獲得，不過(guò)由 CMU PPP 主力參與開(kāi)發(fā)的機(jī)器人 Mayhem 在比賽中還是打敗了其他幾支真人隊(duì)伍。

這次CGC比賽歐美安全圈引起的震動(dòng)非常大，很多新聞媒體的報(bào)告都是以未來(lái)機(jī)器人是否能代替安全研究人員為焦點(diǎn)討論。

楊錦告訴雷鋒網(wǎng)，真正了解安全且能夠合理運(yùn)用AI技術(shù)的安全研究人員，將有能力建造強(qiáng)大的機(jī)器系統(tǒng)，這才是AI安全威力升級(jí)關(guān)鍵所在，也是安全人員的事業(yè)發(fā)展方向。

AI安全在京東

由于AI技術(shù)對(duì)于攻防雙方來(lái)說(shuō)都是新的賦能，如果不重視 AI 在防守方的發(fā)展，攻擊方在AI方面的進(jìn)展會(huì)造成全新的威脅，而這些新威脅卻是傳統(tǒng)安全手段完全無(wú)法防范的。

在這種情況下，楊錦透露，AI安全已經(jīng)成為京東安全重點(diǎn)發(fā)力的方向，目前主要在京東硅谷安全實(shí)驗(yàn)室開(kāi)展。

京東安全不同于 BAT 安全，由于有著充分大量的 B2C 情景，需要重視B端風(fēng)險(xiǎn)。不同于傳統(tǒng)安全，AI安全關(guān)注京東新零售情景下的各項(xiàng)業(yè)務(wù)，以及IOT發(fā)展中的綜合風(fēng)險(xiǎn)問(wèn)題，強(qiáng)調(diào)采用系統(tǒng)觀點(diǎn)，使AI技術(shù)與業(yè)務(wù)安全深入結(jié)合，為業(yè)務(wù)健康開(kāi)展保駕護(hù)航。

AI安全的原理是，正常業(yè)務(wù)或內(nèi)外部的技術(shù)行為都會(huì)留下數(shù)據(jù)信息痕跡，利用這些信息痕跡，采用AI等分析手段，可以揭示出數(shù)據(jù)背后的客觀事實(shí)，消除風(fēng)險(xiǎn)，對(duì)抗來(lái)自對(duì)手的AI攻擊。

楊錦所講的例子其實(shí)換句話說(shuō)就是，當(dāng) AI 賦能攻擊方時(shí)，安全研究人員所面對(duì)的挑戰(zhàn)將會(huì)非常大。該如何應(yīng)對(duì)？她從業(yè)務(wù)安全開(kāi)始講起。

京東是一個(gè)電商平臺(tái)，涉及業(yè)務(wù)安全有8個(gè)主要流程，用戶的注冊(cè)、登錄、實(shí)名認(rèn)證、商品瀏覽、下單、支付、評(píng)價(jià)和推廣營(yíng)銷，這些領(lǐng)域都有攻擊方的窺探和攻擊。

以抵抗羊毛黨為例，楊錦和團(tuán)隊(duì)會(huì)先搜集信息，主要有對(duì)黑產(chǎn)的活動(dòng)監(jiān)控信息，和對(duì)內(nèi)部重要數(shù)據(jù)的聯(lián)合打通。通過(guò)自然語(yǔ)言理解以及各種聚類算法，抽出重要的信息。

在這個(gè)過(guò)程中，如何能提供給 AI 切實(shí)有效的數(shù)據(jù)是關(guān)鍵點(diǎn)，這時(shí)候同業(yè)務(wù)部門(mén)的配合就會(huì)非常重要。

在提取出黑產(chǎn)活動(dòng)的信息后，他們會(huì)根據(jù)這些信息進(jìn)行預(yù)警和攔截，在攔截完畢以后，會(huì)得到業(yè)務(wù)部門(mén)的反饋，此次攔截正確與否，再反饋到數(shù)據(jù)中進(jìn)行打標(biāo)，這時(shí)候的數(shù)據(jù)才可以運(yùn)用到 AI 的算法中進(jìn)行深度學(xué)習(xí)。通過(guò)這樣的循環(huán)，來(lái)提高防守能力，攔截黑產(chǎn)訂單。

相比于人工，這樣可以達(dá)到智能化、完全化和零配制的目的。

楊錦說(shuō)，類似這樣的方式同樣可以運(yùn)用到防止對(duì)公司進(jìn)行整體經(jīng)營(yíng)情況的窺探和利用。與黑產(chǎn)的相關(guān)的攻防對(duì)抗一直在不斷的演進(jìn)當(dāng)中。

寫(xiě)在最后

今年5月，京東 CEO 劉強(qiáng)東曾在自己的媒體賬號(hào)上為即將上市的智能冰箱打 call 。其可通過(guò)內(nèi)置雙攝像頭和圖像識(shí)別技術(shù)，知道冰箱內(nèi)部的情況，并管理其中的食材，比如提醒食材的有效期，根據(jù)食材推薦食譜，學(xué)習(xí)用戶的飲食和購(gòu)物習(xí)慣，并提供在京東快速下單購(gòu)買材料的通道。

對(duì)此，財(cái)經(jīng)作家吳曉波曾預(yù)言，未來(lái)大數(shù)據(jù)將是京東最值錢的資產(chǎn)。

窺一斑而知全豹，智能冰箱的背后，是京東在 AI 和 IOT 等方面的大力布局，當(dāng)互聯(lián)網(wǎng)公司在掌握了用戶、商家、生產(chǎn)等方面的數(shù)據(jù)后，安全也稱為智能化環(huán)節(jié)中重要的一環(huán)。

在采訪楊錦時(shí)，她也告訴雷鋒網(wǎng)，目前京東在硅谷的研發(fā)中心、大數(shù)據(jù)、AI、智慧供應(yīng)鏈、平臺(tái)產(chǎn)品研發(fā)、智慧物流、安全等部門(mén)都在密切協(xié)作， AI 使用于安全，已經(jīng)是一個(gè)現(xiàn)實(shí)了，因?yàn)楣舴揭呀?jīng)在使用各種技術(shù)，防守方也在利用 AI 新的利器，與攻擊方進(jìn)行較量。

部分內(nèi)容來(lái)自2017京東安全峰會(huì)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

2人收藏

郭佳

編輯

發(fā)私信

當(dāng)月熱門(mén)文章

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

為何棄谷歌，選京東

攻擊者對(duì) AI 運(yùn)用得 666

安全人員怎么辦

AI安全在京東

寫(xiě)在最后

京東安全策略分析: 黑產(chǎn) AI 用得 666，怎么懟回去

為何棄谷歌，選京東