0
本文作者: 史中 | 2016-12-17 09:18 |
一天深夜,你正在訪問(wèn)某大型科技媒體網(wǎng)站,突然,所有的網(wǎng)頁(yè)都變成了不可描述的模樣:充滿了“同城約”“鈣片”的圖片和鏈接。
你十分震驚,然后批判性地瀏覽了一晚上。
作為一個(gè)有科學(xué)精神的媒體,雷鋒網(wǎng)宅客頻道決定深度探尋一下,這些網(wǎng)站究竟是如何出現(xiàn)在我們面前的。
首先,科普一些硬技術(shù)基礎(chǔ)知識(shí):
1、黃賭毒網(wǎng)站,國(guó)家一般是不太允許的。。。
2、黃賭毒網(wǎng)站,搜索引擎一般是不收錄的。。。
3、黃賭毒網(wǎng)站,網(wǎng)站廣告位一般是不賣給他們的。。。
實(shí)際上,如果你站在黃賭毒網(wǎng)站站長(zhǎng)的立場(chǎng)上來(lái)看,他們宣傳自己的“光明大道”已經(jīng)幾乎被法律和規(guī)則堵死。留給他們的,只有一條路——黑產(chǎn)。
先來(lái)看看這些急于宣傳自己的非法網(wǎng)站都是什么“貨色”。360 搜索技術(shù)負(fù)責(zé)人張向征告訴雷鋒網(wǎng)宅科頻道,為了制作可以識(shí)別網(wǎng)站被黑的“悟空算法”,他和團(tuán)隊(duì)對(duì)一些賭博黑產(chǎn)做了詳細(xì)的研究。
賭博網(wǎng)站一般會(huì)利用國(guó)家福利彩票的數(shù)據(jù),然后自己“坐莊”。也就是說(shuō),“彩民”以為自己的錢用來(lái)買了真正的彩票。但實(shí)際上都交到了“莊家”手上。
每期開(kāi)獎(jiǎng)時(shí),當(dāng)彩民中獎(jiǎng)金額遠(yuǎn)小于投注金額時(shí)(這是大概率事件),莊家會(huì)真的把獎(jiǎng)金兌給彩民;當(dāng)彩民運(yùn)氣爆棚,拿著五百萬(wàn)的獎(jiǎng)券找莊家兌獎(jiǎng)時(shí),發(fā)現(xiàn)再也打不開(kāi)這個(gè)網(wǎng)站了。
這類賭博站大都坐落在境外,所以他們的網(wǎng)址經(jīng)常發(fā)生變化。關(guān)鍵是,普通的“用戶”如果想找到他們比登天還難。(實(shí)際上涉及到跨境,公安機(jī)關(guān)也很難找到他們)
如此讓人眼花繚亂的“盈利模式”,最終顯然都是靠不明真相的群眾買單。
【某偽造的福利彩票頁(yè)面】
如何獲得群眾基礎(chǔ)呢?黑產(chǎn)盯上了搜索引擎。
在搜索引擎中“權(quán)重”越高的網(wǎng)站,顯然瀏覽的人就越多。為了能夠進(jìn)入搜索引擎,黑產(chǎn)才想出把正常網(wǎng)頁(yè)“偷天換日”的伎倆。
簡(jiǎn)單來(lái)說(shuō),就是利用網(wǎng)站系統(tǒng)漏洞,把正常的網(wǎng)頁(yè)篡改成“黃賭毒”的網(wǎng)頁(yè)。
目測(cè)這個(gè)龐大的黑色產(chǎn)業(yè)已經(jīng)達(dá)到了百億級(jí)別。
張向征說(shuō)。
一方面看,這門生意相當(dāng)好賺;當(dāng)然另一個(gè)方面也要考慮“黑站”的難度。
從難度上說(shuō),最容易被黑的站是教育、政府和企業(yè)網(wǎng)站。
一般來(lái)說(shuō)兩類站容易被黑,一是不涉及到直接交易的,二是以信息發(fā)布為主要功能的。
真正的銀行、電商類網(wǎng)站,防護(hù)的力量比較強(qiáng),不會(huì)輕易被攻擊。
教育政府網(wǎng)站,一般訪問(wèn)人數(shù)較少,或者只有特定人群訪問(wèn),而建站的主體往往并不需要經(jīng)常運(yùn)營(yíng)維護(hù)網(wǎng)站。而更大數(shù)量的企業(yè)網(wǎng)站,可能是用模板制作,僅僅用于產(chǎn)品展示。企業(yè)關(guān)心的是自己業(yè)務(wù)層面,對(duì)網(wǎng)站并不非常關(guān)心。
相信你已經(jīng)可以腦補(bǔ)出這些容易被攻擊網(wǎng)站的形象了。
【某政府網(wǎng)站被黑/圖片來(lái)自互聯(lián)網(wǎng)】
這些網(wǎng)頁(yè)被篡改,不僅僅是需要改回來(lái)這么簡(jiǎn)單。黑客侵入網(wǎng)站,說(shuō)明網(wǎng)站存在著嚴(yán)重的可以被利用的漏洞。利用這些漏洞,黑客可以把網(wǎng)站的所有注冊(cè)用戶數(shù)據(jù)竊取下來(lái)。而這又造成了新的更大問(wèn)題:
很多用戶在注冊(cè)多個(gè)網(wǎng)站時(shí)會(huì)使用相同的密碼,而一旦密碼泄露,黑客就可以用這些密碼去嘗試登錄你的支付寶、淘寶、網(wǎng)銀賬戶等等,俗稱撞庫(kù)。
如果黑客掌握了你的足夠多的個(gè)人信息,還可以把它們賣給詐騙集團(tuán),用來(lái)精準(zhǔn)詐騙。沒(méi)錯(cuò),震驚全國(guó)的徐玉玉案,陰影中的黑手可能就是這樣伸向無(wú)辜的人。
另外,利用網(wǎng)站漏洞,黑客還可以植入木馬病毒,當(dāng)用戶瀏覽這個(gè)網(wǎng)頁(yè),就有可能感染病毒。病毒會(huì)寄生在用戶的電腦上,監(jiān)視用戶的所有行為。
既然已經(jīng)形成一個(gè)黑色產(chǎn)業(yè),就意味著有相當(dāng)多的黑帽子黑客“一起玩”。而這些黑客,顯然也會(huì)分開(kāi)不同的流派。簡(jiǎn)單說(shuō)來(lái)有兩個(gè)方向:
這類篡改,粗獷無(wú)比。往往粗暴地把網(wǎng)站的全部?jī)?nèi)容直接替換成大幅的非法網(wǎng)站圖片和鏈接。這樣的玩法,即使是老眼昏花的老奶奶都能看出區(qū)別。
這種情況,會(huì)造成網(wǎng)站嚴(yán)重的流量異常(根本就不是一個(gè)網(wǎng)站了好不好),一旦被站長(zhǎng)發(fā)現(xiàn),會(huì)被第一時(shí)間處理。
【被篡改網(wǎng)頁(yè)充斥非法廣告】
這類篡改,一般不會(huì)動(dòng)網(wǎng)站的主體結(jié)構(gòu),而是在某些特定的地方加入黃賭毒網(wǎng)站的宣傳圖片或鏈接。這些入口可能被放置在首頁(yè),也可能被放在不同的欄目下面。對(duì)于訪問(wèn)這個(gè)黃色網(wǎng)站的用戶來(lái)說(shuō),他們也許依然能找到自己想要的資料。同事他們也會(huì)看到非法的廣告或鏈接,可能會(huì)點(diǎn)擊進(jìn)入。
這種情況一般不會(huì)給網(wǎng)站流量造成巨大的負(fù)面影響(反而有時(shí)會(huì)升高,你懂的)。由于隱蔽性好,也不容易被站長(zhǎng)發(fā)現(xiàn)。
某網(wǎng)絡(luò)安全專家曾經(jīng)向雷鋒網(wǎng)宅客頻道(微信公眾號(hào):宅客頻道)表示:
有些政府網(wǎng)站管理員很“喜歡”網(wǎng)站被黑,因?yàn)檫@樣會(huì)給本來(lái)沒(méi)多少人看的網(wǎng)頁(yè)帶來(lái)不錯(cuò)的流量。在年終做匯報(bào)的時(shí)候,倒是可以拿出不錯(cuò)的數(shù)據(jù)。
雷鋒網(wǎng)宅客頻道表示:竟然好有道理,我竟無(wú)言以對(duì)。
很多站長(zhǎng)并不關(guān)心自己的網(wǎng)站被黑客篡改,很多站長(zhǎng)也無(wú)法感知自己的網(wǎng)頁(yè)被黑客掛了非法鏈接。那么,最擔(dān)心這件事情的就輪到了搜索引擎。因?yàn)榇蠖鄶?shù)無(wú)辜群眾都是通過(guò)搜索引擎才進(jìn)入這些危險(xiǎn)網(wǎng)頁(yè)的,用戶受害之后,搜索引擎“責(zé)任重大”。這也是為什么 360 搜索的安全專家要“挺身而出”的原因。
張向征介紹,小伙伴們最新研究的死磕黑客的方法,叫做“悟空算法”。
對(duì)于剛剛提到的兩類篡改網(wǎng)頁(yè)的行為,“悟空算法”都有應(yīng)對(duì)的技巧。
【某境外賭博網(wǎng)站】
搜索引擎可以利用機(jī)器學(xué)習(xí)的方法,對(duì)正常的網(wǎng)站已有的標(biāo)題和內(nèi)容做語(yǔ)義分布的判斷。如果同一個(gè)網(wǎng)站在短時(shí)間內(nèi)語(yǔ)義分布突然發(fā)生了大面積偏移,就可以證明這個(gè)網(wǎng)站的頁(yè)面遭遇的大規(guī)模改動(dòng)。
另外,網(wǎng)站在短時(shí)間內(nèi)突然增加了大量的外部鏈接,或者原有的鏈接全部成為“死鏈”,這些都是用來(lái)判定網(wǎng)頁(yè)被篡改的識(shí)別規(guī)則。
當(dāng)然,網(wǎng)站新的語(yǔ)義分布中,如果充斥著不可描述的詞語(yǔ),就更加可以確定它遭受了“血洗”。
由于只有少量的內(nèi)容發(fā)生變化,所以在統(tǒng)計(jì)意義上,并不能產(chǎn)生能夠說(shuō)明問(wèn)題的偏移。這個(gè)時(shí)候就要增加參考的維度。
例如要和以前的網(wǎng)頁(yè)做比對(duì),對(duì)于新加入的內(nèi)容做分析。
有些網(wǎng)站相比之前可能只有幾十個(gè)字存在風(fēng)險(xiǎn),而這恰恰就是被黑客篡改的內(nèi)容。
張向征說(shuō)。
所謂道高一尺,魔高一丈。月如百萬(wàn)的黑客們并不愿意束手就擒,想出了奇葩的對(duì)抗方法。
張向征告訴雷鋒網(wǎng)宅客頻道:
有些黑客篡改網(wǎng)頁(yè),會(huì)采用“作弊”的方法。當(dāng)檢測(cè)到用戶是通過(guò)輸入網(wǎng)址的方法進(jìn)入網(wǎng)頁(yè)時(shí),網(wǎng)頁(yè)一切正常。當(dāng)檢測(cè)到用戶是通過(guò)搜索引擎進(jìn)入網(wǎng)頁(yè)時(shí),才會(huì)“兇相畢露”。
顯然站長(zhǎng)不會(huì)通過(guò)搜索引擎進(jìn)入自己的網(wǎng)站,所以當(dāng)他進(jìn)入網(wǎng)站的時(shí)候,一派歡樂(lè)祥和。當(dāng)用戶通過(guò)搜索進(jìn)入的時(shí)候,卻如同進(jìn)入了“月球的背面”,一片牛鬼蛇神魑魅魍魎。
這種情況下,站長(zhǎng)很難意識(shí)到發(fā)生了什么,也可能忽略搜索引擎發(fā)來(lái)的警告。這個(gè)時(shí)候?qū)τ?360 搜索團(tuán)隊(duì)也是一個(gè)考驗(yàn)。
另外,有些黑客在篡改網(wǎng)頁(yè)的時(shí)候,甚至把域名都做了改變。此時(shí)搜索引擎就無(wú)法比對(duì)該網(wǎng)頁(yè)的歷史信息,也就沒(méi)有辦法判斷它相對(duì)于歷史形態(tài)有哪些微笑的改動(dòng)。
這個(gè)時(shí)候,我們的系統(tǒng)就只能對(duì)新網(wǎng)頁(yè)和我們歷史數(shù)據(jù)中的網(wǎng)頁(yè)做智能比對(duì),從而判斷它的“前世”是哪個(gè)網(wǎng)站。
張向征說(shuō)。
除了這些,團(tuán)隊(duì)還要面對(duì)在識(shí)別過(guò)程中那些“擦邊”的情況。張向征告訴雷鋒網(wǎng)宅客頻道:
有些網(wǎng)站本身不是賭博網(wǎng)站,但是也許報(bào)道了很多非法“六合彩”的內(nèi)容。
有些網(wǎng)站有大量的類色情詞匯分布,但也可能并不是真正的色情網(wǎng)站。
有些網(wǎng)站備案不太完整,也可能增加系統(tǒng)的不信任。
這些情況也許都會(huì)導(dǎo)致系統(tǒng)誤判。
對(duì)于誤判,除了不斷改進(jìn)算法之外,最有效的辦法就是人工接受站長(zhǎng)反饋。
只要人工審核認(rèn)為不是真正的黑產(chǎn),我們都會(huì)放開(kāi)。只要你不是誘導(dǎo)用戶去賭博。。。
他說(shuō)。
至此,網(wǎng)頁(yè)篡改的黑產(chǎn)大軍,以及和他們“神魔斗法”的搜索團(tuán)隊(duì),硝煙彌漫的戰(zhàn)爭(zhēng)圖景展現(xiàn)在你的面前。
也許,正在看文章的你對(duì)于自己的判斷力有充足的信心,并不認(rèn)為自己會(huì)被黃賭毒網(wǎng)頁(yè)引入歧途。但是也許你身邊的人,年邁的父母,稚嫩的孩子,都是“黃賭毒”網(wǎng)站最肥美的獵物。
龐大的黑產(chǎn)告訴我們網(wǎng)絡(luò)世界遠(yuǎn)不是天堂。而面對(duì)危險(xiǎn),埋怨從來(lái)無(wú)濟(jì)于事。為網(wǎng)絡(luò)世界構(gòu)建秩序的點(diǎn)滴努力,都彌足珍貴。
文/史中(微信ID:Fungun,歡迎講述你的故事)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。