0
網(wǎng)絡(luò)世界,有人的地方就有流量,有流量的地方就少不了水軍。
屢禁不止的網(wǎng)絡(luò)水軍似乎是個(gè)老生常談的問(wèn)題,而最近歌手尚雯婕的一條微博又把這一群體推到了大眾眼前。
“我告訴團(tuán)隊(duì)不要再給我買(mǎi)水軍了?!彼拐\(chéng)經(jīng)紀(jì)團(tuán)隊(duì)存在通過(guò)購(gòu)買(mǎi)“網(wǎng)絡(luò)水軍”來(lái)提升流量的行為。
實(shí)際上,“網(wǎng)絡(luò)水軍”這個(gè)隊(duì)伍一直緊跟時(shí)代步伐,在屢遭曝光后依舊活躍,甚至,AI“水軍”已經(jīng)上崗。
水軍已有近十年的發(fā)展歷程。
有文章將這個(gè)群體描述為:輿論收緊,社交閉合,他們蟄伏;輿論松綁,社交開(kāi)放,他們狂歡??傊?,你見(jiàn),或者不見(jiàn),水軍就在那里。
只不過(guò)隨著時(shí)代的變換,真人賬號(hào)的網(wǎng)絡(luò)水軍變得不太“吃香”,另一種靠速度和數(shù)量以及成本取勝的機(jī)器人賬號(hào)愈發(fā)成為水軍界的主流。
但簡(jiǎn)單的機(jī)器程序刷評(píng)論,會(huì)出現(xiàn)大量重復(fù)性的內(nèi)容、廣告,以及回復(fù)文不對(duì)題,刷表情等極易被反抄襲系統(tǒng)發(fā)現(xiàn)是虛假操作,從而封禁賬號(hào)。
隨著人工智能技術(shù)的逐漸成熟,“AI水軍”開(kāi)始出現(xiàn)了。
來(lái)自極驗(yàn)的情報(bào)員鄭穎告訴雷鋒網(wǎng)宅客頻道(微信公眾號(hào):letshome),這位水軍界的“新秀”使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進(jìn)行訓(xùn)練,以網(wǎng)上大量的評(píng)論素材做訓(xùn)練素材,用語(yǔ)言模型來(lái)預(yù)測(cè)下一個(gè)單詞的概率,從而生成新的文本。以這種技術(shù)生成的評(píng)論并非簡(jiǎn)單地從已有素材中進(jìn)行重復(fù),所以能夠達(dá)到“以假亂真”、“爐火純青”的地步,不僅可以避免被反抄襲軟件檢測(cè),同時(shí)也能節(jié)省人力、財(cái)力、物力上的消耗。
具體來(lái)說(shuō),以刷微信閱讀量為例,程序是如何實(shí)現(xiàn)的呢?
鄭穎表示,網(wǎng)絡(luò)地下黑市盛傳的“微自動(dòng)化大數(shù)據(jù)營(yíng)銷系統(tǒng)”的工具,由成排的手機(jī)和多臺(tái)電視顯示器構(gòu)成。每個(gè)架子上擺放了幾十部千元機(jī),所有手機(jī)畫(huà)面集中在電視上顯示。配合專業(yè)的“刷單”工具,可以在很短時(shí)間內(nèi)完成成百上千的閱讀量。
“刷單”工作室
“網(wǎng)絡(luò)水軍”的作業(yè)流程包含技術(shù)系統(tǒng)、核心資源和業(yè)務(wù)系統(tǒng)三個(gè)部分。其中,業(yè)務(wù)系統(tǒng)是對(duì)接客戶的業(yè)務(wù)需求;技術(shù)系統(tǒng)的核心能力是通過(guò)一臺(tái)手機(jī),模擬出成千上萬(wàn)臺(tái)看起來(lái)真實(shí)的手機(jī),然后操作這些模擬的手機(jī)執(zhí)行各種刷單刷量任務(wù)。
例如,當(dāng)你使用一臺(tái)安卓手機(jī),點(diǎn)擊手機(jī)里的App, App讀取Android操作系統(tǒng)的底層數(shù)據(jù),將手機(jī)標(biāo)識(shí)數(shù)據(jù)包括IMEI號(hào)、品牌、Wi-Fi等傳回App的服務(wù)器,告知有一臺(tái)手機(jī)正在激活和使用App,服務(wù)器響應(yīng)并回傳應(yīng)用數(shù)據(jù)。
而造假技術(shù)系統(tǒng)的做法是,改造Android操作系統(tǒng),將Android操作系統(tǒng)的數(shù)據(jù)接口截?cái)?,把自己生成的?shù)據(jù)接口接入系統(tǒng),做到IMEI號(hào),SIM卡號(hào),電話號(hào)碼三碼合一。
在成功改造Android底層系統(tǒng)的基礎(chǔ)上,技術(shù)系統(tǒng)分為執(zhí)行單元、數(shù)據(jù)庫(kù)模塊、應(yīng)用模塊、調(diào)度模塊。
執(zhí)行單元:通過(guò)一臺(tái)手機(jī)模擬上幾十萬(wàn)到上百萬(wàn)臺(tái)手機(jī),以華為榮耀的一款手機(jī)為例,黑產(chǎn)可以模擬出50萬(wàn)臺(tái)看起來(lái)是真人在用的手機(jī)。他們?cè)谵k公室放幾百臺(tái)手機(jī),一百兆光纖,就能模擬出海量的手機(jī)協(xié)同工作。
數(shù)據(jù)庫(kù)模塊:通過(guò)機(jī)器生成或者通過(guò)資源獲取需要模擬的手機(jī)參數(shù),包括IMEI號(hào)、Wi-Fi、IP和手機(jī)號(hào)。
應(yīng)用模塊:操作腳本,指揮上百萬(wàn)臺(tái)模擬的手機(jī)在目標(biāo)應(yīng)用上進(jìn)行操作不同行為,包括登陸、點(diǎn)贊、閱讀、打賞。
調(diào)度模塊:為了對(duì)抗大平臺(tái)的反欺詐系統(tǒng),模擬手機(jī)的操作必需看起來(lái)和真實(shí)用戶的使用行為接近。因此在操作的時(shí)間點(diǎn)——幾百萬(wàn)臺(tái)手機(jī)在什么時(shí)候開(kāi)機(jī),什么時(shí)候登陸,切換到什么應(yīng)用——需要由調(diào)度模塊執(zhí)行。程序員只需要模擬真人使用行為畫(huà)時(shí)間曲線,調(diào)度模塊即可自動(dòng)執(zhí)行
鄭穎告訴雷鋒網(wǎng),通過(guò)這樣的系統(tǒng),還可以生成大量的微信號(hào),操作微信號(hào)來(lái)刷閱讀量就輕而易舉了。當(dāng)然這僅是針對(duì)微信公眾號(hào)的一波騷操作,在微博,知乎等平臺(tái)刷點(diǎn)贊、收藏、閱讀量的原理也大同小異,涉及刷評(píng)論的操作則有些出入。
這些網(wǎng)絡(luò)水軍到底有多猖狂?
相關(guān)數(shù)據(jù)顯示,自2017年5月以來(lái),公安機(jī)關(guān)已破獲“網(wǎng)絡(luò)水軍”違法犯罪案件40余起,查獲并關(guān)停涉嫌非法炒作的網(wǎng)絡(luò)賬號(hào)5000余個(gè),關(guān)閉違法違規(guī)網(wǎng)站上萬(wàn)個(gè),這些網(wǎng)站涉及的網(wǎng)上惡意炒作信息達(dá)數(shù)千萬(wàn)條,抓獲違法犯罪嫌疑人200余人,涉案金額高達(dá)上億元。
但喪心病狂的水軍會(huì)就此消停嗎?當(dāng)然不會(huì)。
至于屢禁不絕的原因,鄭穎歸納成了三點(diǎn):法制不健全;有利可圖;攻防交戰(zhàn)。
第一點(diǎn)自不必說(shuō),去年6月正式實(shí)施的《中華人民共和國(guó)網(wǎng)絡(luò)安全法》起效需要一定的時(shí)間。
至于第二點(diǎn),黑產(chǎn)動(dòng)機(jī)各不相同,但都有一個(gè)共同點(diǎn):就是逐利性。只要有利可圖,黑產(chǎn)就不可能消失。
批量購(gòu)買(mǎi)水軍的金主爸爸都抱著什么心態(tài)?
1) 薅羊毛,動(dòng)用大批量賬號(hào),刷企業(yè)營(yíng)銷活動(dòng)中的各類獎(jiǎng)品;
2) 社區(qū)論壇中常見(jiàn)的垃圾廣告,垃圾評(píng)論。(貼吧出現(xiàn)爆吧的情況,除了人為攻擊外,多為大批量水軍賬號(hào)進(jìn)行的垃圾灌水。)
3) 公關(guān)行為,正是由于水軍賬號(hào)(馬甲號(hào))隱蔽性強(qiáng)這一特點(diǎn),正面公關(guān)利用其刷數(shù)據(jù)(閱讀量、點(diǎn)擊量、評(píng)論量、點(diǎn)贊量等數(shù)據(jù)指標(biāo)),完成KPI。黑公關(guān)則通過(guò)大批量賬號(hào),進(jìn)行惡意評(píng)論,引導(dǎo)輿論導(dǎo)向,攻擊對(duì)手 。
而第三點(diǎn),所謂道高一尺魔高一丈,流量與風(fēng)控,人性與欲望,企業(yè)與黑產(chǎn)的攻防大戰(zhàn)是一個(gè)持續(xù)性的過(guò)程。
目前,各大平臺(tái)主要是從預(yù)防的角度降低水軍的規(guī)模,比如通過(guò)在注冊(cè)登錄入口部署更為安全的驗(yàn)證,以及逐步落實(shí)手機(jī)號(hào)實(shí)名制。在預(yù)防層采取一些行動(dòng)后,再通過(guò)IP、設(shè)備等傳統(tǒng)網(wǎng)絡(luò)特征的統(tǒng)計(jì)分析發(fā)現(xiàn)一些異常進(jìn)行鑒別,然后標(biāo)記進(jìn)入黑名單,最后通過(guò)不斷積累的黑名單庫(kù)來(lái)鑒別出水軍。
可惜的是,目前水軍通過(guò)機(jī)器和真人操作等各種手段形成了非常成熟的機(jī)制,靠簡(jiǎn)單的預(yù)防或者黑名單機(jī)制是很難有效反制的。
在鄭穎看來(lái),水軍最大的特點(diǎn)在于有組織有預(yù)謀,這些賬號(hào)存在明顯的團(tuán)伙攻擊模式,因此從團(tuán)伙發(fā)現(xiàn)的角度能夠更精準(zhǔn)更有效的找到這些水軍。
由于團(tuán)伙攻擊時(shí)的數(shù)據(jù)是天然存在極大關(guān)聯(lián),利用圖數(shù)據(jù)庫(kù)構(gòu)建水軍操作的行為關(guān)聯(lián),通過(guò)圖計(jì)算就能夠找到隱藏的欺詐模式。更進(jìn)一步的,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)能夠更深層學(xué)習(xí)的特點(diǎn),可以在圖結(jié)構(gòu)上運(yùn)用圖卷積技術(shù)來(lái)對(duì)水軍的團(tuán)伙模式自動(dòng)學(xué)習(xí)自動(dòng)識(shí)別,從而最大程度上反制水軍。
看你七十二變
大波水軍背后可能站著無(wú)數(shù)臺(tái)機(jī)器,但對(duì)普通用戶來(lái)說(shuō),肉眼卻很難辨識(shí)出AI水軍。
有業(yè)內(nèi)的研究人員曾對(duì)600個(gè)用戶進(jìn)行過(guò)調(diào)查,調(diào)查顯示這些虛假的評(píng)論不僅能逃過(guò)人的法眼,而且還被用戶認(rèn)為“有用”,表明虛假評(píng)論已經(jīng)可以對(duì)人類造成影響。
僅僅看評(píng)論是無(wú)法識(shí)別出AI水軍的,不過(guò)你也可以嘗試從以下幾個(gè)維度去識(shí)別水軍賬號(hào):
一是這類賬號(hào)往往無(wú)原創(chuàng)或原創(chuàng)率極低,賬號(hào)表現(xiàn)出極強(qiáng)的“小號(hào)”特征;
二是參與熱點(diǎn)討論“只評(píng)論”“不轉(zhuǎn)發(fā)”;
三是短時(shí)間內(nèi)出現(xiàn)大量口徑高度一致的評(píng)論;
四是賬號(hào)頭像、粉絲量、關(guān)注數(shù)等數(shù)據(jù)存疑。
盡管上文所述的AI水軍似乎來(lái)勢(shì)洶洶,但在鄭穎看來(lái),目前國(guó)內(nèi)水軍大多扔屬于機(jī)器行為,AI水軍還未大范圍使用,噱頭大于事實(shí)。
“AI水軍一詞是《在線點(diǎn)評(píng)系統(tǒng)中的自動(dòng)眾包攻擊和防御》趙燕斌等芝加哥大學(xué)研究人員發(fā)布的一篇論文中提出的。他們的研究說(shuō)明,人工智能可以被用來(lái)生成復(fù)雜的點(diǎn)評(píng)信息,這些虛假的點(diǎn)評(píng)不僅機(jī)器無(wú)法檢測(cè)出來(lái),就連人類讀者也分辨不出來(lái)?!编嵎f對(duì)雷鋒網(wǎng)說(shuō)道。
當(dāng)然,據(jù)說(shuō)海外AI已經(jīng)投入到水軍工作中,所以國(guó)內(nèi)……
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。