0
Deepfake負(fù)面應(yīng)用正在愈演愈烈。
上個(gè)月,“一鍵脫衣”AI(DeepNude)盜用社交網(wǎng)絡(luò)自拍照生成裸體刷爆網(wǎng)絡(luò),短短幾天,致使68萬(wàn)女性受害。近日,再次有外媒爆出在Reddit社區(qū)中,一個(gè)名為r / GeneratedPorn Subreddit正在散播大量色情淫穢作品,而制作這些色情作品的正是造假軟件—Deepfake。
這些虛假的色情作品已在Twitter,F(xiàn)acebook,Reddit多個(gè)社交網(wǎng)絡(luò),以及XVideos,Pornhub等色情網(wǎng)站上被瘋狂傳播。
不同于DeepNude利用社交網(wǎng)絡(luò)中的私人照片,這次Deepfake造假軟件利用的是現(xiàn)有的成人色情作品。創(chuàng)建者認(rèn)為在原有色情作品上,利用Deepfake生成不存在的人臉進(jìn)行二次創(chuàng)作可以避免法律上的懲罰和道德上的譴責(zé)。
但事實(shí)可能并非如此,目前Reddit、XHamster等多個(gè)網(wǎng)站已經(jīng)將該軟件封殺,并強(qiáng)調(diào),
Reddit網(wǎng)站政策禁止非自愿色情內(nèi)容的分享和傳播,包括Deepfake作品。
Deepfake的深度造假能力到底有多強(qiáng)?它除了支持換頭、換臉、對(duì)口型,以及脫衣外,甚至還可以生成一張完全不存在的人臉。像這樣,連頭發(fā)絲都顯得逼真自然。
然而,正是這項(xiàng)原本被廣泛用于影視業(yè)的逼真造假技術(shù),被一名博士生用來(lái)創(chuàng)建了大量淫穢視頻。
這款Deepfake造假軟件被命名為GeneratedPorn,簡(jiǎn)稱GP。GP所利用的色情數(shù)據(jù)集全部來(lái)自于捷克的一家色情制造公司——Czech Casting。
多年來(lái),該公司拍攝了成千上萬(wàn)的女性視頻,并托管在共享網(wǎng)站支持免費(fèi)下載。視頻中每個(gè)女性都被數(shù)字編號(hào),并站在白色背景下進(jìn)行360°無(wú)死角拍攝,甚至包括局部生殖器官的鏡頭特寫(xiě)。
這些高清、無(wú)死角的視頻內(nèi)容非常符合機(jī)器學(xué)習(xí)算法的訓(xùn)練要求。GP的創(chuàng)建者從中提取了7500張圖像,他說(shuō),
之所以選擇該數(shù)據(jù)源是因?yàn)?,生成式?duì)抗模型(GAN)需要學(xué)習(xí)生成對(duì)象類的圖像結(jié)構(gòu),如果圖像在結(jié)構(gòu)上相似,則模型可以了解有關(guān)對(duì)象類的更精確的細(xì)節(jié),比如精確到臉上的酒窩或雀斑,這樣可以獲得更高質(zhì)量的結(jié)果。
GAN,全稱 Generative Adversarial Networks ,是一種深度學(xué)習(xí)模型,是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。該模型分為生成模型和鑒別模型,兩個(gè)模型在相互博弈中,可以獲得逼真的圖像輸出結(jié)果。
繼2016年GAN首次被提出之后,英偉達(dá)在此基礎(chǔ)上研發(fā)出了StleGAN,并在2019年升級(jí)為StyleGAN2.如之前所說(shuō),StyleGAN2在生成人臉,尤其是生存逼真且不存在的人臉?lè)矫嬉呀?jīng)達(dá)到了最高性能,更重要的是,該模型已經(jīng)在GitHub開(kāi)源。
https://github.com/NVlabs/stylegan2
GP創(chuàng)建者表示,它利用的就是開(kāi)源的StyleGAN2模型,并用色情數(shù)據(jù)集加載到其中進(jìn)行訓(xùn)練。這一過(guò)程與其他換臉Deepfake相似,但不同的是,GP使用的不是一張人臉多種表情組成的數(shù)據(jù)集,而是多個(gè)數(shù)據(jù)集中提取的數(shù)據(jù)。
同時(shí),他也強(qiáng)調(diào)雖然GP生成的色情內(nèi)容非常逼真,甚至肉眼看不出任何破綻,但它生成的是不存在的人臉。
今年9月份,這位博士生在Reddit上開(kāi)設(shè)論壇,開(kāi)始炫耀其用GP軟件生成的色情作品。按他的說(shuō)法,在創(chuàng)建GP之初,已經(jīng)曾考慮過(guò)道德層面的問(wèn)題了。
最后之所以選擇現(xiàn)有色情作品作為訓(xùn)練數(shù)據(jù)集,部分原因也是出于道德層面的考慮。
這位博士生是一位計(jì)算機(jī)專業(yè)的學(xué)生,同時(shí)也一位AI技術(shù)狂熱愛(ài)好者。他說(shuō),
這一切的開(kāi)始都是出于對(duì)技術(shù)的好奇和熱愛(ài),尤其是轉(zhuǎn)向生成色情作品以后,這是一項(xiàng)非常酷的技術(shù)。
一開(kāi)始,他計(jì)劃制作一個(gè)OnlyFans,提供定制化的AI裸體視頻,但是這一想法遭到了好友的反對(duì),因此,他將目標(biāo)轉(zhuǎn)向了色情公司的作品集。在他看來(lái),利用成人色情作品,并切換成不存在的人臉圖像,創(chuàng)建的色情圖像可以避免道德上的譴責(zé)。
但事實(shí)可能并非如此。盡管是成人作品,但涉及到的女性并未給與授權(quán),因此依然屬于非法盜用。此外,其數(shù)據(jù)集所屬公司Czech Casting正在面臨刑事訴訟。
警方指控該公司通過(guò)販賣人口和強(qiáng)奸來(lái)非法獲取女性色情圖像和視頻,并勒令其向22名視頻中的女性支付近1300萬(wàn)美元的精神賠償。同時(shí),其創(chuàng)始人也正被聯(lián)邦調(diào)查局(FBI)通緝。
而他對(duì)此并非不了解,對(duì)此,他解釋了兩點(diǎn):
一是要通過(guò)算法生成完整的裸露身體,需要更多真實(shí)且裸露的圖像和視頻,而Czech Casting的視頻無(wú)疑是最佳資源。
二是有些女性是專門從事這項(xiàng)工作的,我無(wú)法通過(guò)圖片判斷其背后的故事,因此只能假設(shè)這些資源是可以利用的。
此外,雖然一再?gòu)?qiáng)調(diào)已經(jīng)盡力在規(guī)避道德問(wèn)題,但他還是在XVideos,Pornhub,XHamster,Twitter,F(xiàn)acebook多個(gè)網(wǎng)站上開(kāi)通了個(gè)人賬戶并分享其色情作品。
目前,多個(gè)社交平臺(tái)已經(jīng)將其賬號(hào)封禁。其中,XHamster已刪除GP用戶資料的,同時(shí)也表示,
這些類型的內(nèi)容確實(shí)屬于灰色地帶,我們需要與自己的機(jī)器學(xué)習(xí)團(tuán)隊(duì)以及TOS團(tuán)隊(duì)一起審查,以確定該如何評(píng)估和預(yù)防。
除了GP,DeepNude創(chuàng)建者也是出于對(duì)技術(shù)研究的熱忱。
但無(wú)論是出于什么原因,他們的做法確實(shí)濫用AI技術(shù)產(chǎn)生了惡劣的影響。而且如果從技術(shù)的角度來(lái)講,他們應(yīng)該處理好數(shù)據(jù)隱私問(wèn)題,包括數(shù)據(jù)集授權(quán)以及社交網(wǎng)絡(luò)分享。
這一點(diǎn)可以借鑒Facebook的做法。
2019年,F(xiàn)acebook為應(yīng)對(duì)社交網(wǎng)絡(luò)中充斥的色情視頻造假問(wèn)題,發(fā)起了Deepfake挑戰(zhàn)賽 (Deepfakes Detection Challenge)。
該挑戰(zhàn)賽的所用數(shù)據(jù)集就包含了100,000張色情演員的表演視頻,供研究人員使用。但重點(diǎn)是,該數(shù)據(jù)集已付費(fèi)并獲得了授權(quán),同時(shí)技術(shù)測(cè)試內(nèi)容也禁止任何社交平臺(tái)分享。正如數(shù)據(jù)科學(xué)家喬杜里(Chowdhury)所說(shuō):“在未經(jīng)授權(quán)的情況下使用數(shù)據(jù)庫(kù)圖像的AI是不道德的”。
但事實(shí)上,除了專業(yè)機(jī)構(gòu)外,大部分利用AI生成的虛假視頻均未獲得授權(quán),而且其中色情視頻占比最高達(dá)到了96%。據(jù)了解,F(xiàn)acebook托管在Kaggle的色情數(shù)據(jù)集也曾多次被盜取。(Kaggle是為開(kāi)發(fā)商,數(shù)據(jù)科學(xué)家提供舉辦機(jī)器學(xué)習(xí)競(jìng)賽、托管數(shù)據(jù)庫(kù)、編寫(xiě)和分享代碼的專業(yè)平臺(tái))
正因如此,Deepfake也逐漸淪為了一個(gè)臭名昭著的造假軟件。為遏制虛假內(nèi)容的生成,F(xiàn)acebook的努力已經(jīng)初見(jiàn)成效(識(shí)別準(zhǔn)確率可達(dá) 82.56%)。但要想完全關(guān)上潘多拉魔盒,還需要更多企業(yè)、學(xué)界以及開(kāi)發(fā)者的共同努力。
引用鏈接:
https://www.vice.com/en/article/bjye8a/reddit-fake-porn-app-daisy-ridley
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。