0
本文作者: 貝爽 | 2020-11-20 15:59 |
最近網(wǎng)絡(luò)上散發(fā)著一股濃濃的凡爾賽文學(xué)氣息,比如。
好煩,睡過(guò)了,錯(cuò)過(guò)馬爾代夫的航班,只能專(zhuān)機(jī)去了。
在看似平淡的話語(yǔ)中,流露出一股浮夸的炫耀,這就是凡爾賽文學(xué)。
諸如凡爾賽文學(xué)等網(wǎng)絡(luò)熱詞每年都有,但你真的get到它們的含義了嗎?
先來(lái)做個(gè)小測(cè)試吧!
以下三個(gè)句子中,請(qǐng)判斷哪一個(gè)是諷刺、吐槽和凡爾賽文學(xué)?
在這個(gè)社會(huì)上,不管承受多少的責(zé)難,都別忍。因?yàn)楝F(xiàn)在管虛偽不叫虛偽了,都叫做情商高。
長(zhǎng)得丑真是難為你了,早上跑出來(lái)嚇人,晚上跑出來(lái)嚇鬼。
iphone 11 pro max真的一點(diǎn)也不好用,我的卡死了,還是512g的暗夜綠!其實(shí)也就這樣,大家還是買(mǎi)1024g的吧
如果答對(duì)了,你可別驕傲,因?yàn)檫@道題可能連AI都會(huì)。
最近,中國(guó)北京的信息工程研究所和中國(guó)科學(xué)院聯(lián)合推出的一款A(yù)I模型,『諷刺』識(shí)別準(zhǔn)確率高達(dá)86%。
而且,這項(xiàng)研究成果還登上了計(jì)算機(jī)語(yǔ)言協(xié)會(huì)(ACL)。
聽(tīng)到這里你可能會(huì)好奇,AI為甚么要識(shí)別『諷刺』???
其實(shí),諷刺作為情緒表達(dá)的一種方式,是AI情感分析的重點(diǎn)研究方向。
情感分析,又稱(chēng)傾向性分析,或意見(jiàn)挖掘,它是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過(guò)程。利用情感分析能力,可以針對(duì)帶有主觀描述的自然語(yǔ)言文本,自動(dòng)判斷該文本的情感正負(fù)傾向并給出相應(yīng)的結(jié)果。
它有什么用處呢?簡(jiǎn)單舉個(gè)例子。
本次美國(guó)大選,除了兩位當(dāng)事人拜登和川建國(guó)外,最頭疼的可能就是Facebook創(chuàng)始人扎克伯克了。
一直以“言論自由”著稱(chēng)的Facebook,要確保美國(guó)大選期間社交網(wǎng)絡(luò)中不能出現(xiàn)“虛假的政治言論”。
龐大的社交網(wǎng)絡(luò)每天有成千上萬(wàn)條帖子被發(fā)表,其中哪些有政治風(fēng)險(xiǎn),哪些無(wú)政治風(fēng)險(xiǎn),如果靠人工逐一審核再刪除的話,顯然有點(diǎn)不切實(shí)際。
這時(shí)候,AI就派上用場(chǎng)了。
早在美國(guó)大選之前,F(xiàn)acebook AI Research團(tuán)隊(duì)就開(kāi)始利用AI語(yǔ)言模型,識(shí)別網(wǎng)絡(luò)中的虛假信息或仇恨言論,有數(shù)據(jù)統(tǒng)計(jì),在2020年第一季度,F(xiàn)acebook利用XLM語(yǔ)言模型刪除了960萬(wàn)條涉及仇恨言論的帖子。
對(duì)此,F(xiàn)acebook首席技術(shù)官M(fèi)ike Schroepfer還曾表示,
我沒(méi)有天真的以為AI可以解決每天個(gè)問(wèn)題,但我認(rèn)為它確實(shí)能幫助我們完成一些常見(jiàn)任務(wù),以及一些人類(lèi)無(wú)法勝任的、規(guī)模達(dá)十億的、繁重的任務(wù)。
在這個(gè)例子中,AI的難點(diǎn)就在于如何提高情感分析能力,精準(zhǔn)識(shí)別出含虛假政治言論的帖子。
但相比之下,識(shí)別『諷刺』可能比識(shí)別虛假政治言論對(duì)AI而言更有難度。
根據(jù)百度百科顯示,『諷刺』是指用比喻、夸張等手法對(duì)人或事進(jìn)行揭露、批評(píng);用譏刺和嘲諷筆法描寫(xiě)敵對(duì)的落后的事物;用譏諷的眼神,嘲笑的語(yǔ)氣對(duì)著他人說(shuō)。
明顯的諷刺意味人類(lèi)可以一眼看穿,但對(duì)于AI來(lái)說(shuō)卻不是一件容易的事兒。
最新的研究成果在2019年,首次引入多模態(tài)檢測(cè)的AI模型HFM,其準(zhǔn)確率能夠達(dá)到83%。而近日,該項(xiàng)研究取得突破性進(jìn)展,其準(zhǔn)確率提升了2.74%。
這項(xiàng)成果來(lái)自中國(guó)北京的信息工程研究所和中國(guó)科學(xué)院聯(lián)合研究團(tuán)隊(duì),他們研發(fā)的新型多模態(tài)AI諷刺檢測(cè)模型,經(jīng)過(guò)Twitter數(shù)據(jù)集檢測(cè)準(zhǔn)確率可達(dá)到86%。
研究人員介紹,他們從2016年開(kāi)始嘗試多模式策略,并將其應(yīng)用在Tumblr,Instagram和Twitter等多個(gè)網(wǎng)絡(luò)數(shù)據(jù)集中進(jìn)行測(cè)試。
目前這項(xiàng)研究成果代表了AI多模式諷刺檢測(cè)的最高水準(zhǔn),并且已在計(jì)算機(jī)語(yǔ)言協(xié)會(huì)(ACL)、自然語(yǔ)言處理實(shí)證方法協(xié)會(huì)(EMNLP)等多個(gè)NLP頂會(huì)上發(fā)表。
據(jù)了解,“多模式檢測(cè)(MultiModal Detection)”已成為一種主要的『諷刺』檢測(cè)模式,此前密歇根大學(xué)和新加坡大學(xué)的研究人員也曾使用語(yǔ)言模型和計(jì)算機(jī)視覺(jué)來(lái)檢測(cè)電視節(jié)目中的諷刺,相關(guān)研究也發(fā)表在了ACL上。
相比之下,此次研究成果在技術(shù)上有哪些特別之處呢?
特別之處在于:他們發(fā)現(xiàn)了多模態(tài)之間的不一致性!
什么叫多模態(tài)呢?官方定義是每一種信息的來(lái)源或形式,都可以成為一種模態(tài)。比如,人有觸覺(jué),聽(tīng)覺(jué),視覺(jué),嗅覺(jué),以上都是一種模態(tài)。
那么,對(duì)于Twitter發(fā)帖來(lái)說(shuō),文字、圖片、視頻分別代表了三種模態(tài)。研究人員發(fā)現(xiàn),現(xiàn)有的多模態(tài)諷刺檢測(cè)方法通常是簡(jiǎn)單地將多模態(tài)特征連接起來(lái),或者以設(shè)計(jì)的方式融合多模態(tài)信息,而忽略了多模態(tài)之間和模態(tài)內(nèi)的不一致性。
受此啟發(fā),他們提出了一種基于BERT架構(gòu)的模型,該模型可有效解決這一問(wèn)題。
模型框架
具體來(lái)說(shuō),研究人員利用自注意機(jī)制(Self-Attention Mechanism)的思想,設(shè)計(jì)了一種模態(tài)間注意力機(jī)制以捕獲其間的不一致性。圖中,預(yù)先訓(xùn)練的BERT模型對(duì)給定的序列和其中的Hashtags進(jìn)行編碼。ResNet用于獲取圖像形式。我們運(yùn)用Intra-modality注意來(lái)模擬文本內(nèi)部的不協(xié)調(diào),而Inner-modality來(lái)模擬文本和圖像之間的不協(xié)調(diào)。然后將不協(xié)調(diào)信息進(jìn)行組合并用于預(yù)測(cè)。
實(shí)驗(yàn)結(jié)果表明,該模型在公共多模式諷刺檢測(cè)數(shù)據(jù)集上達(dá)到了最新的性能—86%。
與此同時(shí),研究人員還將該模型與現(xiàn)有模型基準(zhǔn),從預(yù)測(cè)率(Precision)、召回率(Recall)、精準(zhǔn)度(Accuracy)和F1分?jǐn)?shù)等指標(biāo)進(jìn)行了比較。
結(jié)果顯示,與當(dāng)前最先進(jìn)的層次融合模型HFM相比,提高了2.74%。與微調(diào)的BERT模型相比,提高了2.7%。如圖:
從該表中可以看出,僅使用圖像特征的模型并沒(méi)有很好的表現(xiàn)(72.6%),這說(shuō)明對(duì)于多模態(tài)檢測(cè)任務(wù)來(lái)說(shuō),圖像是不能單獨(dú)處理的。而且基于文本模態(tài)的方法(均在80%以上)比基于圖像模態(tài)的方法具有更好的性能。因此,文本信息比圖像信息更能用于諷刺信息的檢測(cè)。
此外,經(jīng)過(guò)微調(diào)的BERT模型比其他基于文本的非預(yù)訓(xùn)練模型表現(xiàn)得更好,這也再次驗(yàn)證了研究人員的設(shè)想,即像BERT這樣的預(yù)訓(xùn)練模型可以改進(jìn)檢測(cè)任務(wù),它表明視覺(jué)+文本模式的模型通常比其他模式能夠獲得更好的結(jié)果,同時(shí),它也說(shuō)明圖像有助于提高檢測(cè)性能。
值得注意的是,從文本模態(tài)內(nèi)部的模型來(lái)看,SIARN(80.5%)和SMSD(80.9%)都考慮了不一致信息,且性能表現(xiàn)優(yōu)于TextCNN(80%),因此,不一致信息有助于識(shí)別諷刺,再次驗(yàn)證研究人員提出的模態(tài)間的非一致性檢測(cè)方法比簡(jiǎn)單的模態(tài)間連接方法更有效。
更多論文詳情,可參見(jiàn):https://www.aclweb.org/anthology/2020.findings-emnlp.124.pdf
引用鏈接:
https://www.engadget.com/facebook-develops-ai-moderation-tools-that-actually-work-at-facebookscale-180058754.html
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。