3
本文作者:雷鋒網(wǎng)宅客頻道主筆,李勤。
說到閱片無數(shù),你一定記得首席鑒黃師唐馬儒。
如果一天同時有一萬個唐馬儒實時在線鑒片,世界將會變成怎樣?
是的,那畫面太美我也不敢想。不過,9月15日,在百度云智峰會的分論壇“視頻智能技術(shù)與平臺”上,百度云高級產(chǎn)品專家黃鋒在視頻 AI 產(chǎn)品發(fā)布中介紹了“復(fù)制10000個唐馬儒”的功能。
到底怎么回事?
現(xiàn)在大家直播玩得666,短視頻也十分火熱,攝像頭還到處都要,這造成了一種嚴(yán)峻的局面:視頻量海量增長,誰知道里面有沒有混入一些黃賭毒等奇怪的東西。
個人可能看得開心(或者不開心?),平臺要承擔(dān)相應(yīng)的責(zé)任。于是,這些企業(yè)很煩惱:現(xiàn)在群主都可能被拉下水,何況我們平臺?!
于是,百度云就趁機(jī)利用視頻人工智能技術(shù)推出了內(nèi)容分析 VCA 、內(nèi)容審核VCR 和封面智選 VCS 。
我們先從內(nèi)容分析 VCA說起 。
除了視頻量比海深,之前很多企業(yè)依靠的是人工審核標(biāo)注團(tuán)隊,所謂人工審核標(biāo)注,就是一堆勤勞的唐馬儒不停地鑒定視頻,給視頻打上標(biāo)簽。如果只是篩選出黃賭毒也就罷了,要是要做內(nèi)容分類、推薦怎么辦?
唐馬儒的身體不只被掏空~人力成本太高,企業(yè)請不起這么多唐馬儒,畢竟人家在用生命工作,很貴的。
這時,AI 技術(shù)派上了用場。
AI 版唐馬儒拿到一個視頻后,把視頻分為了幾層:鏡頭、幀和語音。然后,它開始了視頻場景識別、人臉識別、字幕識別、物體識別,同步進(jìn)行語言識別,并將語音識別的結(jié)果與之進(jìn)行交叉認(rèn)證,從而精準(zhǔn)地判斷這個人在什么場景下在干嘛,他周圍有些什么物體。
黃鋒稱,這些識別模型使用了 1000 萬+訓(xùn)練數(shù)據(jù),能識別 5000 多個場景與40000 種物體,并且用上了百度的人臉識別技術(shù),還有百度百科公眾人物庫與自定義人臉庫。
也就是說,他不僅能從海量視頻中檢索出鹿晗,還能識別這是一個在郵筒邊拍照的鹿晗,還是在跳舞的鹿晗。
或者,是一個在中國工作拿著仙女棒的波多野結(jié)衣或在日本和道具一起加班的波老師。
黃鋒說,對比人工,VCA 分析效率提升5倍,日吞吐能力相當(dāng)于10000人,分析成本降低了 50%,召回率提高 10 倍。
下面來到了你們最關(guān)心的鑒黃,哦不,內(nèi)容審核 VCR 。
還是按照內(nèi)容分析VCA 一樣,AI 唐馬儒講視頻分層成了幀和音頻,然后將兩者(圖像)與視頻黑庫中的圖像指紋和聲紋指紋進(jìn)行對比,AI 會自動對這個視頻進(jìn)行色情識別、暴恐識別、政治人物識別和廣告識別。
(看上去,視頻黑庫其實就是小黑屋?)
視頻中的畫面進(jìn)行文字識別得到字幕,視頻中的語音通過長語音識別也變成文字,這兩部分文字都再進(jìn)行文本審核。
問題來了,假如什么話都沒有,畫面也不暴露,一言不合就開車,只剩下不能描述的哼哼唧唧的聲音怎么辦?
黃鋒表示,不要擔(dān)心,我們 AI 識別還有“嬌喘模式”,能識別這些不可描述的聲音。
對這些視頻內(nèi)容進(jìn)行嚴(yán)格的審核后,AI 唐馬儒有三個處理模式:通過、封禁、人審。
所謂人審,就是你藏得太深了,連本 AI 都搞不定,讓我家真正的唐馬儒出馬吧!
黃鋒指出,VCR 還有更多的用武之地:
視頻去重:兩個清晰度不一、但內(nèi)容相同的視頻,當(dāng)然是取其一了。
廣電監(jiān)播。
侵權(quán)檢測:納尼,你怎么是個盜版,殺無赦。
雷鋒網(wǎng)宅客頻道編輯也不想承認(rèn)這一點,但是沒辦法,你去超市買個西紅柿都會選更好看的那一個啊?。。?/p>
黃鋒稱,視頻封面質(zhì)量對用戶點擊影響很大。
也就是說,平臺當(dāng)然是要選更具有精神內(nèi)涵和和諧美感的封面了!
他向雷鋒網(wǎng)介紹了 VCS 封面選圖過程,通過鏡頭檢測——主/客觀質(zhì)量過濾——內(nèi)容相關(guān)性三個步驟,AI 幫助一個視頻選出了自己賣相最好的那一張封面照。
(這個過程不亞于女生從一堆自拍照里選出一張發(fā)朋友圈吧?)
我們來看一下以前的封面選圖效果和VCS 的選圖效果對比照:
[圖1]
[圖2]
[圖3]
[圖4]
圖1和圖3均是以前封面選圖的結(jié)果,呈現(xiàn)局部或者單一圖像,圖2和圖4是VCS的選圖,圖2呈現(xiàn)了人和寵物的關(guān)系,圖4展現(xiàn)的是完整的車。
其實,聽到最后,宅客頻道編輯弱弱提出了一個終極疑惑:這和百度云是什么關(guān)系?
黃鋒說,這是百度云接入的視頻 AI 能力,通過線上溝通、定制方案、測試對接,最后就能正式上線。
好吧好吧,你說什么都對。
反正聽到“嬌喘模式”那一節(jié)時,雷鋒網(wǎng)編輯已經(jīng)笑到抽搐不在線了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。