丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給小芹菜
發(fā)送

1

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

本文作者: 小芹菜 2016-06-01 19:18 專題:雷峰網(wǎng)公開課
導(dǎo)語:直播火爆的背后,都存在哪些問題?機(jī)器如何識別小黃圖?

今年8月,雷鋒網(wǎng)將在深圳舉辦一場盛況空前,且有全球影響力的人工智能與機(jī)器人創(chuàng)新大會。屆時雷鋒網(wǎng)將發(fā)布“人工智能&機(jī)器人Top25創(chuàng)新企業(yè)榜”榜單。目前,我們正在拜訪人工智能、機(jī)器人領(lǐng)域的相關(guān)公司,從中篩選最終入選榜單的公司名單。如果你也想加入我們的榜單之中,請聯(lián)系:2020@leiphone.com。


雷鋒網(wǎng)按:本文整理自圖普科技李明強(qiáng)在雷鋒網(wǎng)硬創(chuàng)公開課上的演講。李明強(qiáng)是圖普科技創(chuàng)始人& CEO。原騰訊T4技術(shù)專家,騰訊資深項目經(jīng)理,QQ郵箱項目負(fù)責(zé)人,微信立項創(chuàng)始人之一。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

| 直播火爆的背后,都存在哪些問題?

1、直播內(nèi)容監(jiān)管存在什么困難?

第一、網(wǎng)絡(luò)直播規(guī)模龐大,人工審核成本高

2015年直播平臺接近200家,用戶數(shù)量已經(jīng)達(dá)到2億,大型直播平臺每日高峰時間會有數(shù)萬個直播“房間”同時在線,用戶數(shù)可達(dá)千萬人次,如果全部用人工對1萬路視頻同時進(jìn)行審核,為了保證“無漏網(wǎng)之魚”,至少需要數(shù)百人同時工作,并且每位工作人員需要配備1-2臺監(jiān)控設(shè)備。

比如映客現(xiàn)在在審核上投入的人力是800多人,占用了7000平方米的審核基地,24h的人力審核。其實直播視頻內(nèi)容的違規(guī)比例占比不高,僅0.04%,甚至更低,但為了做到“無漏網(wǎng)之魚”,企業(yè)需要投入大量的人力、物力和財力進(jìn)行監(jiān)管,運(yùn)營成本壓力增加。

第二、直播流量聚焦夜晚,人工審核效率低

網(wǎng)絡(luò)直播白天跟晚上的“房間數(shù)”不同,目前,白天直播流量峰值是數(shù)百路視頻,晚上可以飆升到數(shù)千路。但“三班倒”的審核人員,夜晚疲勞,人眼識別精確度降低,出現(xiàn)誤判漏判的概率上漲,審核效率降低,難以達(dá)到網(wǎng)絡(luò)直播的內(nèi)容監(jiān)管需求。

第三、主播實名及直播實時驗證難

直播平臺注冊簡單,主播規(guī)模擴(kuò)充迅速,如果實名驗證完全依靠人力審核,人力成本增加,難以做到真實有效的審核;再加上一些稍微大一些的直播平臺高峰期時期會有上萬人,如果每次主播直播時,都驗證是否屬于本人在直播,這又增加一部分人力成本,對于一些中小型直播創(chuàng)業(yè)企業(yè)而言,運(yùn)營難度上升。

2、國家對于監(jiān)管出臺的政策,對直播平臺有什么影響?

(1)從直播平臺本身來說,能夠促進(jìn)直播平臺加強(qiáng)自律:例如部分直播平臺規(guī)定主播需實名驗證、滿18周歲;直播內(nèi)容存儲時間不少于15天;所有直播房間內(nèi)添加水?。粚τ谇楣?jié)嚴(yán)重的主播將列入黑名單、對直播內(nèi)容進(jìn)行24小時實時監(jiān)管等。

(2)從直播平臺的發(fā)展來說,對于大型企業(yè)的發(fā)展是比較有優(yōu)勢的,大型直播平臺對監(jiān)管成本上升的承受能力比較高,中小型視頻直播平臺將在監(jiān)控審查成本的提升環(huán)境下挑戰(zhàn)增大。

(3)從直播平臺的內(nèi)容發(fā)展來說,依靠色情、暴力等擦邊球的“激進(jìn)”內(nèi)容來吸引用戶的道路越來越不可行,未來受歡迎有潛質(zhì)的主播也許會更加偏向?qū)I(yè)化。

| 機(jī)器是如何審核直播的?

1、審核直播的方式都有哪些?

傳統(tǒng)的圖像審核方式主要有兩種:

  • 純?nèi)斯徍耍浩髽I(yè)員工“三班倒”工作;

  • 傳統(tǒng)智能審核:人眼鑒別該圖片或視頻是否違規(guī);傳統(tǒng)的智能審核:如識別色情圖像,基本是通過圖片 RGB 值識別膚色比例;通過建模識別異常動作、敏感部位等。

但是這兩種審核方式都存在較大的漏洞,“三班倒”的人工容易導(dǎo)致審核效率低、誤判漏判多等主觀性問題;傳統(tǒng)智能識別色情圖片準(zhǔn)確率低、經(jīng)常誤報等。而且這三種審核方式對近兩年熱門的視頻直播審核需求更難以滿足。

現(xiàn)在主要是利用機(jī)器識別結(jié)合人工審核的模式進(jìn)行審核,機(jī)器識別是依賴于人工智能領(lǐng)域最新的算法:深度學(xué)習(xí)算法,通過模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。通過大數(shù)據(jù)持續(xù)訓(xùn)練、頻繁的迭代,不斷提高鑒黃精確度,有效節(jié)省人工復(fù)審的工作。

2、審核直播內(nèi)容,機(jī)器都做了什么?

(1)機(jī)器審核直播內(nèi)容是否涉黃、違法

機(jī)器主要是用來專門判斷哪些圖片是色情的或者需要被過濾掉的違法信息,它在這方面的智能程度是可以替代人力的,經(jīng)過機(jī)器審核后的數(shù)據(jù),會分為“確定”和“不確定”的兩個部分,確定部分的可以達(dá)到99.5%的準(zhǔn)確率,不確定的會誠實地告訴客戶,由客戶做出決斷。不確定的部分可能只占到審核總量的1~2%,原先需要100個人審核,經(jīng)過機(jī)器識別服務(wù),就可以只用1~2個人來完成了。

 圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

(2)機(jī)器識別的工作原理

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

簡單來說,可以把深度學(xué)習(xí)理解為一個空白的人腦,這些大量的數(shù)據(jù)就是灌輸進(jìn)來的經(jīng)驗。深度學(xué)習(xí)是屬于機(jī)器學(xué)習(xí)的一個范疇,是最新的機(jī)器學(xué)習(xí)的技術(shù),主要體現(xiàn)在“深度”這兩字上

深度學(xué)習(xí)可以理解為“深度機(jī)器學(xué)習(xí)”的意思,因為普通或者傳統(tǒng)的機(jī)器學(xué)習(xí),在神經(jīng)網(wǎng)絡(luò)的復(fù)雜度和層數(shù)沒有像現(xiàn)在這么高,深度學(xué)習(xí)就是一層一層的層數(shù)變多了,層數(shù)和復(fù)雜度都加深了許多,所以現(xiàn)在才會叫做深度學(xué)習(xí)。

譬如說你想訓(xùn)練一只狗,狗做對了你就給它激勵,為它或者做錯了你就懲罰它,那久而久之它就知道哪些是正向、或負(fù)向的激勵,然后就明白自己哪些事情是自己應(yīng)該去做的,對于錯誤的事情的想法也會逐漸被抵消。

當(dāng)我們把大量的色情、性感、正常的樣本的屬性告訴深度學(xué)習(xí)的引擎, 然后讓引擎不斷學(xué)習(xí),然后把他們做對的進(jìn)行獎勵,做錯的就懲罰,當(dāng)然這些獎勵和懲罰都是數(shù)學(xué)上的,最后空白的腦袋就會學(xué)成了一種連接的模型,這種模型就是為了鑒別色情與非色情而生的。

機(jī)器識別原理的圖像識別技術(shù)是如何像人腦一樣認(rèn)識、學(xué)習(xí)圖像特征的呢?

其核心是深度學(xué)習(xí)理論(Deep Learning)。深度學(xué)習(xí)就是人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,以下簡稱 ANN)。要了解 ANN,讓我們先來看看人類的大腦是如何工作的。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

(人腦的視覺處理系統(tǒng) via:Simon Thorpe)

上圖所表達(dá)的,就是人理解外界視覺信息的過程。

從視網(wǎng)膜(Retina)出發(fā),經(jīng)過低級的 V1 區(qū)提取邊 緣特征,到V2 區(qū)的基本形狀或目標(biāo)的局部,再到高層的整個目標(biāo)(如判定為一張人臉),以及到更高層的 PFC(前額葉皮層)進(jìn)行分類判斷等。也就是說高層的特征是低層特征的組合,從低層到高層的特征表達(dá)越來越抽象和概念化,也即越來越能表現(xiàn)語義或者意圖。

深度學(xué)習(xí),恰恰就是通過組合低層特征形成更加抽象的高層特征(或?qū)傩灶悇e)。然后在這些低層次表達(dá)的基礎(chǔ)上,通過線性或者非線性組合,來獲得一個高層次的表達(dá)。此外,不僅圖像存在這個規(guī)律,聲音也是類似的。

下面來看看深度學(xué)習(xí)的簡易模型:

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)與深度神經(jīng)網(wǎng)絡(luò)

深度學(xué)習(xí)的一個主要優(yōu)勢在于可以利用海量訓(xùn)練數(shù)據(jù)(即大數(shù)據(jù)),在學(xué)習(xí)的過程中不斷提高識別精度,但是仍然對計算量有很高的要求。而近年來,得益于計算機(jī)速度的提升、大規(guī)模集群技術(shù)的興起、GPU 的應(yīng)用以及眾多優(yōu)化算法的出現(xiàn),耗時數(shù)月的訓(xùn)練過程可縮短為數(shù)天甚至數(shù)小時,深度學(xué)習(xí)才逐漸可以用于工業(yè)化。

對于開發(fā)團(tuán)隊來說,做該領(lǐng)域產(chǎn)品的困難在于如何獲取大規(guī)模已標(biāo)注數(shù)據(jù)、集成有 GPU 的計算集群以及針對自己的項目調(diào)參數(shù),團(tuán)隊需要不斷地輸入新數(shù)據(jù),持續(xù)迭代以提高機(jī)器識別準(zhǔn)確率。

那么為什么之前機(jī)器學(xué)習(xí)沒有爆發(fā),只是在這一兩年開始爆發(fā)?

因為機(jī)器學(xué)習(xí)需要同時滿足三個條件:

1、海量的數(shù)據(jù)(大家都知道互聯(lián)網(wǎng)發(fā)展那么多年,已經(jīng)積累了大量的數(shù)據(jù)了);

2、高性能計算的能力 (顯卡和GPU因為摩爾定律的發(fā)展,也已經(jīng)積累了很多年);

3、深度學(xué)習(xí)的算法(是在2012年被一次imagenet的比賽,被業(yè)界廣泛注意到,隆重地登上了歷史的舞臺)

3、直播數(shù)量那么大,如何審核/推薦?

 1)做圖像識別的公司有哪些,競爭差異在哪里?

智能審核垂直領(lǐng)域的有騰訊優(yōu)圖、阿里綠網(wǎng),他們主要為自身的平臺客戶提供審核服務(wù),不屬于第三方。

2)目前服務(wù)的直播客戶包括花椒、在直播、映客、17直播、悟空TV等等。

這里主要分為兩種服務(wù)類別:

標(biāo)準(zhǔn)審核服務(wù):包括鑒黃、暴恐識別、廣告識別、敏感人臉過濾等;


個性化定制服務(wù):根據(jù)客戶的實際需求,定制專屬的圖像識別整體解決方案,譬如針對特定場景(抽煙、喝酒、打架、自殘等)的審核,人臉識別(主播顏值、風(fēng)格、表情、年齡、性別、其他外在特征等)、場景識別(主播直播時所在環(huán)境)、物體識別(直播平臺中出現(xiàn)的物體)等各種圖像的識別。

直播平臺的個性化推薦,是在傳統(tǒng)推薦系統(tǒng)的基礎(chǔ)上,融入圖像識別技術(shù),以用戶的即時興趣為基礎(chǔ),智能推薦符合用戶心理預(yù)期的內(nèi)容。

比如在場景的精準(zhǔn)推送上,可以基于人臉、場景、商品識別與分析技術(shù),抓取視頻內(nèi)的價值信息,實現(xiàn)最精準(zhǔn)的內(nèi)容匹配;

在主播風(fēng)格推薦上,可以自動分類不同風(fēng)格的男神女神,根據(jù)用戶平臺資料和興趣,智能推送偏好類型;

還可以建立顏值推薦系統(tǒng),基于人臉識別,機(jī)器自動將高顏值主播推薦給用戶等。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

| 直播很火,機(jī)器學(xué)習(xí)同樣很火

1、除了審核直播,機(jī)器學(xué)習(xí)還能做什么?

 除了幫助直播平臺規(guī)避內(nèi)容風(fēng)險,機(jī)器識別還可以通過以下幾個形式優(yōu)化視頻直播平臺

第一、通過圖像識別對主播進(jìn)行分類,可以得出直播平臺的內(nèi)容是否健康,或者給主播打上標(biāo)簽,平臺是否需要培養(yǎng)和扶持一些比較稀缺、受歡迎的主播。

 第二、深挖直播平臺的圖像識別云服務(wù),例如主播正在做什么,唱歌、跳舞、抽煙、化妝、睡覺或其他。在將來全民生活直播,可以挖掘的信息量就更大,包括萬事萬物的識別,視頻內(nèi)出現(xiàn)的車、手機(jī)、玩具或其他的,這都是反映了一個人的生活習(xí)慣、行為習(xí)慣,機(jī)器可以根據(jù)用戶偏好,智能推送相應(yīng)直播視頻,幫助直播企業(yè)更好地進(jìn)行用戶互動運(yùn)營。

第三、直播的視頻內(nèi)發(fā)出的所有圖像信息,包括人物、地點(diǎn)、活動、事物、背景等,在以人工智能技術(shù)作為基本支撐下,可以幫助用戶智能搜索所需信息,像KTV、餐廳、教室等,這些都是可以提高產(chǎn)品和用戶體驗,或者企業(yè)想將這些信息流量變現(xiàn),均可按企業(yè)需求定制。

第四、基于人的智能搜索,幫助直播平臺把用戶和內(nèi)容串連起來,把相似的主播串連起來,讓用戶找出自己想要的人物形象。例如用戶可以描述自己夢中情人的形象然后進(jìn)行智能搜索,或上傳自己的照片即找出與自己最有夫妻相的主播等,這都是目前同質(zhì)化直播平臺沒有做到的事情。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

| 今年8月,雷鋒網(wǎng)將在深圳舉辦“全球人工智能與機(jī)器人創(chuàng)新大會”(簡稱:GAIR),機(jī)器學(xué)習(xí)的未來趨勢怎么看?

1、凱文凱利說過:“很快人工智能就講變成一種日用品。智力會像電力一樣通過網(wǎng)絡(luò)傳輸?!?nbsp;這意味著,人們將生活在被人工智能所包圍的世界里。

應(yīng)用上,建立更加實用的學(xué)習(xí)系統(tǒng),特別是開展多種學(xué)習(xí)方法協(xié)同工作的集成化系統(tǒng)的研究,機(jī)器學(xué)習(xí)將會深度融合到各個行業(yè),人工智能+的時代正在開啟。

雖然短時間內(nèi)人工智能無法理解人類的情感,在未來的五年內(nèi),人工智能技術(shù)領(lǐng)域的創(chuàng)業(yè)企業(yè)將會倍增,開發(fā)出一些功能性的應(yīng)用,人工智能將在這些專業(yè)功能上輔助人類或直接取代人類。例如人工智能可以為你推薦新聞,幫你掃地,幫你駕駛汽車,甚至幫你管理健康狀況等。五年后,將會出現(xiàn)一批相對成熟的垂直領(lǐng)域的人工智能企業(yè),人工智能與傳統(tǒng)企業(yè)的結(jié)合更加緊密。

2、技術(shù)上,發(fā)展和完善現(xiàn)有的學(xué)習(xí)方法,同時開展新的學(xué)習(xí)方法的研究,針對某個或者某類應(yīng)用的特定的學(xué)習(xí)方法將會不斷涌現(xiàn),數(shù)據(jù)管理得到更多的關(guān)注,數(shù)據(jù)的價值將繼續(xù)擴(kuò)大,對于機(jī)器學(xué)習(xí)結(jié)果的解釋會逐漸受到重視。

編者注:以下是雷鋒網(wǎng)精選公開課上的幾個精彩問答分享——

1、利用機(jī)器識別是如何對直播中的非法視頻進(jìn)行處理的呢?

通過間隔截圖,關(guān)鍵幀截圖之類的對視頻進(jìn)行處理,因為監(jiān)控是旁路的,而且可以做到峰值每秒5k并發(fā),1s-2s返回,所以不會影響實時性。在檢測到了相符信息后,機(jī)器會實時反饋結(jié)果給客戶。至于是屏蔽、刪除或者禁播等方面的處理,主要是看業(yè)務(wù)方,可以選擇由機(jī)器自動處理或者人工介入。

2、圖像識別應(yīng)用在智能醫(yī)療領(lǐng)域是怎么的?

圖像識別不僅在互聯(lián)網(wǎng)行業(yè)有應(yīng)用,在其他行業(yè)的應(yīng)用也是非常廣泛的。

比如在在智能醫(yī)療領(lǐng)域就有專門的小領(lǐng)域來專門做醫(yī)療影像處理,就像是可以通過患者的如肝臟的影像,去判斷有沒有癌變;如眼睛的影像,判斷有沒有白內(nèi)障等; 更細(xì)的還有,到血管的圖像,去判斷有沒有阻塞等。另外在一些傳統(tǒng)領(lǐng)域上的應(yīng)用,例如基于圖像搜索,可以幫助商標(biāo)局建立商標(biāo)庫,新注冊的企業(yè)就可以自動搜索是否相同的商標(biāo)被注冊了;基于物體識別,可以協(xié)助鐵路交通部門自動檢測線路的電閘是否損壞、掉漆來判斷是否需要更換;還可以幫助電視臺做廣告監(jiān)播,監(jiān)測某個品牌露出的時間、某個時間上某個商標(biāo)展示的時間長度等。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

圖像識別,怎樣守護(hù)網(wǎng)絡(luò)直播的底線?| 雷鋒網(wǎng)公開課

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,AI慕課學(xué)院負(fù)責(zé)人。關(guān)注智能駕駛與金融科技,歡迎來撩:www.mooc.ai。
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說