丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給圖普科技
發(fā)送

0

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

本文作者: 圖普科技 編輯:楊曉凡 2018-07-24 17:43
導(dǎo)語(yǔ):?德國(guó)比價(jià)網(wǎng)站idealo.de訓(xùn)練了兩個(gè)深度神經(jīng)網(wǎng)絡(luò)來(lái)評(píng)估圖像的美學(xué)質(zhì)量和技術(shù)質(zhì)量。

雷鋒網(wǎng)按:本文由「圖普科技」編譯自Using Deep Learning to automatically rank millions of hotel images

德國(guó)比價(jià)網(wǎng)站idealo.de訓(xùn)練了兩個(gè)深度神經(jīng)網(wǎng)絡(luò)來(lái)評(píng)估圖像的美學(xué)質(zhì)量和技術(shù)質(zhì)量。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

基于訓(xùn)練模型的美感可視化(美觀性按從左到右的順序逐漸增加)

idealo.de是歐洲領(lǐng)先的價(jià)格比較網(wǎng)站,也是德國(guó)最大的電商門戶網(wǎng)站之一,可提供市場(chǎng)上最好的酒店價(jià)格比較。對(duì)于每家酒店,我們都會(huì)收到數(shù)十張圖片,我們需在的優(yōu)惠對(duì)比頁(yè)面上為每個(gè)優(yōu)惠項(xiàng)選擇“最具吸引力”的圖片,這是一項(xiàng)具有挑戰(zhàn)性的工作,因?yàn)檎掌驮u(píng)論一樣對(duì)顧客是否預(yù)訂有著舉足輕重的影響。我們擁有全球百萬(wàn)家酒店的近億張酒店圖像,需要對(duì)其進(jìn)行“吸引力”評(píng)估。

我們基于谷歌發(fā)布的研究論文“NIMA:神經(jīng)圖像評(píng)估”,通過(guò)進(jìn)行美學(xué)和技術(shù)質(zhì)量分類來(lái)自動(dòng)評(píng)估圖像質(zhì)量。NIMA由兩個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)組成,旨在分別預(yù)測(cè)圖像的美學(xué)質(zhì)量和技術(shù)質(zhì)量。我們通過(guò)遷移學(xué)習(xí)來(lái)訓(xùn)練模型,其中ImageNet預(yù)訓(xùn)練的CNN會(huì)針對(duì)每個(gè)質(zhì)量分類任務(wù)進(jìn)行微調(diào)。

在本文中,我們將介紹我們?cè)谡麄€(gè)過(guò)程中使用的訓(xùn)練方法和一些見(jiàn)解。然后,我們將嘗試通過(guò)可視化我們訓(xùn)練模型的卷積濾波器權(quán)重和輸出節(jié)點(diǎn)來(lái)闡明訓(xùn)練模型習(xí)得的內(nèi)容。

我們?cè)贕itHub上發(fā)布了訓(xùn)練模型和代碼。提供的代碼支持人們使用Keras中任何預(yù)訓(xùn)練的CNN,因此我們希望為探索利用其他CNN進(jìn)行圖像質(zhì)量評(píng)估的作出貢獻(xiàn)?。

訓(xùn)練

美學(xué)和技術(shù)分類器通過(guò)遷移學(xué)習(xí)方法進(jìn)行訓(xùn)練。我們將MobileNet架構(gòu)與ImageNet權(quán)重相結(jié)合,并將MobileNet中的最后一個(gè)密集層替換為輸出為10個(gè)類(分?jǐn)?shù)為1到10)的密集層。

Earth Mover損失函數(shù)

NIMA的一個(gè)特點(diǎn)是使用Earth Mover損失(EML)作為損失函數(shù),與分類交叉熵(CCE)損失相反,該函數(shù)通常應(yīng)用于深度學(xué)習(xí)分類任務(wù)。EML可以理解為使兩個(gè)概率分布相等需要移動(dòng)的“泥土”的量。該損失函數(shù)的一個(gè)有用屬性是它可以捕獲類的固有順序。 在我們的圖像質(zhì)量等級(jí)評(píng)估中,得分為4,5和6比得分為1,5和10的相關(guān)性更高,即在真實(shí)得分為10時(shí),我們對(duì)得分為4的預(yù)測(cè)的懲罰比真實(shí)得分為5時(shí)更多。CCE無(wú)法獲得這種關(guān)系,并且在目標(biāo)分類任務(wù)中通常不需要使用CCE。(例如,將樹錯(cuò)誤分類為狗與將其歸類為貓同樣糟糕)。

為了使用EML,我們需要每個(gè)圖像在所有十個(gè)分?jǐn)?shù)類別中的分布概率。對(duì)于用于訓(xùn)練美學(xué)質(zhì)量分類的AVA數(shù)據(jù)集,可以使用這些分布概率。對(duì)于用于技術(shù)質(zhì)量分類的TID2013數(shù)據(jù)集,我們根據(jù)為每個(gè)圖像給出的平均分?jǐn)?shù)推斷出其分布。有關(guān)我們的分布推斷的更多詳細(xì)信息,請(qǐng)查看我們的GitHub repo。

微調(diào)階段

我們的模型訓(xùn)練分為兩個(gè)階段:

1.我們首先訓(xùn)練具有較高學(xué)習(xí)速率的最后一個(gè)密集層,以確保將新添加的隨機(jī)權(quán)重調(diào)整為ImageNet卷積權(quán)重。如果沒(méi)有這個(gè)老化期,你可能會(huì)在訓(xùn)練開(kāi)始時(shí)需要兼顧卷積權(quán)重,從而拖慢整個(gè)訓(xùn)練過(guò)程。

2.在老化期之后,我們訓(xùn)練學(xué)習(xí)速率較低的CNN中的所有權(quán)重。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

對(duì)于美學(xué)和技術(shù)模型,訓(xùn)練損失和驗(yàn)證損失曲線分別在第5和第25個(gè)時(shí)間段后變平。這是一個(gè)很好的指標(biāo),說(shuō)明新增加的權(quán)重已經(jīng)學(xué)會(huì)盡可能好地分類不同美學(xué)和技術(shù)質(zhì)量的圖像,并且是時(shí)候開(kāi)始訓(xùn)練所有權(quán)重了。

對(duì)于美學(xué)分類器,一旦我們也開(kāi)始訓(xùn)練卷積權(quán)重,損失會(huì)顯著下降(如左圖中的虛線),這表明我們正在調(diào)整美學(xué)質(zhì)量分類任務(wù)的卷積權(quán)重。對(duì)于技術(shù)分類器,損失的下降幅度較小,這首先是反直覺(jué)的,因?yàn)閳D像技術(shù)質(zhì)量應(yīng)該是對(duì)象不可知的,但I(xiàn)mageNet權(quán)重被優(yōu)化以便識(shí)別對(duì)象。小幅下降可能是由于規(guī)范小型TID2013數(shù)據(jù)集訓(xùn)練所需的學(xué)習(xí)速率很低。

您可以在我們的GitHub repo中找到用于訓(xùn)練的所有超參數(shù)

結(jié)果

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

MobileNet美學(xué)預(yù)測(cè)

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

MobileNet技術(shù)預(yù)測(cè)

上述預(yù)測(cè)表明,美學(xué)分類器正確地將圖像按照美觀性進(jìn)行了排列,從非常美觀(最左邊的日落圖像)到最不美觀(最右邊的無(wú)聊的酒店房間)。類似地,對(duì)于技術(shù)質(zhì)量分類,分類器預(yù)測(cè)的未失真圖像(左起第一和第四張圖像)比進(jìn)行了jpeg壓縮(第二和第五張)或模糊(第三和第六張)的圖像分?jǐn)?shù)更高。

可視化

為了更好地理解CNN如何評(píng)估圖像的美學(xué)質(zhì)量,我們使用了Lucid包來(lái)顯示Aesthetic MobileNet中的習(xí)得卷積濾波器權(quán)重和輸出節(jié)點(diǎn)。特征可視化這篇博客文章提供了最先進(jìn)的CNN可視化技術(shù)的精彩互動(dòng)概述。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

第23層濾波器可視化(頂行是ImageNet MobileNet,底行是Aesthetic MobileNet)

較早的卷積層通常與更簡(jiǎn)單的結(jié)構(gòu)相關(guān)聯(lián),例如邊緣,波形圖案和網(wǎng)格。上圖顯示了與MobileNet第23層中的六個(gè)濾波器相關(guān)聯(lián)的圖案 - 頂行中的六張圖像是由原始的MobileNet ImageNet權(quán)重(ImageNet MobileNet)生成的,而底行圖像是由根據(jù)美學(xué)質(zhì)量評(píng)級(jí)的AVA數(shù)據(jù)集微調(diào)的MobileNet權(quán)重(Aesthetic MobileNet)生成的。從濾波器可視化中我們可以看到,較早的卷積濾波器在整個(gè)微調(diào)過(guò)程中受到的影響不大,因?yàn)樗鼈兣c原始圖像非常相似。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

第51層濾波器可視化(頂行是ImageNet MobileNet,底行是Aesthetic MobileNet)

對(duì)于處于第51層的中間卷積濾波器,其所學(xué)習(xí)的形狀更復(fù)雜,類似于毛發(fā)或有扣眼的網(wǎng)格等交織結(jié)構(gòu)。即使在這種程度,Aesthetic MobileNet濾波器也非常類似于ImageNet MobileNet濾波器。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

第79層濾波器可視化(頂行是ImageNet MobileNet,底行是Aesthetic MobileNet)

后來(lái)的卷積層呈現(xiàn)出更復(fù)雜的結(jié)構(gòu),類似于動(dòng)物和樹木的形狀。 我們可以看到,Aesthetic MobileNet的濾波器與ImageNet的濾波器有很大不同,因?yàn)樗鼈兯坪醪惶P(guān)注目標(biāo),例如 左起第四個(gè)濾波器中沒(méi)有動(dòng)物形狀。

我們還可以將Aesthetic MobileNet的輸出節(jié)點(diǎn)可視化,來(lái)表示分?jǐn)?shù)1到10的概率。因此,可視化顯示與每個(gè)分?jǐn)?shù)相關(guān)聯(lián)的“代表性”圖像。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

輸出節(jié)點(diǎn)可視化Aesthetic MobileNet(按升序排列,從左上角到右下角分?jǐn)?shù)為1到10)

輸出節(jié)點(diǎn)的可視化很難解釋,就像很難定義美觀性一樣。若有任何不同的話,較低分?jǐn)?shù)的圖像的可視化似乎不那么多姿多彩,而較高的分?jǐn)?shù)則與更多的色彩和豐富的形狀相關(guān)聯(lián)。 得分為10的圖像看起來(lái)類似于具有天空背景的景觀,通常被認(rèn)為具有高度美感。

總結(jié)

在本文中,我們介紹了自動(dòng)評(píng)估圖像質(zhì)量的挑戰(zhàn)。經(jīng)過(guò)訓(xùn)練的美學(xué)和技術(shù)模型根據(jù)美學(xué)和技術(shù)質(zhì)量成功地對(duì)圖像進(jìn)行排序。我們通過(guò)可視化卷積濾波器和輸出節(jié)點(diǎn)進(jìn)一步探索了美學(xué)模型的習(xí)得CNN權(quán)重,并得出結(jié)論,微調(diào)主要影響后來(lái)的卷積權(quán)重。

微調(diào)深度神經(jīng)網(wǎng)絡(luò)是解決企業(yè)面臨的許多計(jì)算機(jī)視覺(jué)問(wèn)題的一種良好策略。然而,這些模型的分類及其數(shù)百萬(wàn)個(gè)參數(shù)通常很難解釋,我們希望通過(guò)可視化分析能使人們對(duì)這個(gè)黑盒子有所了解。

相關(guān)文章:

圖普科技 CEO 李明強(qiáng):如何用圖像識(shí)別云服務(wù),建立商業(yè)閉環(huán) 丨CCF-GAIR 2018

Google工程師:教你用樹莓派+Arduino+TensorFlow搭建圖像識(shí)別小車

從原理到代碼:大牛教你如何用 TensorFlow 親手搭建一套圖像識(shí)別模塊 | AI 研習(xí)社

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

利用深度學(xué)習(xí)自動(dòng)評(píng)價(jià)數(shù)百萬(wàn)張酒店圖像

分享:
相關(guān)文章

專欄作者

基于圖像識(shí)別技術(shù)多維度解讀圖片和視頻
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)