丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

0

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

本文作者: 楊曉凡 2017-07-27 15:06 專題:CVPR 2017
導(dǎo)語:視頻實(shí)時分析,找明星同款變得輕松加愉快

雷鋒網(wǎng) AI 科技評論按:CVPR是近十年來計算機(jī)視覺領(lǐng)域全球最有影響力、內(nèi)容最全面的頂級學(xué)術(shù)會議,由全球最大的非營利性專業(yè)技術(shù)學(xué)會IEEE(電氣和電子工程師協(xié)會)主辦。今年CVPR審核了2620篇文章,最終收錄783篇,錄取率29%。阿里巴巴集團(tuán)數(shù)據(jù)科學(xué)與技術(shù)研究院 iDST 和人工智能研究院 AI LAB 也有多篇論文被收錄。

本文就是對阿里巴巴 iDST 視頻分析團(tuán)隊(duì)的 CVPR 2017論文「 Video2Shop: Exact Matching Clothes in Videos to Online Shopping Images 」(從視頻到電商:視頻衣物精確檢索)的解讀,文章作者為阿里巴巴方廣、磐君、思淘。

阿里巴巴 iDST 視頻分析團(tuán)隊(duì)在這篇論文中圍繞視頻電商業(yè)務(wù)場景,提出了一個在線視頻衣物精確檢索系統(tǒng)。該系統(tǒng)能夠滿足用戶在觀看影視劇時想要同時購買明星同款的需求。整個系統(tǒng)采用了目前最先進(jìn)的衣物檢測和跟蹤技術(shù),針對明星同款檢索中存在的多角度、多場景、遮擋等問題,提出可變化的深度樹形結(jié)構(gòu)(Reconfigurable Deep Tree structure),利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問題。該結(jié)構(gòu)可以認(rèn)為是對現(xiàn)有attention模型的一種擴(kuò)展,可以用來解決多模型融合問題。

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

論文技術(shù)在天貓魔盒視頻中應(yīng)用

業(yè)務(wù)場景及研究問題:視頻電商中的衣物精確匹配

早在 2014 年,阿里與優(yōu)酷土豆發(fā)布視頻電商戰(zhàn)略,稱未來可以實(shí)現(xiàn)邊看邊買,使得視頻電商的概念,繼微博電商,朋友圈電商之后浮出水面。電商平臺擁有少量商品,而視頻網(wǎng)站具有巨大的流量,二者結(jié)合是發(fā)展的必然結(jié)果。電商平臺可以借助視頻網(wǎng)站的流量來實(shí)現(xiàn)導(dǎo)流和平臺下沉,而視頻網(wǎng)站則需要通過廣告點(diǎn)擊和商品成交來實(shí)現(xiàn)流量變現(xiàn),因此二者的結(jié)合可謂一拍即合。視頻電商的商業(yè)主旨是打造以視頻為入口的購物服務(wù),視頻中出現(xiàn)所有物體都可能是商品,提供包括邊看邊買、明星同款、廣告投放等服務(wù),它集娛樂、休閑、購物于一體,給用戶構(gòu)造出一種“身臨其境”情境營銷,或者是明星同款的沖動式消費(fèi)。視頻電商目前已經(jīng)不是停留在概念層次了,視頻網(wǎng)站向電商的導(dǎo)流轉(zhuǎn)化也一直在不斷的嘗試中。

然而影視劇中的服飾存在較大的差異性和異構(gòu)性, 同一個目標(biāo)往往展現(xiàn)出較大的差異。服飾購物圖像通常具有雜亂、多樣的背景, 而且常在戶外拍攝。多樣化的背景可能是建筑物,街道、風(fēng)景、汽車等多種情況。由于自然場景下受到光線、角度、大小、分 辨率、幾何學(xué)和光度學(xué)的變化等影響,使得服飾呈現(xiàn)出現(xiàn)的外形極為復(fù)雜,即使是同一件服飾也會出現(xiàn)變化較大的效果。同時在線網(wǎng)站為更好地展示服飾的效果,通常聘請時尚模特穿著所售商品,模特/人物姿勢變化也是導(dǎo)致服飾變化的一個重要因素。 由于以上這些因素,使得視頻明星同款搜索成為了一個極具挑戰(zhàn)性的技術(shù)問題。

網(wǎng)絡(luò)結(jié)構(gòu)及技術(shù)細(xì)節(jié)

AsymNet網(wǎng)絡(luò)結(jié)構(gòu):整個Asymnet深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。當(dāng)用戶通過機(jī)頂盒(天貓魔盒)觀看視頻時,該網(wǎng)絡(luò)將從電商網(wǎng)站(淘寶、天貓)檢索到與之匹配的衣服,并推薦給用戶。為忽略復(fù)雜背景對檢索結(jié)果的影響,更準(zhǔn)確的進(jìn)行服裝定位,我們首先應(yīng)用服飾檢測技術(shù),提取得到服飾區(qū)域一組候選框。然后對這些候選框進(jìn)行跟蹤,得到明星同款在視頻中的的運(yùn)動軌跡。對于衣物候選區(qū)域和運(yùn)動軌跡我們分別利用用圖像特征網(wǎng)絡(luò)(IFN)和視頻特征網(wǎng)絡(luò)(VFN)進(jìn)行特征學(xué)習(xí)??紤]到服裝的運(yùn)動軌跡,衣物精確檢索問題被定義為不對稱(多對單)匹配問題,我們提出可變化的深度樹形結(jié)(Reconfigurable Deep Tree Structure),利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問題。后續(xù)本文將詳細(xì)介紹模型的各個部分。

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

圖 1 Asymnet深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

圖像特征網(wǎng)絡(luò)(IFN):傳統(tǒng)CNN網(wǎng)絡(luò)要求輸入圖像為固定的227x227(因?yàn)镃NN網(wǎng)絡(luò)中的卷積層需要有一個確定的預(yù)定義的維度)。在視頻電商業(yè)務(wù)場景中,因?yàn)橐挛餀z測候選框?yàn)槿我獯笮?,尺度變化很大,傳統(tǒng)CNN網(wǎng)絡(luò)無法進(jìn)行有效的特征學(xué)習(xí)。針對這一問題,我們利用空間金字塔池化結(jié)構(gòu)(SPP)體系結(jié)構(gòu),如圖2所示。它通過空間池聚合最后一個卷積層的特征,從而使池區(qū)域的大小與輸入的大小無關(guān)。

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

圖 2 Asymnet圖像特征網(wǎng)絡(luò)(IFN)

視頻特征網(wǎng)絡(luò) (VFN):為了更好的考慮視頻的空間序列模式,進(jìn)一步提高衣物檢索的性能。基于 LSTM,我們提出了視頻特征網(wǎng)絡(luò) (VFN),如圖3所示。其中實(shí)驗(yàn)驗(yàn)證明兩層堆疊式 LSTM 結(jié)構(gòu)能夠在視頻特征學(xué)習(xí)中得到最佳性能。

 阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

圖 3 Asymnet視頻特征網(wǎng)絡(luò) (VFN)

相似性網(wǎng)絡(luò):明星同款匹配不同于近似衣物檢索,精確匹配要求完全一致。在完全一致的 要求下,傳統(tǒng)的通過相似性計算來進(jìn)行檢索的方法,不能滿足明星同款精確匹配要求。已有的方法通常將精確匹配問題轉(zhuǎn)換為一個二分類問題,但這種方式適應(yīng)性差,只能利用單一時刻的視頻幀。為了能夠利用整個衣物運(yùn)動軌跡,我們提出了如下的可變化的深度樹形結(jié)構(gòu)(Reconfigurable Deep Tree structure)將匹配問題轉(zhuǎn)換為邏輯回歸問題。匹配網(wǎng)絡(luò)擬采用基于混合專家系統(tǒng)的邏輯回歸網(wǎng)絡(luò)。該結(jié)構(gòu)可以認(rèn)為是對現(xiàn)有attention模型的一種擴(kuò)展,可以用來解決多模型融合問題。

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

圖 4 Asymnet相似性網(wǎng)絡(luò)

整個模型的目標(biāo)函數(shù)是綜合考慮每一幀的匹配結(jié)果,得到基于整個衣物運(yùn)動序列和電商衣物的相似性,整個系統(tǒng)可以建模為對如下目標(biāo)公式進(jìn)行求解:

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

類似于attention機(jī)制,我們提出如下后驗(yàn)概率模型,來對上式進(jìn)行求解:

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

得到如下梯度并采用端到端方式進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)。 阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

試驗(yàn)結(jié)果

我們利用業(yè)務(wù)數(shù)據(jù)和最新的衣物檢索方法進(jìn)行了對比,試驗(yàn)結(jié)果如下表所示。相對于alexnet,Asymnet在前20的檢索精確率指標(biāo)上,其性能幾乎提高了進(jìn)一倍。相對于其他2種網(wǎng)絡(luò)CS 和RC, 我們發(fā)現(xiàn)RC的性能略優(yōu)于CS,因?yàn)镽C具有較強(qiáng)的識別能力差異較?。ú捎枚嗳蝿?wù)學(xué)習(xí))。甚至在對于某些類別(無明顯差別)RC在精確率上甚至略好于AsymNet,但是總的來說AsymNet比目前現(xiàn)有的方法擁有更好的性能。因?yàn)锳symnet可以處理現(xiàn)有的視頻的時空動態(tài)變化,并結(jié)合自動視頻幀的自動調(diào)節(jié)爐排判別信息的融合策略。

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

論文下載鏈接:http://openaccess.thecvf.com/content_cvpr_2017/papers/Cheng_Video2Shop_Exact_Matching_CVPR_2017_paper.pdf 

CVPR 2017 后續(xù)報道、更多近期學(xué)術(shù)會議現(xiàn)場報道,請繼續(xù)關(guān)注雷鋒網(wǎng) AI 科技評論。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

阿里iDST的CVPR論文:剁手有了新方法,明星同款邊看邊買 | CVPR 2017

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說