丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給木子
發(fā)送

0

奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

本文作者: 木子 2018-06-01 19:07
導(dǎo)語(yǔ):由Google主辦的2018 Google地標(biāo)識(shí)別挑戰(zhàn)賽于近日揭曉,來(lái)自Video++AI團(tuán)隊(duì)的參賽者以大比分優(yōu)勢(shì)獲得第1名。

奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

經(jīng)過近3個(gè)月的激烈角逐,由Google主辦的2018 Google地標(biāo)識(shí)別挑戰(zhàn)賽于近日揭曉,來(lái)自Video++AI團(tuán)隊(duì)的參賽者以大比分優(yōu)勢(shì)獲得第1名。這是中國(guó)AI團(tuán)隊(duì)在此類國(guó)際大賽中第一次奪冠。

作為本次挑戰(zhàn)賽的獲勝者,Video++將受邀在美國(guó)舉辦的CVPR會(huì)議上發(fā)表技術(shù)研討,該會(huì)議是全球計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)會(huì)議,在會(huì)議業(yè)界和學(xué)界都享負(fù)盛名。

今年3月,Google推出了目前世界上最大的人造和自然地標(biāo)識(shí)別數(shù)據(jù)Google-Landmarks。數(shù)據(jù)集中包含了200萬(wàn)張圖片,囊括了全球30000處的獨(dú)特地標(biāo),量級(jí)是普通的數(shù)據(jù)集的30倍,數(shù)據(jù)達(dá)到前所未有的龐大體量。

奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

Google-Landmarks地標(biāo)的地理分布

Google以此為契機(jī)推出了2018Google地標(biāo)識(shí)別挑戰(zhàn)賽,用于號(hào)召全球范圍內(nèi)計(jì)算機(jī)視覺領(lǐng)域的科學(xué)精英共同參與,以突破該數(shù)據(jù)目前缺乏大型標(biāo)注數(shù)據(jù)集的難題。

地標(biāo)識(shí)別挑戰(zhàn)賽全程在Google旗下Kaggle平臺(tái)進(jìn)行報(bào)名與提交,該平臺(tái)目前在全球范圍內(nèi)擁有近100萬(wàn)的數(shù)據(jù)科學(xué)家用戶,是全球最具權(quán)威的數(shù)據(jù)科學(xué)競(jìng)賽平臺(tái)。

參賽機(jī)制需要參賽者在給定查詢圖像后,在數(shù)據(jù)庫(kù)中識(shí)別出包含查詢地標(biāo)的所有圖像,這對(duì)于上百萬(wàn)級(jí)的數(shù)據(jù)體量與無(wú)關(guān)信息過多的圖像內(nèi)容而言,挑戰(zhàn)難度難以想象。

除此之外,由于檢測(cè)對(duì)象是地標(biāo)的原因,它的識(shí)別相對(duì)其他對(duì)象的同類操作之間也存在顯著差異。例如,就算在大型帶標(biāo)注的數(shù)據(jù)集里,那些不太熱門的地標(biāo),一般情況下是不存在訓(xùn)練數(shù)據(jù)的;另外,地標(biāo)通常是不可移動(dòng)的剛性對(duì)象,此時(shí)圖像的捕獲條件,如遮擋、角度、天氣、光線等,都會(huì)對(duì)識(shí)別結(jié)果產(chǎn)生影響。

盡管如此,地標(biāo)識(shí)別挑戰(zhàn)賽仍舊吸引了來(lái)自全球的483支團(tuán)隊(duì)、653名選手參賽,賽程先后歷時(shí)近3個(gè)月,參賽者都是世界各地計(jì)算機(jī)視覺領(lǐng)域具有豐富經(jīng)驗(yàn)的優(yōu)質(zhì)個(gè)人與團(tuán)隊(duì)。Video++的AI團(tuán)隊(duì)最終以總比分0.304位列榜單第1名,超越了很多知名AI團(tuán)隊(duì);第二名和第三名的得分分別為0.290和0.289。

奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

 Google地標(biāo)識(shí)別挑戰(zhàn)賽榜單排名

作為本次Google地標(biāo)識(shí)別挑戰(zhàn)賽的冠軍,Video++的參賽AI團(tuán)隊(duì)也分享了他們的獲勝方案:

本次比賽訓(xùn)練數(shù)據(jù)集接近120萬(wàn)張,近1.5萬(wàn)個(gè)類別,但是每個(gè)類別的圖片數(shù)目差距較大,大多數(shù)分類的圖片數(shù)目很少,甚至超過2000類圖片數(shù)目少于5張。對(duì)數(shù)據(jù)集進(jìn)行分析,總結(jié)數(shù)據(jù)集分類有以下幾個(gè)難點(diǎn):

(1)類別圖片數(shù)量不均,數(shù)量最多的可達(dá)到5萬(wàn)多張,數(shù)量最少的只有1張;

(2)由于數(shù)據(jù)集未經(jīng)過人工清洗,訓(xùn)練集中存在較多的干擾圖像;

(3)對(duì)不同類別聚類可發(fā)現(xiàn),同一個(gè)landmark可能會(huì)出現(xiàn)在多個(gè)分類,不同的landmark可能非常相似;

(4)訓(xùn)練集中有較多非建筑物類別,如河流、山等,這樣屬于同一種場(chǎng)景的不同類別難以分辨。

 奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

本次識(shí)別比賽奪冠采用的方法大致如下:

針對(duì)訓(xùn)練集中的干擾圖像,使用Babenko等人構(gòu)建的landmark數(shù)據(jù)集訓(xùn)練ResNet+RMac,得到用于retrieval的基礎(chǔ)特征描述模型,并用該模型的全局特征描述子做類內(nèi)相似度,清理掉與該分類無(wú)關(guān)的圖像;針對(duì)數(shù)量不均,對(duì)每個(gè)類中的圖像構(gòu)造相似度連接圖,設(shè)定相似度閾值0.65,構(gòu)造多個(gè)類內(nèi)關(guān)聯(lián)簇,用于訓(xùn)練和微調(diào);對(duì)圖片數(shù)目較少的圖像做復(fù)制、裁剪、翻轉(zhuǎn)、選裝等操作增加樣本數(shù)量。

分類網(wǎng)絡(luò)的訓(xùn)練,直接訓(xùn)練15k類,基礎(chǔ)網(wǎng)絡(luò)選用VGG、ResNet50、ResNet101、ResNext、Inception-V3、Inception-Resnet-V2,驗(yàn)證集準(zhǔn)確率為96-99%。

對(duì)于圖片數(shù)量較少的分類,通過retrieval基礎(chǔ)特征描述模型提取全局描述,并做聚類,聚類成250類,將250類與原有圖片數(shù)目高于20的類組成6558類新訓(xùn)練集訓(xùn)練分類;對(duì)小于20的分類在15k類分類器后修改全連接,微調(diào)網(wǎng)絡(luò),只訓(xùn)練小于20張圖片的8648類。

Retrieval對(duì)分類也有很大作用,在Babenko等人構(gòu)建的landmark數(shù)據(jù)集訓(xùn)練了R-MAC、DIR、GeM,基礎(chǔ)網(wǎng)絡(luò)為VGG、ResNet50。并用我們清理過的訓(xùn)練集微調(diào),整合各模型輸出的描述特征,以及DIR PCA前特征,根據(jù)各模型檢索效果設(shè)置權(quán)重拼接特征,并做L2+PCA,降低維度至4096。

Retriveal輸出特征比較方式我們有兩種,一種是直接將test圖像在清理后的數(shù)據(jù)集中檢索到相似度最高的那張圖片所在分類記為最后的類別,一種是記錄top-k(k=100/200),并對(duì)k張圖像做每個(gè)分類做數(shù)量統(tǒng)計(jì)和相似度均值,數(shù)量多且平均相似度高的類別記為最后的類別。

Retrieval的特征描述同樣也可用于分類,我們直接在4096維特征后增加分類器,分類14951、6558、8648,得到多個(gè)預(yù)測(cè)結(jié)果并同以上結(jié)果進(jìn)行不同方式的投票或weighted average融合。

最后,由于此次比賽使用的evaluation方式為GAP@1而不是單純的Top-1 accuracy,訓(xùn)練時(shí)不論在驗(yàn)證集上取得多高的accuracy(曾經(jīng)到過0.99+)都不能確保最后在leaderboard上的分?jǐn)?shù)得到質(zhì)的飛越。舉個(gè)例子,如果你對(duì)5張圖片進(jìn)行預(yù)測(cè),結(jié)果為第1,2,3,5正確第4錯(cuò)誤,那么傳統(tǒng)意義上你得了0.8分:4張正確的得4分除以總數(shù)5張,但用GAP@1來(lái)計(jì)算的話你對(duì)第5張的正確預(yù)測(cè)只獲得0.8分,這個(gè)0.8來(lái)自于你前5張對(duì)了4張,所以最后的得分為(1+1+1+0+0.8)除以5結(jié)果為0.76。換句話說,排序越靠前的預(yù)測(cè)對(duì)最后得分的占比權(quán)重越高。對(duì)此我們?cè)谧詈笠粋€(gè)月內(nèi)所有的提交都采取了以下的recursive stack方式。我們將先前幾次分?jǐn)?shù)最高的提交進(jìn)行了融合:只保留可信度大于0.95且所有模型都預(yù)測(cè)一致的圖片,而這個(gè)大約只有200張圖的提交居然得分就超過了0.11,也就是說測(cè)試集內(nèi)真正用來(lái)算分的圖片總數(shù)應(yīng)該小于2000張(實(shí)際情況可能更少)。至此,我們接下去所有微調(diào)的模型都不對(duì)這200張圖進(jìn)行預(yù)測(cè)并且對(duì)訓(xùn)練集中對(duì)于它們的label進(jìn)行一定比例的減少。在比賽最后兩周我們的safe list里大約有500張圖,public leaderboard的分?jǐn)?shù)大概0.29左右。這時(shí)我們?cè)俅芜\(yùn)用檢索比賽中效果最好的模型對(duì)這500張圖在測(cè)試集中進(jìn)行檢索,取可信度大于0.95的match并給它們標(biāo)上相同的label。

另外,Video++的參賽AI團(tuán)隊(duì)還表示他們?cè)诖舜翁魬?zhàn)賽中運(yùn)用到的算法將用于Video++的產(chǎn)品中。

此次參與到Google挑戰(zhàn)賽,與全球科學(xué)技術(shù)大咖同場(chǎng)競(jìng)技,是Video++深耕AI技術(shù)的一次成果展示。經(jīng)過多年的經(jīng)驗(yàn)累積與技術(shù)沉淀,Video++在場(chǎng)景識(shí)別與檢索上已取得豐碩成果,并成功實(shí)現(xiàn)AI+文娛的商業(yè)化規(guī)模應(yīng)用,成為國(guó)內(nèi)這一領(lǐng)域的領(lǐng)導(dǎo)者。而此次在Google挑戰(zhàn)賽中勇奪桂冠,彰顯了Video++在計(jì)算機(jī)視覺領(lǐng)域的領(lǐng)先實(shí)力。未來(lái),Video++還將加速技術(shù)創(chuàng)新,擁抱科技力量,持續(xù)把AI技術(shù)滲透到大文娛產(chǎn)業(yè)的各個(gè)場(chǎng)景,力爭(zhēng)成為享譽(yù)海內(nèi)外的AI+文娛的產(chǎn)業(yè)風(fēng)向標(biāo)。

雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

奪冠Google AI地標(biāo)識(shí)別大賽,極鏈科技Video++將受邀出席2018CVPR

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說