2
本文作者: 亞萌 | 2017-02-16 17:39 |
雷鋒網(wǎng)按:谷歌博客今天比較忙,在發(fā)布 TensorFlow's 1.0這一重磅更新后,緊接著又發(fā)布了一條新聞:?jiǎn)?dòng)一場(chǎng)基于YouTube-8M數(shù)據(jù)庫(kù)的視頻理解挑戰(zhàn)賽。挑戰(zhàn)賽提供了豐厚的獎(jiǎng)金,并終將在今年的CVPR2017大會(huì)上進(jìn)行展示。以下來(lái)自谷歌博客內(nèi)容,由雷鋒網(wǎng)編譯整理。
去年9月,為了促進(jìn)大規(guī)模視頻理解技術(shù)的創(chuàng)新和發(fā)展,我們發(fā)布了YouTube-8M數(shù)據(jù)庫(kù),里面包含了數(shù)百萬(wàn)的視頻,而且這些視頻都被分類貼上的數(shù)千種標(biāo)簽。最近,谷歌其它團(tuán)隊(duì)相繼發(fā)布了更多的數(shù)據(jù)庫(kù),比如Open Images和YouTube-BoundingBoxes,與YouTube-8M數(shù)據(jù)庫(kù)一起,促進(jìn)圖像和視頻理解技術(shù)的發(fā)展。為了促進(jìn)這些目標(biāo),今天我們正式發(fā)布升級(jí)版的YouTube-8M,并與Google Cloud Machine Learning、 kaggle.com一起合作組織一場(chǎng)“視頻理解挑戰(zhàn)賽”和一場(chǎng)以此為主題的 CVPR’17 Workshop。
最新升級(jí)版的YouTube-8M包括更加清晰、詳細(xì)的標(biāo)簽(平均每個(gè)視頻多兩倍的標(biāo)簽)和一系列干凈的視頻。除了之前發(fā)布的視覺(jué)特征之外,數(shù)據(jù)庫(kù)首次包括了預(yù)先計(jì)算的音頻特征,這是基于最先進(jìn)的音頻建模架構(gòu)得來(lái)的。音視頻特征以1秒的時(shí)間粒度實(shí)時(shí)同步,這使得YouTube-8M成為了一個(gè)大型多模態(tài)的數(shù)據(jù)庫(kù),為聯(lián)合音視(臨時(shí)的)建模提供了令人欣喜的機(jī)會(huì)。新版本的關(guān)鍵數(shù)據(jù)如下所示。
升級(jí)版YouTube-8M數(shù)據(jù)庫(kù)的可視化樹(shù)狀圖。按照24個(gè)垂直行業(yè)組織起來(lái),包括前200個(gè)最常用的實(shí)體和每一個(gè)垂直領(lǐng)域最常用的5個(gè)實(shí)體。
樣本視頻,來(lái)自YouTube-8M數(shù)據(jù)庫(kù)里前18個(gè)高等級(jí)的垂直領(lǐng)域
我們很高興地宣布“谷歌云和YouTube-8M視頻理解挑戰(zhàn)賽”(Google Cloud & YouTube-8M Video Understanding Challenge)正式啟動(dòng),這次挑戰(zhàn)賽與谷歌云和kaggle.com一起合辦。挑戰(zhàn)賽參與者需要在使用YouTube-8M作為訓(xùn)練數(shù)據(jù)庫(kù)的基礎(chǔ)上,建造音視頻內(nèi)容分類模型,然后給大約70萬(wàn)未見(jiàn)過(guò)的測(cè)試視頻貼上標(biāo)簽。這個(gè)比賽將由Google Cloud贊助,優(yōu)勝者們將獲得10萬(wàn)美元的獎(jiǎng)金(第一名獎(jiǎng)金3萬(wàn)美元,后四名分別為2.5萬(wàn)、2萬(wàn)、1.5萬(wàn)和1萬(wàn)美元)。為了讓這個(gè)比賽有更廣泛的參與度,Google Cloud也會(huì)提供一些使用優(yōu)惠,參與者可以自由選擇是否使用Google Cloud機(jī)器學(xué)習(xí)來(lái)訓(xùn)練模型和進(jìn)行探索。 開(kāi)源的TensorFlow代碼、執(zhí)行的一些基線分類模型、訓(xùn)練和評(píng)估腳本,如今在Github上都可以獲得了(https://github.com/google/youtube-8m/)。基于本地或云端的訓(xùn)練,請(qǐng)看這個(gè)說(shuō)明(https://github.com/google/youtube-8m/blob/master/README.md)和指南(https://www.kaggle.com/c/youtube8m#getting-started-with-google-cloud)
2017年7月,第30屆IEEE計(jì)算機(jī)視覺(jué)與模式識(shí)別大會(huì)(CVPR 2017)將在夏威夷舉行,2017年7月26日,我們將在第一屆YouTube-8M Workshop上宣布此次挑戰(zhàn)賽的結(jié)果,并且也會(huì)舉辦由杰出研究員參加的特邀報(bào)告。Workshop上,將會(huì)對(duì)挑戰(zhàn)賽表現(xiàn)優(yōu)異者成果和一些論文進(jìn)行展示。我們?cè)诖搜?qǐng)研究人員們提交基于YouTube-8M所做的創(chuàng)新研究、實(shí)驗(yàn)和應(yīng)用論文,也包括與上述挑戰(zhàn)賽相關(guān)的論文。
我們?cè)O(shè)計(jì)這個(gè)數(shù)據(jù)庫(kù)的時(shí)候,就考慮到規(guī)模和多元性,希望從中學(xué)到的教訓(xùn)可以推廣到很多視頻域(YouTube-8M捕捉了超過(guò)20中多樣的視頻域)。我們相信,這次挑戰(zhàn)賽可以給研究者提供更大的數(shù)據(jù)或計(jì)算集群,以前所未有的規(guī)模去探索和創(chuàng)新,從而促進(jìn)研究的進(jìn)步。
Via Googleblog
更多雷鋒網(wǎng)相關(guān)文章:
谷歌工程師懟上Yann LeCun:你對(duì)Google Brain的評(píng)價(jià)完全是錯(cuò)的
德州撲克算法幕后研發(fā)者CMU博士Brown專訪:AI如何打敗頂級(jí)人類牌手?
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。