1
本文作者: 李尊 | 2016-07-27 18:58 |
ICVSS全稱International Computer Vision Summer School,是一年一度的計(jì)算機(jī)視覺領(lǐng)域的重要會(huì)議,今年會(huì)議選擇于7.17-23號(hào)在意大利西西里島舉行。
在剛剛過去的7.23號(hào),ICVSS2016—第十屆國際計(jì)算機(jī)視覺暑期研討會(huì)在美麗的意大利西西里島落幕。
今年的ICVSS主題是“計(jì)算機(jī)視覺:接下來會(huì)發(fā)生什么?”
計(jì)算機(jī)視覺是讓機(jī)器能夠看見的科技,ICVSS2016—第十屆國際計(jì)算機(jī)視覺暑期研討會(huì)目的在于對(duì)當(dāng)下計(jì)算機(jī)視覺領(lǐng)域提供一個(gè)客觀清晰的評(píng)價(jià),并且對(duì)目前領(lǐng)域內(nèi)相關(guān)研究做出深度分析。在這次大會(huì)中主要關(guān)注:計(jì)算機(jī)視覺領(lǐng)域接下來還會(huì)發(fā)生什么?
在大會(huì)期間有學(xué)術(shù)界和工業(yè)界的頂級(jí)學(xué)者和行業(yè)領(lǐng)袖進(jìn)行演講,他們通過自己的成功經(jīng)驗(yàn)從理論和實(shí)踐層面來詳解計(jì)算機(jī)視覺領(lǐng)域中的問題。主題演講者包括:
? Michael Black, 馬克斯-普朗克智能系統(tǒng)研究所
? Dhruv Batra, 弗吉尼亞理工大學(xué)
? William T. Freeman, 麻省理工學(xué)院CSAIL實(shí)驗(yàn)室
? Andrej Karpathy|斯坦福大學(xué)
? Koray Kavukcuoglu| 谷歌Deepmind
? Yann LeCun| Facebook FAIR實(shí)驗(yàn)室&紐約大學(xué)
? Sergey Levine伯克利,華盛頓大學(xué),谷歌
? Devi Parikh, 弗吉尼亞理工大學(xué)
? Pietro Perona, 加州理工學(xué)院
? Ashutosh Saxena, 斯坦福大學(xué),康奈爾大學(xué)
? Shahram Izadi, 微軟
? Bernt Schiele, 馬克斯-普朗克信息研究所
? Jamie Shotton, 微軟研究院,劍橋大學(xué)
? Stefano Soatto, UCLA
? Antonio Torralba, 麻省理工學(xué)院CSAIL實(shí)驗(yàn)室
在本文中,我們將會(huì)詳細(xì)介紹幾位學(xué)術(shù)界和工業(yè)界大牛在ICVSS2016大會(huì)中的演講,把摘要及內(nèi)容總結(jié)給大家。
首先給大家分享的是來自Facebook AI Research & NYU(Facebook FAIR實(shí)驗(yàn)室與紐約大學(xué))的Yann LeCun(燕樂存),他在大會(huì)中分享的內(nèi)容是:深度無監(jiān)督學(xué)習(xí):使用常識(shí)探索AI發(fā)展之路(Deep Unsupervised Learning:the Road to AI with Common Sense)
深度學(xué)習(xí)是計(jì)算機(jī)視覺和語音識(shí)別中的變革過程中的關(guān)鍵所在。目前很多工作都在將深度學(xué)習(xí)應(yīng)用到自然語言理解、會(huì)話系統(tǒng)應(yīng)用以及翻譯中,比如基礎(chǔ)視覺任—VQA和視頻注釋。但是絕大多數(shù)的深度學(xué)習(xí)都提前使用人類注釋的數(shù)據(jù)進(jìn)行訓(xùn)練。Yann認(rèn)為對(duì)超大型深度學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練,讓他們能夠獲得類似于常識(shí)的經(jīng)驗(yàn),這要求深度學(xué)習(xí)系統(tǒng)在沒有被人類標(biāo)記的“自然”數(shù)據(jù)中進(jìn)行學(xué)習(xí)。機(jī)器能夠像幼年時(shí)期的動(dòng)物或者人類一樣學(xué)習(xí)自然知識(shí)和真實(shí)世界的參數(shù)嗎?
對(duì)于AI研究領(lǐng)域來說這是下一個(gè)時(shí)間所面臨的挑戰(zhàn),在演講中Yann會(huì)提到一些有希望解決這些課題的研究技術(shù)與方法。
來自Google DeepMind 的Koray Kavukcuoglu,他在大會(huì)中分享的內(nèi)容是:針對(duì)agents的深度學(xué)習(xí)(Deep Learning for Agents)
近幾年來,深度學(xué)習(xí)已經(jīng)提高或者近乎取代許多監(jiān)督基準(zhǔn)方面標(biāo)準(zhǔn)視覺、語音和自然語言處理途徑的相關(guān)問題。同時(shí),在深度強(qiáng)化學(xué)習(xí)模型方面的進(jìn)步也讓使用端對(duì)端方法訓(xùn)練agents來解決復(fù)雜任務(wù)成為可能。然而,最具挑戰(zhàn)性的問題時(shí)如何讓agent在完全沒有直接指導(dǎo)或者回報(bào)信號(hào)的情況下完全理解自身的環(huán)境。
在這次演講中Koray Kavukcuoglu首先介紹了幾種深度強(qiáng)化學(xué)習(xí)的方法,這幾種方法在agent基準(zhǔn)上都能實(shí)現(xiàn)目前最好的結(jié)果。然后Koray Kavukcuoglu具體講了在通用圖像和視頻模型中近期的研究成果,最后Koray Kavukcuoglu與觀眾一起探討了在深度學(xué)習(xí)和通用agents模型中未來發(fā)展的方向。
來自CSAIL麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(Computer Science and Artificial Intelligence Laboratory)William T. Freeman在大會(huì)中上分享了:看見微小的運(yùn)動(dòng),使用聲音去學(xué)習(xí)視覺(Seeing tiny motions, and using sound to learn about vision)
世界上充斥著微小的運(yùn)動(dòng),這些都可以用來可視化以幫助預(yù)測機(jī)械故障、研究物理或生物過程,或者診斷疾病。在演講中William T. Freeman介紹了一個(gè)他們開發(fā)的運(yùn)動(dòng)顯微鏡,并用它的輸出例子來進(jìn)行展示。
運(yùn)動(dòng)產(chǎn)生聲音,聲音可以帶領(lǐng)研究學(xué)者推斷產(chǎn)生聲音的對(duì)象的材料屬性。William T. Freeman還介紹了有關(guān)“視覺表示聲音”的工作,這些聲音視覺信號(hào)可以用來幫助訓(xùn)練視覺系統(tǒng)來推斷物體的材料屬性。
大會(huì)評(píng)選出了兩篇最佳論文,分別是:
Convolutional Two-Stream Network Fusion for Video Action Recognition(用于視頻動(dòng)作識(shí)別的卷積雙流網(wǎng)絡(luò)融合)
Robust Visual SLAM Across Large Time Lags(跨越大型時(shí)間延遲的魯棒性視覺SLAM算法)
另外針對(duì)學(xué)術(shù)項(xiàng)目大會(huì)特別組織了一次研討會(huì),讓學(xué)生有機(jī)會(huì)與計(jì)算機(jī)視覺領(lǐng)域里世界頂級(jí)的實(shí)驗(yàn)室以及業(yè)界龍頭企業(yè)進(jìn)行互動(dòng)、交流、學(xué)習(xí),其中參與的業(yè)界討論的實(shí)驗(yàn)室以及企業(yè)有:
? Facebook Ai Research| Facebook AI實(shí)驗(yàn)室,美國
? Google DeepMind, |谷歌Deepmind,美國
? Microsoft Research Cambridge|微軟劍橋研究院,英國
? OSRAM Corporate Technology|歐司朗科技集團(tuán),德國
? Qualcomm Research|高通研究院,奧地利
? Rakuten|樂天株式會(huì)社,日本
? Toyota Research Europe|豐田歐洲研究院,比利時(shí)
? Toshiba Research Europe|東芝歐洲研究院,英國
? Xerox Research Centre Europe|施樂歐洲研究中心,法國
有關(guān)于ICVSS2016會(huì)議最佳論文以及其他主題演講消息,請繼續(xù)關(guān)注后續(xù)報(bào)道。
PS : 本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可拒絕轉(zhuǎn)載!
via ICVSS2016 Twitter
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。