1
本文作者: 李尊 | 2016-06-28 19:56 |
國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學(xué)術(shù)性會議,會議的主要內(nèi)容是計算機視覺與模式識別技術(shù)。下面是6月27日的大會摘要,有重要人物的演講。
David Chambers是來自于SwRI的高級研究員,他把今天想要參加的演講分享給大家。
“這些主題對我來說非常有意思,因為我主要處理的就是有關(guān)機器導(dǎo)航、對象檢測以及無人車等相關(guān)問題?!?/span>
早上 9:00 - 10:05 匹配校準 五個口述演講
10:05 – 10:35 分割和輪廓檢測 五個主題推廣演講
下午 1:45 – 2:50 對象識別和檢測 五個口述演講
2:50 – 3:20 對象檢測1 七個主題推廣演講
歡迎來到拉斯維加斯參加2016年度CVPR會議,今年的CVPR一定會十分精彩,因為:
l CVPR2016將會展示計算機視覺和深度學(xué)習(xí)領(lǐng)域最新的成就,包括像熱門的大型視頻理解和新興的視覺疑問回答領(lǐng)域問題。
l 有史以來第一次,CVPR2016將舉辦一個100個公司參加的工業(yè)展。
l 同樣有史以來第一次,CVPR2016的組委會成員幾乎全是女性(雖然可能有點性別失衡)。
另一個更有創(chuàng)新性,我們將在CVPR2016使用每日簡報的形式發(fā)布消息,保證每天早上都能收到有關(guān)CVPR2016最新資訊。
接下來這一星期將充滿各種科技創(chuàng)新,我們最后想提出一個觀點:計算機視覺將會無處不在它將會應(yīng)用到我們的汽車、家庭、搜索引擎、醫(yī)院等領(lǐng)域。在未來它將會用來幫助殘障人士、進行社會分析、拯救生命甚至提高糧食產(chǎn)量。為了實現(xiàn)這樣的目標,我們需要為研究學(xué)者們建立一個廣闊且多樣的社區(qū)平臺:不同國家、教育程度、性別、種族、社會經(jīng)濟背景、生活經(jīng)驗、個人目標也不盡相同的人都能有自己的發(fā)揮空間。
今日 CVPR工業(yè)展 6.27-30
今天CVPR工業(yè)展將開幕,將會有許多創(chuàng)業(yè)公司以及業(yè)界巨頭來進行展示,學(xué)界和業(yè)界在此期間可以實現(xiàn)良好溝通交流。
昨日 人類與自動面部識別在隨機圖片上的識別準確度比較(A Comparison of Human and Auto-mated Face Verification Accuracy On Unconstrained Image sets)
今天的認知組織研討會很有意思,有許多非常精彩的演說以及活躍的討論。今年的主題是反饋機制。我們主要討論的是有關(guān)于哪一項任務(wù)最需要反饋,或者說對我們最有益處。Deva Ranmanan提到在“瞬間視覺”和“長期視覺”這兩者中,反饋對于后者更有用。還有其他學(xué)者也提出了自己的個人見解,大家都收獲不少。
另一個重點話題是能不斷修正的網(wǎng)絡(luò)。Viren Jain、Jitendra Malik以及Piotr Dollar也都發(fā)表了各自有關(guān)看法。
一個有趣的觀點來自于Deva和Bruno,他們將視覺作為一個推理工作,通過使用隱藏變量模型將反饋當(dāng)做一個自然推理結(jié)果。最后,反饋也不永遠都是必要的。Thomas Brox提到前饋模型仍然有一定優(yōu)勢。
CVPV的組委會里的一大亮點是涌現(xiàn)了大量女性學(xué)者,甚至年輕學(xué)者。下面以Tanushri Chakaravorty為代表,來看看這些女性學(xué)者憑什么占據(jù)CVPR組委會“高官”的半壁江山。以下Tanushri Chakaravorty簡稱T,CVPR Daily 以下簡稱C。
C: Tanushri,你在哪里上的學(xué)?
T: 我在蒙特利爾工程學(xué)院上學(xué),目前是一名博士學(xué)生。
C: 你的工作是關(guān)于什么的呢?
T: 我的工作是有關(guān)對象追蹤以及視頻排序。
C: 你的工作創(chuàng)新點在哪兒?
T: 我的工作創(chuàng)新的點是能夠用在一系列的通用對象上。因為我的目標是無模型追蹤,所以我設(shè)計的算法能夠被用來追蹤任何對象,而不是特定的某個對象(如臉型、鳥、狗等)。
C: 這意味著你的工作能馬上投入到實際工作中!
T: 對!它可以實際應(yīng)用在畫面監(jiān)控中,還有面部識別的功能。有很多種應(yīng)用方式,像交通監(jiān)控、對象計數(shù)、運動軌跡預(yù)判等。
C: 你能講一講你實現(xiàn)的的算法是哪一種的嗎?
T: 我的追蹤算法的主要理念是可能性。舉例說,我們想估計某個物體是否在這個視頻里。我們使用這個物體的一些特性,然后通過這些特性會試著估計它就在這個視頻里的可能性。
C: 你能告訴我們碰到了哪些挑戰(zhàn)嗎?
T: 我認為最有挑戰(zhàn)的是要找到固定的特征。對于我們?nèi)祟悂碚f,如果一個人姿勢不同或者不停變化姿勢,我們?nèi)匀荒軌蚺袛嗨峭粋€人。但是計算機就不同了,因為它太原始了,每樣事物在它看來都是一樣的。所以需要告訴計算機算法某樣?xùn)|西是這個物體特有的才行。
C: 你的工作打算下一步如何進行?
T: 下一步我打算結(jié)合一個探測器到我的算法中,提升它的預(yù)判和成功率,使我的算法稱為最好的算法。
C: 你能告訴我們你的工作總發(fā)生過什么意想不到的有趣的故事嗎?
T: 當(dāng)然好,有趣的或者說有挑戰(zhàn)的是在你實際測試之前根本不會料到會發(fā)生這樣的事情。舉例說,一個人出現(xiàn)在視頻中,突然他/她一下消失了。對于我們?nèi)祟悂碚f,我們會想“他/她應(yīng)該還會出現(xiàn)或者他/她不會再出現(xiàn)了?!?但是算法不會這么認為,它會覺得這個物體運動得毫無規(guī)律,變成了一堵墻。所以說,有時候看算法出錯犯迷糊非常有意思。
Maryam Rahnemoonfar 以下簡稱M,CVPR Daily 以下簡稱C
C: Maryam, 你目前在哪里任職?
M: 我目前是德州農(nóng)工大學(xué)的一名計算機科學(xué)助理教授。
C: 我能問下你為什么選擇在計算機視覺領(lǐng)域發(fā)展嗎?
M: 事實上,我本科的專業(yè)是市政工程。作為一名市政工程學(xué)生,有一們特別的課程是測繪學(xué)。我非常喜歡和衛(wèi)星圖片打交道,所以在我的博士階段,我選擇了計算機科學(xué)并且打算和所以的圖片打交道。當(dāng)我在學(xué)市政工程的時候,我認為在辦公室里做測量比在室外炎熱惡劣的環(huán)境中好多了,而且得到的結(jié)果也一樣。
C: 這是你真正熱愛這個領(lǐng)域的原因嗎?
M: 是的。
C: 我能問下作為一名女性,在這個領(lǐng)域想要做出成績困難嗎?
M: 是有不少的挑戰(zhàn)。因為這個領(lǐng)域是有男性主導(dǎo)的,所以你需要比男性付出兩到三倍的努力才能獲得成功。不過我認為我現(xiàn)在已經(jīng)做得相當(dāng)不錯了!
C: 你能講一件有關(guān)于你剛剛說的情況的故事嗎?發(fā)生過什么只會出現(xiàn)在女性身上的事情么?
M: 我沒有具體的事情可以說,不過像我現(xiàn)在就是我們部門唯一的一位女性。在我上學(xué)的時候,我也是唯一的一名女博士。
C: 你最喜歡的老師是誰?
M: 我最喜歡的老師是我在Teheran大學(xué)的電子工程教授Ahad Tavakoli。
C: 你受益最多的是什么?
M: 他非常非常有條理,對學(xué)生也相當(dāng)關(guān)心。因為自己理解是一回事,把它教給學(xué)生又是另外一回事。我喜歡他能把任何事情都講得通俗易懂。
C: 你想實現(xiàn)的是什么?
M: 在學(xué)術(shù)界,特別是計算機視覺方向,一直以來都是從事視覺圖像的工作。但是由于我的市政工程背景,我曾經(jīng)與雷達圖像、聲吶圖像等不同形態(tài)的圖像打過交道。我們希望能超越視覺圖像,往這個方向進行探索。因為計算機不會有人類眼睛一樣的限制,所以可以去探索一些人類眼睛看不見的地方。我想在計算機視覺領(lǐng)域和遙感領(lǐng)域架起一條橋梁。事實上,我的實驗室就是計算機視覺方向和遙感方向,我希望自己能為這兩者溝通做出貢獻。
C: 你認為你實現(xiàn)這個的幾率有多大?女性對于這種問題又該如何回答?
M: 一般來說,女性面對的挑戰(zhàn)通常是男性對于他們所說的充滿信心。即使他們說的完全是錯誤的,他們也充滿自信。但是在我看來,女性一般沒有這么自信,這個在我的那些做的不錯的女學(xué)生中也得到體現(xiàn),我也不知為什么。所以對于我來說,我應(yīng)該有70-80%的可能性實現(xiàn)這個目標。
圖片來自 CVPR2016-Monday
via CVPR 2016
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。