0
本文作者: 蔣寶尚 | 2020-05-14 20:21 |
作者 | 蔣寶尚
編輯 | 叢 末
視覺研究日益火爆,頂會(huì)論文是指明燈。那么作為頂會(huì)主席的研究員如何看待此領(lǐng)域的發(fā)展?5月14日上午,微軟亞洲研究院創(chuàng)研論壇 CVPR 2020 論文分享會(huì)中的圓桌討論環(huán)節(jié)邀請(qǐng)了五位擔(dān)任過視覺領(lǐng)域頂會(huì)主席的嘉賓。
五位嘉賓
他們就論文如何選題、如何看待arXiv、線上會(huì)議能否取代線下參會(huì)發(fā)表了看法。其中加州大學(xué)伯克利分校教授馬毅談到:目前頂會(huì)領(lǐng)域規(guī)模太過龐大,視覺研究是時(shí)候重新定義自己了,定義方向重新回到初衷,做高質(zhì)量,有突破的研究。除此之外,美國(guó)羅徹斯特大學(xué)教授羅杰波、Wormpex Al Research副總裁兼首席科學(xué)家華剛、加州大學(xué)圣地亞哥分校教授屠卓文、加州大學(xué)美熹德分校教授楊明玄也發(fā)表了看法。 1
論文選題不要湊熱鬧
大佬們談笑風(fēng)生
深度學(xué)習(xí)是計(jì)算機(jī)視覺的研究技術(shù)之一,深度學(xué)習(xí)在各領(lǐng)域大火的時(shí)候,也影響到了計(jì)算機(jī)視覺,做學(xué)者的要有自己的原則,羅杰波表示:不刷榜單,不湊熱鬧,明白學(xué)者在算力方面是比不過企業(yè)的,在選題的時(shí)候要找自己感興趣的話題,找自己認(rèn)為獨(dú)特的點(diǎn)去做,不是說別人做什么你就做什么,寫作時(shí)要明白寫的東西是給別人看的,不是給你的導(dǎo)師,不是給學(xué)術(shù)帶頭人看的,要讓評(píng)審看得出妙處。
楊明玄說道:同意做有感興趣的事情,但是要量力而為,世界那么大,事情那么多,不要非做極度有挑戰(zhàn)的事情。另外,越刁鉆的老板(導(dǎo)師)越能提高你論文通過率,畢竟他們看的論文多、經(jīng)驗(yàn)多。寫作技能要慢慢提高,多看paper,將它們的框架寫下來,可以把自己代入評(píng)審角色,看看自己的論文和別人有什么不一樣,你自己會(huì)不會(huì)選你。經(jīng)驗(yàn)都是積攢出來的,就像一眼就能夠看出問題的老醫(yī)師。
馬毅補(bǔ)充到:寫文章,做研究有兩個(gè)階段,先學(xué)習(xí)做學(xué)問的技巧,把一個(gè)事情講清楚,把控住語言,最早的幾篇文章是在訓(xùn)練自己的技巧,而不是做的研究有多么了不起。過了這個(gè)坎之后,可以隨心所欲做自己想要做的研究,重點(diǎn)在于做研究而不是寫文章。另外,不要把評(píng)審看的太重,一些重量級(jí)學(xué)者,例如Yann LeCun的論文也有被“砍掉”的經(jīng)歷,所以更重要的是你的問題有沒有價(jià)值,第二你有沒有把問題寫清楚。
寫作技巧有兩個(gè)建議:第一找你欣賞人的文章去follow,學(xué)習(xí)怎么開頭、怎么結(jié)尾、這么承前啟后。第二點(diǎn),把自己帶入評(píng)審的角色,做自己最嚴(yán)厲的評(píng)審,把自己訓(xùn)練成最難說服自己的人,不要自我滿足,不停的反駁自己一下。
華剛總結(jié)到:1、論文選題,切莫跟風(fēng),要做有興趣,這樣才能放入精力;2、訓(xùn)練自己的技巧,讀一些paper,知道好paper長(zhǎng)什么樣子,語言不一定華麗,讓一般的人讀懂;3、明確和導(dǎo)師的關(guān)系:判斷你的論文是否能接受,能增加你論文接受的幾率。屠卓文最后補(bǔ)充到:寫文章的原則是:幫人幫己,幫助自己考慮問題,但更重要的是別人怎么看你的文章,能不能幫助別人理解你的工作。并不是每一項(xiàng)工作都能達(dá)到很高的境界,在這過程更重要的是對(duì)得起自己的努力。
arXiv 是一個(gè)收集物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)與生物學(xué)論文預(yù)印本的網(wǎng)站,上面的文章未經(jīng)同行評(píng)審,作者對(duì)文章多半保持嚴(yán)謹(jǐn)態(tài)度。但是也可以防止自己的想法在論文被收錄前被別人剽竊(將預(yù)稿上傳到arXiv 作為預(yù)收錄)因此這就是個(gè)可以證明論文原創(chuàng)性(上傳時(shí)間戳)的文檔收錄網(wǎng)站。那么,頂會(huì)應(yīng)該如何看待arXiv ?
華剛表示:arXiv 總體上有著非常積極的一面,因?yàn)樗軌蜃尮ぷ鞲旆窒?。但是問題在于:上面有大量的文章,實(shí)際上并沒有經(jīng)過同行審議,所以魚龍混雜。所以在看文章的時(shí)候需要自己有判決力,對(duì)個(gè)人來說一些論文只會(huì)看看標(biāo)題,看看摘要再?zèng)Q定是否讀下去。
頂會(huì)如何看待arXiv這個(gè)問題,CVPR和ICCV都有自己的政策,投稿之前弄清楚規(guī)則就好。馬毅表示:arXiv這個(gè)領(lǐng)域本身是物理和數(shù)學(xué),它所對(duì)應(yīng)的評(píng)審模式不是雙盲。既然允許論文post在arXiv上面,那么頂會(huì)評(píng)審就不應(yīng)該是雙盲,因?yàn)檫@會(huì)造成許多混亂。
另外,它確實(shí)對(duì)領(lǐng)頂會(huì)審核帶來很多工作,因?yàn)樽鳛轭I(lǐng)域主席和程序主席往往會(huì)在“這篇文章是誰的idea”糾結(jié)。所以現(xiàn)在頂會(huì)的投稿政策還并不適應(yīng)現(xiàn)在這種情況。頂會(huì)應(yīng)該及時(shí)改變,不能裝作看不到,可以向期刊一樣的單盲評(píng)審。
楊明玄表示:arXiv的問題已經(jīng)講過很多次,但沒有人能夠去解決,目前是無解的狀態(tài),除非有頂級(jí)大佬站出來說‘我們現(xiàn)在改變主意了,我們以前講錯(cuò)了,我們堅(jiān)持的不是這樣,大家重新來過呀’。單盲評(píng)審確實(shí)有點(diǎn)不公平,2002年NIPS 從單盲變成雙盲的時(shí)候,有些學(xué)校的論文錄取瞬間下降。
所以要求雙盲卻arXiv是偽君子的做法。
深度學(xué)習(xí)是否結(jié)合傳統(tǒng)基于符號(hào)的方法?
在討論完論文如何寫、如何選題、如何看待arXiv之后,圓桌論壇也向如何克服深度學(xué)習(xí)依賴數(shù)據(jù)的問題發(fā)起了討論。能否將傳統(tǒng)基于符號(hào)的方法與深度學(xué)習(xí)結(jié)合起來從而增強(qiáng)魯棒性?能否將這種融合的發(fā)展路線帶入計(jì)算機(jī)視覺領(lǐng)域?楊明玄提到,現(xiàn)在的深度學(xué)習(xí)方法或許沒有很強(qiáng)的魯棒性,實(shí)驗(yàn)也不好做,但是總要有人做。
屠卓文表示:現(xiàn)在計(jì)算機(jī)視覺更多的是考慮CNN算法,當(dāng)然RNN、Attention這些都在進(jìn)來,但是這一套系列中視覺和語言還是不太一樣。計(jì)算機(jī)視覺改變一兩個(gè)pixel,不會(huì)改變太大的結(jié)果,但是在語言里改變一個(gè)字,那就是天壤之別。
所以,計(jì)算機(jī)視覺和語言在同屬AI框架下,需要從各自的角度去考慮問題。最終的融合還是需要的,但是要明確視覺和語言確實(shí)有很多不一樣的地方,如何考慮角度非常重要,現(xiàn)在這條路還在探索階段。
羅杰波表示:視覺分為:識(shí)別、描述、推理。現(xiàn)在CNN解決了很多大部分識(shí)別問題,計(jì)算機(jī)視覺進(jìn)化到了描述問題,下一步會(huì)進(jìn)化到推理問題?,F(xiàn)在已經(jīng)有人將知識(shí)圖譜和常識(shí)這些東西加入模型,從而嘗試解決視覺系統(tǒng)或者AI系統(tǒng)到底是什么樣子。
也即從知識(shí)層面入手解決問題。從計(jì)算機(jī)視覺的定義:從視覺信號(hào)里提取描述沒提到只是做識(shí)別。計(jì)算機(jī)視覺的初心是進(jìn)化到語義,這就需要將語言和視覺知識(shí)融合起來,這是不可避免的,也是計(jì)算機(jī)視覺必須進(jìn)化的方向。
馬毅表示,魯棒性問題和現(xiàn)在深度模型擬合數(shù)據(jù),做黑盒系統(tǒng)以及依賴數(shù)據(jù)標(biāo)簽有關(guān)。深度學(xué)習(xí)系統(tǒng)并不關(guān)心數(shù)據(jù)內(nèi)在的描述表達(dá),其模式只是input-output。數(shù)據(jù)導(dǎo)向的方法可能會(huì)解決一些問題,但仍然有缺陷。例如,深度學(xué)習(xí)雖然在識(shí)別領(lǐng)域有些進(jìn)展,但是現(xiàn)在3D領(lǐng)域是最大的軟肋,因?yàn)樗鼘?duì)魯棒、精度要求非常高。但是為什么需要真正的魯棒性?馬毅提到因?yàn)橐恍﹫?chǎng)景必須要求魯棒,例如軍事、醫(yī)療、無人機(jī)都是關(guān)乎人命的。
計(jì)算機(jī)視覺頂會(huì)規(guī)模發(fā)展有何看法?
計(jì)算機(jī)視覺領(lǐng)域?qū)砣绾伟l(fā)展,對(duì)計(jì)算機(jī)視覺會(huì)議規(guī)模的發(fā)展有何看法?
線上、線下參會(huì)有何優(yōu)缺點(diǎn)?羅杰波表示,線上會(huì)議好處非常多,但是有個(gè)致命的缺點(diǎn)是:沒有圍觀效應(yīng)。Zoom此類的會(huì)議都是講座性質(zhì)的,在交流方面還差一些,缺少那種大家對(duì)‘海報(bào)’評(píng)論的氛圍。所以他認(rèn)為線上會(huì)議在短時(shí)間還不會(huì)取代線下會(huì)議。
華剛博士對(duì)羅教授的觀點(diǎn)表示同意,他也對(duì)頂會(huì)會(huì)議規(guī)模發(fā)表了看法:其實(shí)每個(gè)研究都有一個(gè)核心,大家都圍繞這個(gè)核心開展自己的工作,當(dāng)大量的研究者擠進(jìn)來的時(shí)候,必將會(huì)擴(kuò)展新的方向。楊明玄教授也表示規(guī)模大、人數(shù)多非常好,但是conference和workshop方式還是不同,資深的人士都會(huì)去workshop,而會(huì)議吸引的更多是學(xué)生。
馬毅教授表示他非常懷念他當(dāng)學(xué)生的那段日子,那時(shí)候的視覺會(huì)議有兩個(gè)特點(diǎn),一個(gè)是小,即只有兩三百人,另一個(gè)特點(diǎn)是主題非常新,能帶給人非常多的啟發(fā),給年輕人非常多挑戰(zhàn)。
馬毅教授還談到,對(duì)比現(xiàn)在視覺會(huì)議的情況,計(jì)算機(jī)視覺可能要重新定義自己了,領(lǐng)域發(fā)展壯大是好事情,但是從研究主題和研究社區(qū)可能要重新思考了,看看能否找到更激動(dòng)人心的事情。
人數(shù)一多,從眾心理就非常嚴(yán)重。現(xiàn)在一些研究者的角色更像網(wǎng)紅,并不是在尋找真正的追求,但是尋找真正的突破才是做研究的初衷。
所以,不忘初心,正當(dāng)時(shí)。
(雷鋒網(wǎng)、雷鋒網(wǎng)、雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。