丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給楊曉凡
發(fā)送

0

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

本文作者: 楊曉凡 2019-11-21 11:19 專題:ICCV 2019
導(dǎo)語(yǔ):視覺(jué)可以成為連接語(yǔ)言的橋梁

雷鋒網(wǎng) AI 科技評(píng)論按:CMU 博士、UC Santa Barbara 計(jì)算機(jī)科學(xué)系助理教授王威廉(William Wang)是一位非?;钴S、非常出名的華人學(xué)者,他是該校 NLP 小組的負(fù)責(zé)人,研究領(lǐng)域涵蓋信息提取、社交媒體、語(yǔ)言和視覺(jué)、口語(yǔ)處理、機(jī)器學(xué)習(xí)理論和知識(shí)圖譜等。他是社交媒體紅人,他的科研團(tuán)隊(duì)也連續(xù)有大批論文被近幾年的 AI/ML/NLP 會(huì)議接收,以及獲得最佳論文獎(jiǎng)或獎(jiǎng)項(xiàng)提名。

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

王威廉組的王鑫就以第一作者的身份獲得了 CVPR 2019 的最佳學(xué)生論文獎(jiǎng)。近期的 ICCV 2019 上,王鑫也有一篇第一作者論文被收錄。從論文主題來(lái)看,王鑫對(duì)多模態(tài)、多語(yǔ)言學(xué)習(xí)有不少心得,雷鋒網(wǎng) AI 科技評(píng)論記者在 ICCV 2019 現(xiàn)場(chǎng)對(duì)王鑫進(jìn)行了采訪,請(qǐng)他介紹介紹相關(guān)話題。

雷鋒網(wǎng) AI 科技評(píng)論:首先請(qǐng)您簡(jiǎn)單介紹一下您的 ICCV 論文《VaTeX: A Large-Scale, High-Quality Multilingual Dataset for Video-and-Language Research》(arxiv.org/abs/1904.03493

王鑫:我們這次 ICCV 的論文主要?jiǎng)?chuàng)建了一個(gè)新的多語(yǔ)言數(shù)據(jù)集。之前的視頻的數(shù)據(jù)集都只是基于英文的,但是其實(shí)地球上大概有幾千種不同的語(yǔ)言,僅僅在中國(guó)就有將近一百種語(yǔ)言,所以訓(xùn)練一個(gè)多語(yǔ)言的模型去為這些非英語(yǔ)母語(yǔ)的人服務(wù)是非常有必要的?;谶@個(gè)出發(fā)點(diǎn),我們收集了英文和中文數(shù)據(jù),然后提供一個(gè)對(duì)下游任務(wù)可以起到很大幫助的數(shù)據(jù)集,方便其他人做更多后續(xù)研究,以及推動(dòng)基于實(shí)證的多語(yǔ)言自然語(yǔ)言的研究。

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

雷鋒網(wǎng) AI 科技評(píng)論:今年在 CVPR 上您獲得了最佳學(xué)生論文獎(jiǎng),獲獎(jiǎng)?wù)撐摹禦einforced Cross-Modal Matching & Self-Supervised Imitation Learning for Vision-Language Navigation》(arxiv.org/abs/1811.10092)也是做視覺(jué)和語(yǔ)言。

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

王鑫:對(duì),那篇論文是主要是解決視覺(jué)與語(yǔ)言結(jié)合去進(jìn)行導(dǎo)航的問(wèn)題。相較于其他的傳統(tǒng)問(wèn)題來(lái)說(shuō),導(dǎo)航問(wèn)題中感知到的視覺(jué)信息是動(dòng)態(tài)的,因?yàn)槊看谓邮盏秸Z(yǔ)言的指令之后,機(jī)器人每次產(chǎn)生的動(dòng)作可以向左轉(zhuǎn)、向右轉(zhuǎn)、以及往前走;產(chǎn)生動(dòng)作之后,所看到的就發(fā)生了變化,所以它是一個(gè)動(dòng)態(tài)的處理過(guò)程。而且它還是一個(gè)連續(xù)的處理過(guò)程,是經(jīng)過(guò)一系列的動(dòng)作,最后你才能判斷這個(gè)機(jī)器人到底成功了沒(méi)有。

雷鋒網(wǎng) AI 科技評(píng)論:這兩篇論文之間有什么聯(lián)系嗎?

王鑫:我覺(jué)得還是很有聯(lián)系的。因?yàn)橐曈X(jué)語(yǔ)言的這些任務(wù),大家都是只關(guān)注英文,沒(méi)有考慮、或者很少考慮其它語(yǔ)言。但是根據(jù)我們之前做視頻描述(video-captioning)的經(jīng)驗(yàn),就發(fā)現(xiàn)這是一個(gè)很嚴(yán)重的問(wèn)題;所以我們?nèi)U(kuò)充了他的數(shù)據(jù),擴(kuò)充了中文。然后我們 CVPR 做的那篇論文是導(dǎo)航,也是基于自然語(yǔ)言的,輸入指令也是全都是英文,所以考慮怎樣讓它能拓展到更多的語(yǔ)言是非常有必要的。其實(shí)我們最近也有一個(gè)最新的工作,我們也剛剛把 tech report 放到 arXiv 上(《Cross-Lingual Vision-Language Navigation》,arxiv.org/abs/1910.11301)。這個(gè)工作是做跨語(yǔ)言視覺(jué)導(dǎo)航,所以那里我們就把導(dǎo)航數(shù)據(jù)集相應(yīng)的中文部分也給收集了。

我們?nèi)ツ曛饕芯苛藘蓚€(gè)主要問(wèn)題,一個(gè)是,雖然多語(yǔ)言的學(xué)習(xí)很有必要,但是也不可能針對(duì)每一種語(yǔ)言都去收集大量的數(shù)據(jù)來(lái)訓(xùn)練模型,這樣做可能非常的耗時(shí)、耗力、耗金錢。所以我們研究的第一個(gè)問(wèn)題就是怎么利用已有的數(shù)據(jù)集,比如用已有的英文的數(shù)據(jù)集,訓(xùn)練一個(gè)模型,然后可以執(zhí)行中文或者韓文的指令。所以我們結(jié)合了機(jī)器翻譯的模型,然后看我們?cè)鯓永迷械挠⑽闹噶詈蜋C(jī)器翻譯過(guò)來(lái)的中文指令,把它們結(jié)合在一起,想出這樣一種方法,可以得到和完全在中文指令上訓(xùn)練的模型相同的表現(xiàn)或者相近的表現(xiàn)。

另外一個(gè)問(wèn)題是,如果我們有了一部分中文標(biāo)的數(shù)據(jù),要怎么更好地提升跨語(yǔ)言學(xué)習(xí)的模型的表現(xiàn)。這些中文數(shù)據(jù)的數(shù)量相比于英文數(shù)據(jù)可能是 0%,這就對(duì)應(yīng)著零樣本學(xué)習(xí)(zero-shot learning);也可能是 10%、20% 甚至 100%;100% 就是說(shuō)所有的英文數(shù)據(jù)都有對(duì)應(yīng)的中文數(shù)據(jù),收集齊了。

雷鋒網(wǎng) AI 科技評(píng)論:在 CVPR 這篇論文中,使用了很多組件來(lái)增強(qiáng)跨模態(tài)學(xué)習(xí)的效果,看論文標(biāo)題都覺(jué)得有一些復(fù)雜。您是否覺(jué)得這么做很復(fù)雜?以及未來(lái)是否能用更簡(jiǎn)單的跨模態(tài)學(xué)習(xí)方法達(dá)到類似的效果?

王鑫:我覺(jué)得那篇論文的思路還是很清晰的。因?yàn)閷?duì)于導(dǎo)航這個(gè)任務(wù),在那篇論文之前大家使用的評(píng)價(jià)指標(biāo)只是簡(jiǎn)單的「是否成功了」,你只有到了終點(diǎn)才是「成功」。然而有時(shí)候機(jī)器人根本沒(méi)有按照指令行動(dòng)也到了終點(diǎn),這樣也算為了一個(gè)成功,就可能背離了任務(wù)設(shè)置的本質(zhì)。我們之所以選用了細(xì)粒度的指令,就是因?yàn)槲覀兿肴パ芯空Z(yǔ)言與視覺(jué)的結(jié)合、它們之間的實(shí)證連接(grouding);我們想要智能體按照指令行動(dòng),所以我們的第一個(gè)出發(fā)點(diǎn)就是增強(qiáng)這兩者之間的一致性,就設(shè)計(jì)了這樣的一個(gè)跨模態(tài)匹配的方法。而同時(shí),如果有了這樣一致性,我們還可以利用它去探索沒(méi)有見到過(guò)的新環(huán)境,因?yàn)槟P鸵娺^(guò)的和沒(méi)見過(guò)的環(huán)境之間存在表現(xiàn)的區(qū)別,我們可以利用這些信息讓它預(yù)探索這些沒(méi)見過(guò)的環(huán)境,它就可以更好地適應(yīng)現(xiàn)有的環(huán)境,做得更好。

雷鋒網(wǎng) AI 科技評(píng)論:這幾年多模態(tài)學(xué)習(xí)熱度很高,可不可以說(shuō)多模態(tài)學(xué)習(xí)是CV原有的那些任務(wù)遇到瓶頸之后的一個(gè)新的出口?其它還有哪些從原來(lái)的CV任務(wù)衍生出的新任務(wù)?

王鑫:首先,我可能不太贊同 CV 的研究已經(jīng)遇到了瓶頸??赡芎芏嗳?,包括一些其他領(lǐng)域的人說(shuō) ImageNet 已經(jīng)刷分刷得很高,超過(guò)了人類的分?jǐn)?shù),但如果你去問(wèn)研究 CV 問(wèn)題的,即使只是研究物體識(shí)別問(wèn)題的人聊的話,你會(huì)發(fā)現(xiàn)其實(shí)還有很多在實(shí)際生活沒(méi)有解決的方面。ImageNet 雖然很大,但它和整個(gè)世界中各種圖像數(shù)據(jù)相比的話,只代表了非常小的一部分?jǐn)?shù)據(jù),圖像識(shí)別也還有很多的不常見案例沒(méi)有解決。所以 CV 的研究人員都在極力地解決那些問(wèn)題,不要再局限于 ImageNet,解決更實(shí)際的問(wèn)題。

然后,其實(shí)視覺(jué)和語(yǔ)言結(jié)合領(lǐng)域也不是這幾年才比較火,它其實(shí)存在了很多年,在深度學(xué)習(xí)時(shí)代之前也有人在研究。但是在深度學(xué)習(xí)出現(xiàn)之后,就大概 2014、15年,大家開始在這方面著力。因?yàn)槲覀兪巧钤谝粋€(gè)多模態(tài)的世界,作為人類我們不是只用眼去看的,從視覺(jué)捕捉,到認(rèn)知,然后還通過(guò)語(yǔ)言進(jìn)行交流表達(dá),甚至去記錄一些東西;而且語(yǔ)言本身也是基于我們所看到的才發(fā)展起來(lái)。所以我覺(jué)得歸根結(jié)底,把兩件事分開研究是一種選擇,但是最終我們要做的科研是肯定是要把 CV 和 NLP、甚至其他的模態(tài)都結(jié)合在一起的。而且我不認(rèn)為我們需要等到一個(gè)完全發(fā)展好,再去發(fā)展另一個(gè)或去發(fā)展它們的結(jié)合,因?yàn)槟銜?huì)發(fā)現(xiàn)你永遠(yuǎn)不可能達(dá)到一個(gè)頂峰。

雷鋒網(wǎng) AI 科技評(píng)論:找到對(duì)多種模態(tài)的信息的連貫一致(coherent)的表征,可以說(shuō)是多模態(tài)學(xué)習(xí)的圣杯。目前這個(gè)領(lǐng)域的前沿進(jìn)展如何?有哪些突出的論文?我們離圣杯還有多遠(yuǎn)?

王鑫:其實(shí)在視覺(jué)-語(yǔ)言領(lǐng)域里,相對(duì)比較傳統(tǒng)的像圖像描述、視覺(jué)問(wèn)答這種任務(wù),大家都已經(jīng)在探索更多的可能性,一個(gè)是從任務(wù)角度,比如說(shuō)我們做的導(dǎo)航任務(wù),是從靜態(tài)的信息升級(jí)到動(dòng)態(tài)的環(huán)境;還有實(shí)體機(jī)器人學(xué)習(xí)(embodied agent learning)這種,與人做交互、與這個(gè)世界做交互,這是一個(gè)很有趣的方向。

現(xiàn)在還有人在研究模型預(yù)訓(xùn)練,就像 BERT 一樣,BERT 的預(yù)訓(xùn)練模型在 NLP 領(lǐng)域取得了很大的貢獻(xiàn)。然后其實(shí)視覺(jué)和語(yǔ)言的聯(lián)合訓(xùn)練也是很有意義的,所以有很多人,尤其是最近這幾個(gè)月,有很多人在研究視覺(jué)和語(yǔ)言相結(jié)合的預(yù)訓(xùn)練,然后用這樣的預(yù)訓(xùn)練策略去提高下游的視覺(jué)-語(yǔ)言任務(wù)中的表現(xiàn)。

另外還有,研究語(yǔ)言并不等于研究英文,所以我覺(jué)得多語(yǔ)言的科研是非常有必要的,尤其是與視覺(jué)結(jié)合的多語(yǔ)言研究。因?yàn)槲覀儾豢赡芤恢比ナ占煌Z(yǔ)言之間的平行語(yǔ)料,而視覺(jué)信息,包括一些其他的模態(tài)的信息,在不同的語(yǔ)言之間是共通的,就像來(lái)自不同國(guó)家不同語(yǔ)言不同背景的人,看到前面的一座塔,都會(huì)知道它是什么,這甚至不需要語(yǔ)言的翻譯 —— 也就是說(shuō),視覺(jué)信息可以作為橋梁,連接不同的語(yǔ)言,所以這也是一個(gè)很有很有趣的一個(gè)方向。還有,怎樣把知識(shí)結(jié)合到視覺(jué)和語(yǔ)言里面去,更好地學(xué)一些結(jié)構(gòu)的信息。

雷鋒網(wǎng) AI 科技評(píng)論:這些方向近期有哪些論文是你們比較關(guān)注的?

王鑫:剛才提到的我們多語(yǔ)言 ,我們最近有 ICCV 的這篇論文(arxiv.org/abs/1904.03493),以及我們做了一個(gè)跨語(yǔ)言視覺(jué)-語(yǔ)言導(dǎo)航的論文(arxiv.org/abs/1910.11301);預(yù)訓(xùn)練視頻-語(yǔ)言模型目前有很多論文,我之前在推特上發(fā)過(guò)一個(gè)列表總結(jié)了一下(搬運(yùn)見這里 )。最近,微軟的人有篇 ICLR 投稿,是一個(gè)統(tǒng)一模型,通過(guò)預(yù)訓(xùn)練在 7 到 13 個(gè)任務(wù)上都達(dá)到了最好的效果;導(dǎo)航方面,人與世界與環(huán)境結(jié)合,像之前的導(dǎo)航,以及包括最近的一些與對(duì)話相關(guān)的,UW 華盛頓大學(xué)有研究者也出了一個(gè)視覺(jué)與對(duì)話導(dǎo)航,就是將導(dǎo)航用對(duì)話的形式去做,機(jī)器人不僅可以遵照指令行動(dòng),如果機(jī)器人有不明白的地方還可以反過(guò)來(lái)提問(wèn)。

雷鋒網(wǎng) AI 科技評(píng)論:你們組還有哪些計(jì)劃的科研方向?

王鑫:除了剛才我說(shuō)的多語(yǔ)言研究之外,我們還是希望能做機(jī)器人與外界環(huán)境的交互,尤其在語(yǔ)言的指導(dǎo)下交互。所以我們對(duì)于導(dǎo)航,不管是室內(nèi)室外的導(dǎo)航也好,或者執(zhí)行任務(wù)也好,這種方向都是非常感興趣,我們也會(huì)繼續(xù)做新的成果出來(lái)。另外,自監(jiān)督學(xué)習(xí)這種從沒(méi)有標(biāo)簽的數(shù)據(jù)里學(xué)習(xí)到更好的表征,我們也有在做這方面的研究。除此之外,我們組對(duì) NLP 的很多其他領(lǐng)域都有深入研究,包括知識(shí)圖譜、知識(shí)推理、自然語(yǔ)言生成、社會(huì)科學(xué)、機(jī)器學(xué)習(xí)的公平性、責(zé)任性和可解釋性研究等等。

雷鋒網(wǎng) AI 科技評(píng)論:大家根據(jù)以往的經(jīng)驗(yàn)總結(jié)出了一個(gè)現(xiàn)象,頂會(huì)上的獲獎(jiǎng)?wù)撐囊话愣疾皇悄切┯泻艽箝L(zhǎng)期影響的論文(用時(shí)間檢驗(yàn)獎(jiǎng) Test of Time Award 來(lái)衡量)。您對(duì)這個(gè)現(xiàn)象有什么看法?

王鑫:首先,有長(zhǎng)期影響力,可能不同的人有不同的定義,大家一般通常會(huì)從被引數(shù)量上來(lái)看,這樣的話,比較火的領(lǐng)域的論文可能會(huì)得到更多的被引。

但是正如你所說(shuō)的,很長(zhǎng)期的影響力的那些獎(jiǎng)項(xiàng),獲獎(jiǎng)?wù)撐囊话悴⒉皇钱?dāng)時(shí)的最佳論文,是因?yàn)榇蠹液茈y意識(shí)一篇論文到底未來(lái)會(huì)產(chǎn)生多大的影響。但是當(dāng)前的視角來(lái)說(shuō),我認(rèn)為所有得獎(jiǎng)的論文都是有獨(dú)到的過(guò)人之處的,都提出了一些新的洞見,至少會(huì)給當(dāng)前的學(xué)術(shù)研究帶來(lái)很多思考;或者他的論文做得非常扎實(shí)完善。

雷鋒網(wǎng) AI 科技評(píng)論:您是 Closing the Loop Between Vision and Language Workshop 的組織者之一,28 號(hào)我們?nèi)タ吹臅r(shí)候非?;鸨?。為什么要舉辦這個(gè)workshop?今年第三屆 workshop 相比前兩屆有哪些變化?

王鑫:對(duì),這個(gè) workshop 今年已經(jīng)是第三屆了,已經(jīng)是非常有影響力了;它每一屆也會(huì)有不同的側(cè)重點(diǎn),這一屆我們同時(shí)舉行了兩個(gè)比賽競(jìng)賽,一個(gè)是我們的 VaTeX 競(jìng)賽,另外一個(gè)是視頻描述的一個(gè)長(zhǎng)語(yǔ)言生成的競(jìng)賽(LSMDC)。因?yàn)槲覀冇X(jué)得從過(guò)去的相關(guān)領(lǐng)域的科研都主要關(guān)注圖像角度,但是其實(shí)你想想,視頻才能夠更好地捕捉到這個(gè)世界中事物的動(dòng)態(tài)關(guān)系,因?yàn)樗懈鼜?fù)雜的信息,包括物體本身的視覺(jué)信息、物體的動(dòng)作、物體之間的空間關(guān)系、物體的時(shí)空關(guān)系,而且它還可能含有聽覺(jué)的、語(yǔ)音的信息,所以從圖像到視頻這樣一個(gè)轉(zhuǎn)變是非常有必要的,我覺(jué)得也是值得更多的人投入精力學(xué)習(xí)研究的。

當(dāng)然,我們 workshop 也不只局限于視頻描述。你可以看到,我們邀請(qǐng)的演講者其實(shí)是來(lái)自不同的研究背景,有做純做視覺(jué)的,有做視覺(jué)和語(yǔ)言的結(jié)合的,甚至有 NLP 的教授過(guò)來(lái)講,講常識(shí)、知識(shí)這樣的東西??偠灾覀兿Mㄟ^(guò)促進(jìn)不同學(xué)科之間的交互,真正地推動(dòng)視覺(jué)和語(yǔ)言的結(jié)合領(lǐng)域的發(fā)展。

雷鋒網(wǎng) AI 科技評(píng)論:更詳細(xì)介紹一下 VaTeX 競(jìng)賽吧

王鑫:用于視覺(jué)和語(yǔ)言實(shí)證的多語(yǔ)言研究,這個(gè)領(lǐng)域是非常有必要去研究的,這是一個(gè)很大的原因,促使我們?nèi)ネ苿?dòng)這樣一件事情,讓大家意識(shí)到它的重要性;而且視頻也是很重要。所以我們舉辦了這樣的一個(gè)比賽,讓大家去參與,去更好的去研究它。

我認(rèn)為這次競(jìng)賽也非常成功,一共有 57 支隊(duì)伍來(lái)自于世界各地,冠軍是由中科院的自動(dòng)化所的隊(duì)伍取得的。其實(shí)當(dāng)你推動(dòng)這樣一件事情的時(shí)候,大家是很有興趣、很有意愿參與,以及往更深的研究層次發(fā)掘的,比如有一個(gè)評(píng)價(jià)指標(biāo)是 CIDEr score,冠軍的成績(jī)比我們?cè)谡撐睦锾岢龅幕€模型提高了幾十個(gè)點(diǎn),這是非常驚人的成績(jī)。

我們的比賽包括英語(yǔ)賽道和中文賽道,取得亞軍的一個(gè)是來(lái)自澳大利亞阿德萊德大學(xué)和人大合作的團(tuán)隊(duì),另外一個(gè)是自動(dòng)化研究所的另外一支團(tuán)隊(duì),他們也取得了很好的表現(xiàn),以及他們的方法也都很有意義。總結(jié)一下你會(huì)發(fā)現(xiàn),所有的團(tuán)隊(duì)都會(huì)去都去探索視頻中的不同模態(tài)的信息,包括圖像級(jí)別的、動(dòng)作級(jí)別的視覺(jué)信息,還有時(shí)序級(jí)別的、甚至音頻的,他們結(jié)合了各種信息建立了這樣的模型。

但是,還有一些方向是很少人關(guān)注的,比如說(shuō)從語(yǔ)言本身的角度。可能大家主要都來(lái)自做 CV 的科研團(tuán)隊(duì),所以更多的精力放在視頻上面;但是語(yǔ)言這邊、描述這邊做探索的人就比較少,目前還沒(méi)有人用 BERT 模型去做。其實(shí)要做的話,可以利用預(yù)訓(xùn)練模型,甚至自己提出一個(gè)模型然后做它的預(yù)訓(xùn)練,達(dá)到更好的多模態(tài)對(duì)齊效果,以及更好的描述生成。

雷鋒網(wǎng) AI 科技評(píng)論:今年參加 ICCV 有什么感受?

王鑫:現(xiàn)在每年大家對(duì) C V的研究都越來(lái)越感興趣,參會(huì)的人越來(lái)越多,今年 CVPR 和 ICCV 都是有七千人甚至一萬(wàn)人參加,所以人數(shù)增多,可能大家交流的也就會(huì)更多。對(duì)我來(lái)說(shuō),我看到越來(lái)越多的生面孔來(lái)參會(huì),這是一件很好的事情,大家一起來(lái)推動(dòng)這個(gè)科研領(lǐng)域更好的發(fā)展;而且工業(yè)界也對(duì)我們 CV 和 NLP 的研究非常感興趣,在展區(qū)可以看到來(lái)自全世界各地的很多不同的公司,然后他們可能對(duì)于如何把科研成果更好地運(yùn)用到產(chǎn)品中更感興趣,我覺(jué)得這都是很好的。

雷鋒網(wǎng) AI 科技評(píng)論:你認(rèn)為 CVPR 和 ICCV 兩個(gè)會(huì)之間有什么不同?

王鑫:其實(shí)這是我第一次參加 ICCV 的,但是我 CVPR 參加了很多屆。我也很難講兩個(gè)會(huì)之間的區(qū)別,但我覺(jué)得在討論的問(wèn)題上沒(méi)有太大區(qū)別,只不過(guò) ICCV 可能因?yàn)樵诿绹?guó)之外舉辦,CVPR 是大多數(shù)在美國(guó),所以 ICCV 參會(huì)的人會(huì)來(lái)自國(guó)際上的、美國(guó)之外國(guó)家的研究者更多一點(diǎn)。美國(guó)因?yàn)樗暮炞C比較嚴(yán),可能其它國(guó)家的研究者就相應(yīng)的會(huì)少一點(diǎn)。

雷鋒網(wǎng) AI 科技評(píng)論:再問(wèn)一個(gè)問(wèn)題,華人在近年的頂會(huì)上表現(xiàn)都很好,但是這次在 ICCV 的獎(jiǎng)項(xiàng)上也有一些遺憾。您怎樣評(píng)價(jià)這屆 ICCV 中華人的整體表現(xiàn)?

王鑫:我不覺(jué)得這是一個(gè)遺憾,因?yàn)槲矣X(jué)得華人,尤其是在 CV 領(lǐng)域,華人的表現(xiàn)越來(lái)越突出,有時(shí)候你甚至?xí)吹街辽儆幸话氲恼撐睦锒加腥A人作者。而論文沒(méi)被選中最佳論文、或者最佳論文候選,這并不意味著他們的工作不好,其實(shí),所有的口頭報(bào)告論文或者海報(bào)展示論文,所有的接收論文都有他的亮點(diǎn)。

其實(shí),本來(lái)評(píng)獎(jiǎng)里也帶有主觀的看法,我認(rèn)為大家更應(yīng)該關(guān)注自己的研究?jī)?nèi)容,期望能夠做出有影響力的工作,以及把自己的工作做完善。要有一些學(xué)術(shù)前瞻性,去看看到底科研方向應(yīng)該往哪里走,而不是通過(guò)堆一堆技巧、提高一兩個(gè)點(diǎn)的分?jǐn)?shù)。如果你持續(xù)地做好的工作,我覺(jué)得論文獎(jiǎng)是會(huì)找到你的 —— 不是把得獎(jiǎng)作為目標(biāo)、迎合獎(jiǎng)項(xiàng)的評(píng)選方式來(lái)做科研,而是為了做更好的科研而做科研。


雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。更多學(xué)術(shù)報(bào)道、頂會(huì)觀察請(qǐng)繼續(xù)關(guān)注。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

多模態(tài)和多語(yǔ)言視覺(jué)研究走到哪里了?專訪王威廉組王鑫

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)