3
本文作者: 奕欣 | 2017-07-27 11:40 | 專題:CVPR 2017 |
雷鋒網(wǎng) AI 科技評論按:截至發(fā)稿前,四篇榮獲 CVPR 2017 最佳論文的作者已經(jīng)分別做了口頭報(bào)告,而在到場聆聽報(bào)告的所有人當(dāng)中,有一位略顯特別的聽眾——他便是本屆 CVPR 的大會(huì)主席、微軟研究院首席研究員張正友博士。在報(bào)告結(jié)束后,張正友主席與雷鋒網(wǎng) AI 科技評論進(jìn)行了一次對話。
張正友,ACM Fellow (國際計(jì)算機(jī)學(xué)會(huì)院士)和 IEEE Fellow (國際電氣電子工程師學(xué)會(huì)院士),是微軟人工智能及研究事業(yè)部首席研究員和研究經(jīng)理,加入微軟美國本部已近二十年。1990年獲得巴黎第十一大學(xué)博士學(xué)位,在法國國家計(jì)算機(jī)和自動(dòng)化研究院(INRIA)學(xué)習(xí)工作近十二年。張正友博士是世界著名的計(jì)算機(jī)視覺和多媒體技術(shù)的專家,在立體視覺、三維重建、運(yùn)動(dòng)分析、圖像配準(zhǔn)、攝像機(jī)自標(biāo)定、人臉表情識(shí)別等方面都有開創(chuàng)性的貢獻(xiàn)。他發(fā)明的平板攝像機(jī)標(biāo)定法在全世界被普遍采用,被稱之為“張氏方法”。
與密切關(guān)注論文頒獎(jiǎng)結(jié)果的老師同學(xué)們不一樣的是,張正友博士對「最佳論文」并沒有那么看重。他認(rèn)為,這與論文所產(chǎn)生的影響力(impact)并不能同一而論。「我們可以回看過去十年 CVPR 或是 ICCV 的最佳論文,幾乎沒有一篇能獲得 test of time award,」張正友博士表示,每年的最佳論文很大程度是由當(dāng)年的熱門選題決定的,雖然由資深的教授和研究員擔(dān)綱評估,但畢竟是少數(shù)幾個(gè)人的看法。這些論文雖然都是很不錯(cuò)的論文,但多年以后,它們的引用次數(shù)不一定是最高的,也不一定能「經(jīng)得起時(shí)間考驗(yàn)」,獲得像 Longuet-Higgins 這樣的獎(jiǎng)項(xiàng)。
正如今年的 Longuet-Higgins 所授予的 Test of Time 論文《Object Retrieval with Large Vocabularies and Fast Spatial Matching》一樣,當(dāng)年的最佳論文并不歸屬于它。而張正友博士的親身經(jīng)歷同樣是最好的例證——憑借 1999 年在 ICCV 上發(fā)表的關(guān)于攝像機(jī)標(biāo)定的文章《Flexible Camera Calibration by Viewing a Plane from Unknown Orientations》及后續(xù)在 IEEE T-PAMI 上發(fā)表的文章《A Flexible New Technique for Camera Calibration》,張正友博士在 2013 年榮獲由 IEEE 模式分析與機(jī)器智能技術(shù)委員會(huì)(PAMI TC)授予的 Helmholtz Test of Time 獎(jiǎng)。值得一提的是,當(dāng)年他將這篇 ICCV 論文投遞給 CVPR,卻沒被錄用。
「要靜得下心,要沉得住氣,」是張正友博士在 IJCV Lobster Night 上演講的中心思想。而他自己的研究工作,也嚴(yán)格遵循著這一原則。從 1988 年到 2002 年,14 年來,張正友博士一直按著每兩年選擇一個(gè)課題的節(jié)奏,對業(yè)界重要的問題進(jìn)行深入細(xì)致的研究,而他每兩年的研究成果幾乎每個(gè)都在計(jì)算機(jī)視覺界產(chǎn)生了比較大的影響。同時(shí),張正友博士也評論道,他個(gè)人并不反對學(xué)生對熱點(diǎn)話題(hot topic)的關(guān)注,也理解他們有著每年多出幾篇文章的壓力,但希望他們能從行業(yè)的真正需求出發(fā),將目光放得長遠(yuǎn)一些。
作為過來人,張正友博士感慨道,如今的學(xué)生與以前的學(xué)習(xí)方式迥乎不同。以前由于條件限制,學(xué)生的每一行代碼都需要自己從頭開始編寫,但也正因?yàn)檫@樣,學(xué)生對推導(dǎo)的每一步都非常了解,基礎(chǔ)也相對扎實(shí);而如今互聯(lián)網(wǎng)資源非常豐富,學(xué)生往往沒有花足夠的時(shí)間理解算法背后的原理,也沒有耐心關(guān)注基礎(chǔ)問題的研究。
「我覺得同學(xué)們沒有必要為了多發(fā)表幾篇文章而犧牲了思考這些問題的機(jī)會(huì)。雖然能在熱點(diǎn)研究領(lǐng)域做些改進(jìn)使其在數(shù)據(jù)集上呈現(xiàn)比較好的結(jié)果,發(fā)表文章相對容易,但像深度學(xué)習(xí)這樣的熱點(diǎn)總會(huì)過去。如果沒有獨(dú)到的貢獻(xiàn),明年還有人知道你的工作嗎?」
時(shí)光荏苒,曾經(jīng)作為論文投遞者和會(huì)議參與者的張正友博士,如今已經(jīng)成為了 CVPR 2017 的大會(huì)主席,以重要推動(dòng)者的身份組織著本次大會(huì)。根據(jù)本次大會(huì)的官方資料,CVPR 2017 的與會(huì)人數(shù)達(dá)到 4950 人,達(dá)到了歷史高峰;本次論文有效投遞數(shù)為 2620 篇,收錄 783 篇,投遞數(shù)目比去年增加了40%。
自然,這對于會(huì)務(wù)的組織者而言是一個(gè)不小的挑戰(zhàn):由于投遞的論文數(shù)量過多,為了在規(guī)定時(shí)間內(nèi)完成評審任務(wù),組委會(huì)不得不緊急增加一些評審人;針對去年CVPR因?yàn)槿藬?shù)劇增暴露出的后勤保障混亂、中間休息的咖啡不足、展會(huì)和 posters 空間擁擠等問題,組委會(huì)為這次 CVPR 做了很長的準(zhǔn)備,在會(huì)議中心預(yù)留了6000人的空間,并雇傭了一個(gè)專業(yè)的支持展會(huì)的承包商。組委會(huì)齊心協(xié)力辦一場出色的 CVPR,不僅是為了促進(jìn)計(jì)算機(jī)視覺領(lǐng)域在人工智能領(lǐng)域的交流;也是一次 CV 圈展現(xiàn)自我的機(jī)會(huì)。雖然參加 CVPR 的人數(shù)從去年的 3650 人增加到了今年的 4950 人,但整個(gè)會(huì)議進(jìn)展非常順暢,大家的反饋也非常滿意。
而在這次會(huì)議中,AI 科技評論的一個(gè)明顯感受是華人面孔非常多;關(guān)于這一點(diǎn),張正友博士表示,由于今年自己擔(dān)任大會(huì)主席,劉燕西博士和吳郢博士擔(dān)任程序委員會(huì)主席,因此在區(qū)域主席的選擇上,也有意識(shí)地增加了華人的比重,希望能夠提升華人在學(xué)術(shù)領(lǐng)域的影響力。在組委會(huì)的其它位置,比如企業(yè)關(guān)系主席,也盡可能安排能干的華人擔(dān)任。就像吳郢博士在 IJCV Lobster Night 上的發(fā)言所說,大部分的論文作者中,至少會(huì)出現(xiàn)一個(gè)亞洲名字;口頭報(bào)告中涌現(xiàn)越來越多的亞洲面孔;而贊助商也有很多來自亞洲國家。中國作為亞洲的重要大國,華人自然也是這一群體的中堅(jiān)力量。
然而,張正友博士也發(fā)現(xiàn),雖然華人在學(xué)術(shù)會(huì)議里的地位和力量不可小視,但當(dāng)這些優(yōu)秀的華人學(xué)生畢業(yè)之后,能留在學(xué)術(shù)界持續(xù)做貢獻(xiàn)的人并不多,很多會(huì)轉(zhuǎn)投工業(yè)界繼續(xù)做研究或是創(chuàng)業(yè)。以往計(jì)算機(jī)視覺的學(xué)生很難找到工作,而現(xiàn)在,隨著它的持續(xù)發(fā)展繁榮,學(xué)生們也成為了工業(yè)界關(guān)注和爭奪的對象,投身工業(yè)界也成為了順理成章的事情。以 CVPR 2017 為例,本屆會(huì)議的贊助商達(dá)到 127 家,總贊助費(fèi)超過 85.9 萬美金。這也從側(cè)面體現(xiàn)出了工業(yè)界對學(xué)術(shù)人才的龐大需求。不過張正友博士也認(rèn)為,這種「流失」實(shí)際上也與個(gè)人的選擇有關(guān),「做研究的目的,一方面是為了增加人類的知識(shí),發(fā)掘新的方法;另一個(gè)還是要對社會(huì)產(chǎn)生影響,在工業(yè)界工作算得上是其中一種方式吧。」
張正友博士對計(jì)算機(jī)視覺的未來充滿了信心,也呈現(xiàn)非常樂觀的態(tài)度。他認(rèn)為,無論從論文的投遞數(shù)目,還是展商對學(xué)術(shù)會(huì)議的高度關(guān)注來看,都反映出計(jì)算機(jī)視覺是一個(gè)非常具有前景的領(lǐng)域。「深度學(xué)習(xí)也不只是大數(shù)據(jù)的游戲,有人已經(jīng)開始研究如何將深度學(xué)習(xí)和幾何概念和物理信息結(jié)合。此外,計(jì)算機(jī)視覺也已經(jīng)與很多領(lǐng)域有了交叉,比如為了理解圖像,我們需要結(jié)合語言進(jìn)行處理。而在未來,各個(gè)學(xué)科會(huì)以更加多樣化的形式融合。」同樣地,未來屬于富有創(chuàng)新力量的老師和同學(xué)們,未來的研究趨勢和浪潮,將由他們來引領(lǐng)和推動(dòng)。
今天,CVPR 2017 已經(jīng)進(jìn)入尾聲,我們也期待下一年的 CVPR 能夠給我們帶來更多驚喜。更多資訊,敬請關(guān)注 CVPR,關(guān)注雷鋒網(wǎng) AI 科技評論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章