0
本文作者: 我在思考中 | 2021-09-16 09:59 |
據(jù)多位知情人士向雷鋒網(wǎng)爆料,微軟亞洲研究院計(jì)算機(jī)視覺(jué)大牛王井東已離職,或?qū)⒓尤氚俣取?/span>
視覺(jué)計(jì)算組作為微軟亞研的靈魂團(tuán)隊(duì),陸續(xù)培養(yǎng)出了沈向洋、湯曉鷗、馬毅、孫劍、何愷明等老中青三代計(jì)算機(jī)視覺(jué)引領(lǐng)者,只可惜這些人都已遠(yuǎn)去。
王井東原為微軟亞洲研究院視覺(jué)計(jì)算組的首席研究員,研究領(lǐng)域包括神經(jīng)架構(gòu)設(shè)計(jì)、人體姿態(tài)估計(jì)、語(yǔ)義分割、圖像分類、目標(biāo)檢測(cè)、大規(guī)模索引和顯著目標(biāo)檢測(cè)。
他是 ACM 杰出會(huì)員和 IAPR Fellow,曾任IEEE TPAMI、IEEE TMM、IEEE TCSVT副主編,以及CVPR、ICCV、ECCV、ACM MM、IJCAI、AAAI等視覺(jué)、多媒體、AI領(lǐng)域頂級(jí)會(huì)議的區(qū)域主席。谷歌學(xué)術(shù)顯示,他目前論文總引用量為23950,h指數(shù)為69。
王井東本科就讀于清華大學(xué)自動(dòng)化系,是個(gè)學(xué)霸,成績(jī)?nèi)昙?jí)第一。他2001年和2004年在清華大學(xué)自動(dòng)化系先后獲得學(xué)士學(xué)位和碩士學(xué)位,碩士期間也曾獲得優(yōu)秀碩士學(xué)位論文獎(jiǎng)。2007年,他在香港科技大學(xué)計(jì)算科學(xué)與工程系獲得博士學(xué)位,同年進(jìn)入微軟亞洲研究院。
他的碩士導(dǎo)師是清華大學(xué)教授張長(zhǎng)水,在碩士期間他曾去微軟亞研實(shí)習(xí),接受沈向洋的指導(dǎo),那是他與微軟亞研的初次結(jié)緣。攻讀博士學(xué)位階段,他成為了香港科技大學(xué)教授權(quán)龍的學(xué)生。
權(quán)龍(左)和王井東(右)
除此之外,在整個(gè)學(xué)術(shù)生涯中,王井東亦合作過(guò)多位知名AI學(xué)者,包括華先勝、田奇、梅濤、李世鵬等。
加入微軟亞研后,王井東從研究員一步步上升為高級(jí)首席研究經(jīng)理,并秉承微軟亞研一貫的高產(chǎn)傳統(tǒng),發(fā)表了兩百多篇論文。
王井東加入百度后,具體去向如何?
因其過(guò)硬的實(shí)力,王井東或許可以成為百度研究院在視覺(jué)研究的“一把手”。
AI工業(yè)界有句老話:得視覺(jué)者得天下。
百度研究院歷來(lái)的掌舵人,從余凱、林元慶到王海峰,以及副院長(zhǎng)張潼、集團(tuán)首席科學(xué)家吳恩達(dá)等人,除了林元慶外,其他均為機(jī)器學(xué)習(xí)和NLP領(lǐng)域的學(xué)者,視覺(jué)領(lǐng)頭人屬實(shí)稀缺。
更是從未有過(guò)Fellow級(jí)的計(jì)算機(jī)視覺(jué)專家。
反觀這些年的騰訊(張正友、賈佳亞)、阿里(華先勝、張磊)、華為(田奇)、京東(梅濤),長(zhǎng)期都有Fellow級(jí)知名計(jì)算機(jī)視覺(jué)學(xué)者坐鎮(zhèn)。
這也難怪,百度的業(yè)務(wù)支柱是搜索和廣告,主要涉及文本信息檢索和推薦,自然和NLP、機(jī)器學(xué)習(xí)等技術(shù)更加契合,而在圖像領(lǐng)域,除了自動(dòng)駕駛外,百度天然缺少線下物理世界的視圖場(chǎng)景,而線上圖像的數(shù)據(jù)識(shí)別和處理,本身并不具備太大難度,且實(shí)用價(jià)值不足,這對(duì)知名的計(jì)算機(jī)視覺(jué)專家來(lái)說(shuō),吸引力著實(shí)有限。
業(yè)內(nèi)人告訴雷鋒網(wǎng),王井東加入百度自動(dòng)駕駛部門(mén)也不無(wú)可能。
其一,百度前機(jī)器人、自動(dòng)駕駛實(shí)驗(yàn)室主任及首席3D視覺(jué)科學(xué)家楊睿剛教授已在去年初加入嬴徹科技擔(dān)任CTO,這一職位一直空缺。
其次,他的同門(mén)師弟AutoX創(chuàng)始人肖健雄,在自動(dòng)駕駛方向頗為成功,這為王井東破圈進(jìn)入自動(dòng)駕駛領(lǐng)域有不少借鑒意義。
王井東在計(jì)算機(jī)視覺(jué)領(lǐng)域特別是視覺(jué)感知方面的研究非常廣泛,比如人體姿態(tài)估計(jì)、語(yǔ)義分割、圖像分類、目標(biāo)檢測(cè)等技術(shù),對(duì)于自動(dòng)駕駛來(lái)說(shuō)都是很重要的感知功能。
他還曾開(kāi)發(fā)出HRNet模型,其通用性很強(qiáng),不但可勝任人體姿態(tài)、分割、人臉關(guān)鍵點(diǎn)檢測(cè)、目標(biāo)檢測(cè)等任務(wù),體現(xiàn)了高分辨率表征的優(yōu)點(diǎn),并且從參數(shù)量、計(jì)算量以及最終結(jié)果看,都很有優(yōu)勢(shì)。在CCF-GAIR 2020上,王井東詳細(xì)介紹了這一模型。在報(bào)告中,王井東表示:
這個(gè)方法自從在CVPR發(fā)表以來(lái),已經(jīng)成為在人體姿態(tài)構(gòu)建里一個(gè)標(biāo)準(zhǔn)的網(wǎng)絡(luò),一些文章或者比賽都會(huì)采用HRNet架構(gòu)。
詳見(jiàn):http://www.ozgbdpf.cn/category/smartsecurity/Qu1qbNlNCWdiaaf7.html
而另外一聲音則預(yù)判,王井東深厚的三維視覺(jué)背景,有可能會(huì)去百度研究院,成為元宇宙、AR/VR等創(chuàng)新項(xiàng)目的支撐力量。
可以預(yù)見(jiàn),三維重建在未來(lái)必定會(huì)成為元宇宙最重要的基礎(chǔ)技術(shù)之一,玩家長(zhǎng)期在虛擬空間中進(jìn)行交互,離不開(kāi)大量的重建和識(shí)別。
王井東的導(dǎo)師權(quán)龍教授也曾告訴雷鋒網(wǎng),三維重建包含三大問(wèn)題:一、定位置。假如我給出一張照片,計(jì)算機(jī)視覺(jué)要知道這張照片是在什么位置拍的。二、多目。通過(guò)多目的視差獲取三維信息,識(shí)別每一個(gè)像素并進(jìn)行匹配,進(jìn)行三維重建。三、語(yǔ)義識(shí)別。完成幾何三維重建后,要對(duì)這個(gè)三維信息進(jìn)行語(yǔ)義識(shí)別,這是重建的最終目的。三維重建不是最終的目的,最終的應(yīng)用肯定要把三維重建和識(shí)別融為一體。
雷鋒網(wǎng)《元宇宙 · 十日談》專題介紹
我們所要談的元宇宙,不是天馬行空的《頭號(hào)玩家》,也不是萬(wàn)能的區(qū)塊鏈。沒(méi)有玄學(xué),不形而上。未來(lái)一個(gè)月,雷鋒網(wǎng)站在每位元宇宙建設(shè)方的視角,審視游戲UGC、感官社交、AI、VR、NFT、腦機(jī)接口為元宇宙帶來(lái)的無(wú)限可能。在這場(chǎng)web 3.0革命中,誰(shuí)會(huì)成為最終贏家,字節(jié)、騰訊會(huì)有怎樣的角力,歡迎持續(xù)關(guān)注雷鋒網(wǎng)出品的《元宇宙 · 十日談》。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。