丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給任平
發(fā)送

0

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

本文作者: 任平 2024-01-31 11:09
導(dǎo)語(yǔ):沈向洋、韓玫、陳梅、田英利、肖京、鐘華、李巖、康洪文、蘇航......金出武雄和他的中國(guó)學(xué)生們。

突破性的成就對(duì)金出武雄來(lái)說(shuō)并不新鮮。

自上世紀(jì)八十年代以來(lái),金出武雄(Takeo Kanade)一直是卡內(nèi)基梅隆大學(xué)的基礎(chǔ)。

他發(fā)起、領(lǐng)導(dǎo)、合作了幾個(gè)主要的自主移動(dòng)機(jī)器人和各種應(yīng)用系統(tǒng),譬如該校的無(wú)人駕駛汽車(chē)(NavLab)、自主直升機(jī)(Robocopter)、計(jì)算機(jī)輔助髖關(guān)節(jié)置換手術(shù)系統(tǒng)(HipNav)和視頻監(jiān)控系統(tǒng)(VSAM),只要是與計(jì)算機(jī)視覺(jué)技術(shù)的相關(guān)項(xiàng)目,總能看到金出武雄的名字。

但這并非關(guān)鍵,當(dāng)他在這所學(xué)校工作了十多年后,一則所長(zhǎng)的任職才將他的后半生拉開(kāi)帷幕。

這涉及卡內(nèi)基梅隆大學(xué)的機(jī)器人研究所,能否將技術(shù)創(chuàng)新推向高潮。1992年,金出武雄從創(chuàng)始所長(zhǎng)羅杰·瑞迪(Raj Reddy)手中接過(guò)任命函,意味著這位從日本而來(lái)最初只有研究員身份的學(xué)者,徹底被美國(guó)敞開(kāi)懷抱。

壓力不言而喻,但金出武雄設(shè)法做到了。

一用燈塔光環(huán)招攬全世界精英,二以本所為紐帶,聯(lián)合匹茲堡大學(xué)等多校學(xué)術(shù)資源開(kāi)展跨學(xué)科研究,自身的技術(shù)研究與人才培養(yǎng)水準(zhǔn)從此進(jìn)入全球前列。

用金出武雄的話說(shuō):“作為機(jī)器人研究所的所長(zhǎng),我得到了一個(gè)機(jī)會(huì)--把研究所發(fā)展成擁有200多位研究專(zhuān)家、在全世界最具盛名的機(jī)器人研究所的機(jī)會(huì)?!?/p>

多米諾骨牌般的連鎖效應(yīng)一旦開(kāi)啟,卡內(nèi)基梅隆大學(xué)的機(jī)器人研究所變成了繁華的學(xué)術(shù)中心。

水漲船高,越來(lái)越多的美國(guó)科技公司毗鄰而建,投資機(jī)會(huì)和可用人才也開(kāi)始增加,形成了一個(gè)生態(tài)系統(tǒng)。

傳言里Uber花大價(jià)錢(qián)在該校旁買(mǎi)下一棟樓幾乎挖盡機(jī)器人研究所教授,美國(guó)通用汽車(chē)甚至啤酒制造廠這種體量的企業(yè)都與該所保持著多年合作。那些富有經(jīng)濟(jì)頭腦的人,靠著從機(jī)器人研究所挖掘?qū)W生項(xiàng)目包裝成公司往外賣(mài),一夜暴富的事情隔三差五就會(huì)上演。

無(wú)一例外,名師高徒的故事也發(fā)生在金出武雄身上。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

金出武雄

縱觀整個(gè)計(jì)算機(jī)視覺(jué)、機(jī)器人、人工智能領(lǐng)域的風(fēng)云人物,里面一定那些有耳熟能詳?shù)拿郑?/p>

沈向洋、韓玫(平安硅谷研究院院長(zhǎng))、陳梅(微軟云與AI首席科學(xué)家)、柯啟發(fā)(Uber高級(jí)工程總監(jiān))、田英利(紐約市立大學(xué)教授)、肖京(平安集團(tuán)首席科學(xué)家)、鐘華(文遠(yuǎn)知行工程資深副總裁)、李巖(文遠(yuǎn)知行CTO)、康洪文(慧川智能創(chuàng)始人),再加上那些與金出武雄合作過(guò)的博士后、訪問(wèn)學(xué)者,更是不勝枚舉。

作為金出武雄的學(xué)生,他們既標(biāo)志著金出武雄的過(guò)去,又和金出武雄形成了流動(dòng)的對(duì)照?!皩W(xué)生們”的身份,儼然成了他們的一個(gè)符號(hào),相比很多人而言他們起點(diǎn)頗高。

事了拂衣去,深藏功與名。但江湖,記住了金出武雄的名字。

“我們只去美國(guó)五年”

金出武雄的人生分成了三段,前段留在了日本,中段留在了美國(guó),現(xiàn)在七十多歲這段才又回到了日本。

他三段經(jīng)歷都值得說(shuō)道,因?yàn)闅w根到底都是一個(gè)主題,讓計(jì)算機(jī)“看”世界。但放在20世紀(jì)60年代,這不是一件輕而易舉的事情,那時(shí)的計(jì)算機(jī)處理圖像速度非常慢,半間屋子是計(jì)算機(jī),另外半間是空調(diào),用來(lái)散熱,數(shù)據(jù)處理速度更是與今天不可相提并論。

1968年,金出武雄本科畢業(yè)于京都大學(xué)工學(xué)部電氣電子工學(xué)系,隨后六年碩博進(jìn)入該校堺實(shí)驗(yàn)室的“計(jì)算機(jī)化圖像識(shí)別”研究小組,師從酒井敏之教授。

金出武雄對(duì)計(jì)算機(jī)圖像和聲音處理與識(shí)別進(jìn)行了研究。這是當(dāng)時(shí)世界上最先進(jìn)的研究,也引出了后來(lái)的研究課題--創(chuàng)建世界上第一個(gè)全面的基于計(jì)算機(jī)的面部識(shí)別程序。

事實(shí)上,開(kāi)發(fā)這樣一個(gè)前所未有的面部識(shí)別程序需要很大的勇氣。金出武雄曾表示過(guò),“我不想被問(wèn)到我是否可以做到,當(dāng)我進(jìn)入博士課程時(shí),使用計(jì)算機(jī)處理圖像的想法已經(jīng)開(kāi)始出現(xiàn),我認(rèn)為這是一種應(yīng)該可行的技術(shù)。”

可以大膽想象,金出武雄一切構(gòu)想的根源都是“我想要這樣”,而并不是“能不能實(shí)現(xiàn)呢”,他始終抱著一種“能實(shí)現(xiàn)”的積極態(tài)度。

但是,當(dāng)時(shí)還沒(méi)有數(shù)字圖像,沒(méi)有辦法將膠片上拍攝的照片數(shù)字化。他不得不使用標(biāo)尺在紙質(zhì)照片上整齊地繪制網(wǎng)格線,將其與標(biāo)準(zhǔn)的亮度模式進(jìn)行視覺(jué)匹配,并手動(dòng)對(duì)每個(gè)像素進(jìn)行編號(hào)。緊接著,他又不得不在打字機(jī)上重新輸入,并將其放入計(jì)算器中以創(chuàng)建數(shù)字圖像。這是一項(xiàng)非常耗時(shí)的任務(wù),可以稱(chēng)它為“人類(lèi)數(shù)字化圖像”。

1970年,大阪世博會(huì),機(jī)會(huì)來(lái)了。

金出武雄設(shè)計(jì)了一套裝置。觀眾在鏡頭前坐上3秒鐘,等待面部掃描,計(jì)算機(jī)會(huì)將他/她的眼睛、臉頰大小和五官比例與當(dāng)時(shí)的名流對(duì)比。作為比對(duì)基準(zhǔn)的名人大約有5個(gè),約翰·肯尼迪(美國(guó)前總統(tǒng))、溫斯頓·丘吉爾(英國(guó)前首相)、瑪麗蓮·夢(mèng)露(美國(guó)女星)。掃描后,屏幕會(huì)顯示測(cè)評(píng)結(jié)果,“您擁有一張夢(mèng)露同款臉型”。 

這臺(tái)裝置在世博會(huì)上大獲成功,金出武雄在一次演講中回憶,約有數(shù)千人進(jìn)行了掃描。但他的兩位指導(dǎo)老師酒井敏之教授和長(zhǎng)尾真教授(后任京都大學(xué)校長(zhǎng))有些遺憾,未能將所有的數(shù)據(jù)保留形成數(shù)據(jù)庫(kù)。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

1970年大阪世博會(huì)上大獲歡迎的人臉掃描儀裝置,一名東亞老年男性被判定為“丘吉爾同款臉型”

金出武雄1973年出版的博士論文封面

1977年,金出武雄出版了自己的博士論文,《Computer Recognition of Human Faces》,將基于神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)技術(shù)將檢測(cè)率提高到前所未有的水平。他因此收到了主要來(lái)自美國(guó)的采訪請(qǐng)求,如《連線》雜志。而且這項(xiàng)前所未有的研究成果,經(jīng)美國(guó)國(guó)家科學(xué)委員會(huì)報(bào)告驗(yàn)證,也變得稍稍為人所知。

大概過(guò)了三十年后金出武雄對(duì)此表態(tài),“我的研究生時(shí)代,還好提早拿出了漂亮的成果?!?/p>

對(duì)于大眾來(lái)講,這促使了今天在智能手機(jī)攝像頭中普遍使用人臉檢測(cè)。

1980年,當(dāng)金出武雄獲得博士學(xué)位,并從助教成為助理教授時(shí),隨后便被羅杰·瑞迪(Raj Reddy)招聘到了美國(guó)匹茲堡的卡內(nèi)基梅隆大學(xué)(CMU),擔(dān)任計(jì)算機(jī)科學(xué)學(xué)院當(dāng)時(shí)新成立的「機(jī)器人研究所」(CMU RI)的高級(jí)研究科學(xué)家。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

羅杰·瑞迪(Raj Reddy) (左)、酒井敏之(中),金出武雄(右)(約1990年在京都大學(xué))

實(shí)際上瑞迪的名聲在外,他就是李開(kāi)復(fù)在CMU的博士導(dǎo)師,該校機(jī)器人研究所的首任所長(zhǎng),1994年圖靈獎(jiǎng)得主,也是美劇《生活大爆炸》中能說(shuō)一口地道的印式英語(yǔ)的主角Raj的人物原型。

當(dāng)金出武雄來(lái)到美國(guó)兩個(gè)月后,在一次項(xiàng)目會(huì)議上,瑞迪突然告知:“視覺(jué)是金出武雄的專(zhuān)長(zhǎng),從今天開(kāi)始,他將成為首席研究員,負(fù)責(zé)DARPA(國(guó)防高級(jí)研究計(jì)劃局)發(fā)起的圖像理解項(xiàng)目?!?/p>

通常,在美國(guó),除非研究員編寫(xiě)自己的提案并獲得預(yù)算,否則無(wú)法成為項(xiàng)目負(fù)責(zé)人。但當(dāng)時(shí)如果瑞迪本人或CMU有任何其他人是成像方面的專(zhuān)家,這個(gè)機(jī)會(huì)一定不會(huì)如此輕松拿到。同時(shí)這也間接證明,瑞迪眼光毒辣,用人大膽,當(dāng)初把金出武雄招來(lái)就計(jì)劃讓他挑起大梁。

但要說(shuō)為何金出武雄提拔如此迅速,還有一個(gè)人不能忽視--艾倫·紐厄爾(Allen Newell)。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

艾倫·紐厄爾(Allen Newell)

紐厄爾最大的名號(hào)是人工智能的創(chuàng)始人物,五十年代參加了具有歷史意義的會(huì)議達(dá)特茅斯會(huì)議,六十年代離開(kāi)業(yè)界,正式加盟CMU,主要精力放在了籌建和發(fā)展該校的計(jì)算機(jī)科學(xué)系。剛好在長(zhǎng)假的一天,紐厄爾來(lái)到京都大學(xué)酒井教授的實(shí)驗(yàn)室。當(dāng)時(shí)金出武雄是一名助理教授,相當(dāng)主動(dòng)地向紐厄爾介紹起正在做的研究。第二天,紐厄爾要去東京參觀皇居,酒井教授提議讓金出武雄帶他參觀,促使兩人的關(guān)系迅速升溫。

不過(guò)這還得說(shuō),金出武雄總是擅長(zhǎng)抓住機(jī)會(huì)和更優(yōu)秀的人聊天,“我在日本的時(shí)候,要是有名字在論文或者報(bào)紙上出現(xiàn)過(guò)的人來(lái),我一定會(huì)見(jiàn)面談一下,這樣的機(jī)會(huì)一年最多就兩三回?!?/p>

當(dāng)金出武雄八十年代來(lái)到CMU,趕上了匹茲堡“銹帶經(jīng)濟(jì)區(qū)”轉(zhuǎn)型浪潮,該校機(jī)器人研究所抓住當(dāng)?shù)亟⑾冗M(jìn)技術(shù)中心的契機(jī),鼓勵(lì)師生將其優(yōu)秀技術(shù)商業(yè)化運(yùn)營(yíng),與英特爾、蘋(píng)果、谷歌、IBM、西門(mén)子、NEC研究院的合作由此開(kāi)始。

在這樣一個(gè)時(shí)期,金出武雄等一眾研究員被徹底放開(kāi)手腳,推動(dòng)計(jì)算機(jī)視覺(jué)技術(shù)從實(shí)驗(yàn)室走向應(yīng)用。

事實(shí)上,無(wú)論是在日本還是美國(guó),金出武雄都嚴(yán)格遵循了日本研究人員的典型道路--在同一所大學(xué)建立自己的職業(yè)生涯。

但當(dāng)周?chē)娜藛?wèn)他:“你為什么要離開(kāi)日本的大學(xué)去美國(guó)?”這個(gè)問(wèn)題一經(jīng)問(wèn)出便意味著,還有一部分人認(rèn)為美國(guó)大學(xué)的工作是沒(méi)有保障的。

然而,金出武雄說(shuō)道:“我知道美國(guó)大學(xué)擁有美妙的計(jì)算機(jī)環(huán)境,就像天堂一樣,我保證在CMU待上5年,就可以做3倍于日本的研究?,F(xiàn)在我35歲,如果加上15年,將是50歲。我想那時(shí)我不會(huì)再想任何新的事情,我的生命可以結(jié)束了。”

金出武雄最終在這所學(xué)校待了40多年,帶領(lǐng)出一支高水準(zhǔn)的計(jì)算機(jī)視覺(jué)研究隊(duì)伍,而他本人也成為了CMU“吉祥物”地位的中心人物。

自動(dòng)駕駛?早有人四十年前就玩過(guò)了

在美國(guó)期間,金出武雄參與了帶有人工智能的攝像眼的機(jī)器人及其系統(tǒng)的開(kāi)發(fā)等各種各樣的研究。

1981年,金出武雄與團(tuán)隊(duì)設(shè)計(jì)出世界上第一個(gè)直驅(qū)機(jī)械臂,包含機(jī)器人組件內(nèi)的所有電機(jī),從而消除了長(zhǎng)傳動(dòng)軸。這個(gè)研究當(dāng)時(shí)被多家機(jī)器人制造商使用,被公認(rèn)為最先進(jìn)的機(jī)械臂技術(shù)之一。

但金出武雄的機(jī)器人夢(mèng)想并不止步于此。自20世紀(jì)80年代中期以來(lái),他發(fā)起、領(lǐng)導(dǎo)、合作了幾個(gè)主要的自主移動(dòng)機(jī)器人和各種應(yīng)用系統(tǒng),包括CMU的無(wú)人駕駛汽車(chē)(NavLab)、自主直升機(jī)(Robocopter)、計(jì)算機(jī)輔助髖關(guān)節(jié)置換手術(shù)系統(tǒng)(HipNav)和視頻監(jiān)控系統(tǒng)(VSAM)。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

金出武雄在卡內(nèi)基梅隆大學(xué),拍攝時(shí)間約為1985年,這年他拿到CMU終身教授職稱(chēng)

就拿無(wú)人駕駛汽車(chē)(NavLab)項(xiàng)目來(lái)說(shuō),這是一個(gè)開(kāi)創(chuàng)性項(xiàng)目,旨在開(kāi)發(fā)基于視覺(jué)的自動(dòng)駕駛汽車(chē)技術(shù),包括車(chē)道保持、自動(dòng)平行泊車(chē)和物體檢測(cè)。

1984年,在GPS還沒(méi)有被發(fā)明的時(shí)候,金出武雄和團(tuán)隊(duì)在一處廢棄的停車(chē)場(chǎng)測(cè)試了他們的第一輛自動(dòng)駕駛汽車(chē)。在今天看來(lái),當(dāng)時(shí)的水準(zhǔn)不值一提,但從那時(shí)起,在美國(guó)DARPA(國(guó)防高級(jí)研究計(jì)劃局)等機(jī)構(gòu)的資助和推動(dòng)下,這個(gè)項(xiàng)目在1995年夏天一炮而紅。

那一轟動(dòng)性事件就是橫穿美國(guó)的越野旅行。一輛代號(hào)為“NAVLAB 5”的小型貨車(chē)從美國(guó)的東海岸駛到西海岸,它以約100公里/小時(shí)的速度從匹茲堡行駛到圣地亞哥,全程大概2849英里(約4587公里),其中自主駕駛部分達(dá)到了98.7%。

據(jù)Navlab 5的研發(fā)成員之一,這趟旅行中乘坐NavLab 5的兩名學(xué)生,迪安·波默洛(Dean Pomerleau,Navlab小組的聯(lián)合主任)和托德·約赫姆(Todd Jochem,兩人為師生關(guān)系)回憶:他們當(dāng)時(shí)花了4個(gè)月時(shí)間完成車(chē)輛的改裝和軟件調(diào)試,總成本不超過(guò)2萬(wàn)美元。所有裝備包括一臺(tái)計(jì)算機(jī)、一臺(tái)640×480像素的彩色照相機(jī)、GPS,以及一臺(tái)光纖陀螺儀。

最終駕駛方式是用擋風(fēng)玻璃的攝像頭來(lái)尋找車(chē)道線,人類(lèi)負(fù)責(zé)踩油門(mén)和剎車(chē)。但這已經(jīng)很棒了,為了標(biāo)記這一事件,團(tuán)隊(duì)借鑒了1986年“攜手美國(guó)” (Hands Across America)慈善活動(dòng)的名稱(chēng),將這次旅行稱(chēng)為“無(wú)手橫穿美國(guó)”(NO Hands Across America)。

值得一提的是,當(dāng)時(shí)他們的GPS并不是用來(lái)定位,而是測(cè)速。托德·約赫姆說(shuō),那時(shí)GPS還沒(méi)有開(kāi)放高精度定位功能,如果使用這種服務(wù)價(jià)格會(huì)十分高昂,同時(shí),就算用GPS進(jìn)行高精度定位,他們也沒(méi)有匹配的地圖。

不過(guò)這反而開(kāi)辟了自動(dòng)駕駛的一套范式。當(dāng)諸多自動(dòng)駕駛汽車(chē)依賴(lài)于3D地圖來(lái)進(jìn)行環(huán)境自適應(yīng)之時(shí),不需要地圖來(lái)做決策的方式,意味著可以將一輛車(chē)輛扔到一個(gè)它完全沒(méi)有去過(guò)的地點(diǎn),它能夠通過(guò)學(xué)習(xí)人類(lèi)以往的駕駛經(jīng)驗(yàn)來(lái)進(jìn)行操控,而且表現(xiàn)很出色。

如今以特斯拉為代表的純視覺(jué)方案,只靠攝像頭,再加算法,來(lái)進(jìn)行自動(dòng)駕駛,走的就是這條路線。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

基于1990年的龐蒂亞克運(yùn)動(dòng)款轎車(chē)改裝的自動(dòng)駕駛車(chē)NavLab 5(1995年)

照片中的兩位是CMU研究員,迪安·波默洛(Dean Pomerleau)和托德·約赫姆(Todd Jochem)

有趣的是,這次具有歷史意義的長(zhǎng)途旅行當(dāng)時(shí)幾乎沒(méi)有任何資金支持,他們?cè)诼飞腺u(mài)10美元一件的襯衫,用于支付食宿費(fèi)用?!安恍枰p手駕駛,一邊開(kāi)車(chē)一邊賣(mài)貨確實(shí)是個(gè)好生意?!倍嗄旰?,在美國(guó)脫口秀上,金出武雄靠這個(gè)逸事一出場(chǎng)就引得全場(chǎng)叫絕。

把這話放在現(xiàn)在,直到最近幾年才有高?;剡^(guò)味來(lái)決定開(kāi)設(shè)自動(dòng)駕駛課程,但40年前,CMU人才一直處于自動(dòng)駕駛汽車(chē)技術(shù)的前沿。在這一點(diǎn)上,甚至他們中很少有研究人員認(rèn)為自動(dòng)駕駛是一項(xiàng)難以想象的任務(wù)。

好比當(dāng)時(shí)金出武雄表達(dá)了這樣一段話:“在1980年左右,計(jì)算機(jī)圖像處理已經(jīng)成為一個(gè)非常普遍的概念,通過(guò)分析航空照片來(lái)建立識(shí)別和尋找道路的研究正在取得進(jìn)展。你需要做的僅僅是在你的車(chē)?yán)锓乓粋€(gè)攝像頭,然后編寫(xiě)一個(gè)遵循你路徑的程序。當(dāng)然,這并不容易,但自動(dòng)駕駛成為可能是理所當(dāng)然的?!?/p>

這句話直接、簡(jiǎn)單、省略,即便對(duì)計(jì)算機(jī)視覺(jué)領(lǐng)域一知半解,沒(méi)有深入研究的人也容易理解。這就是金出武雄的一大特點(diǎn):像外行一樣思考,像專(zhuān)家一樣實(shí)踐。

這句話同時(shí)也極具鼓舞人心的效果,意思是,研究項(xiàng)目領(lǐng)導(dǎo)的主要工作,就是給出這樣的行動(dòng)方針,懂得省略到什么程度是關(guān)鍵。如果直接從復(fù)雜的現(xiàn)實(shí)開(kāi)始思考,是無(wú)法鼓勵(lì)團(tuán)隊(duì)向前邁出一步的,提供研究經(jīng)費(fèi)的贊助商也暗生動(dòng)搖。

在CMU機(jī)器人研究所的帶領(lǐng)下,當(dāng)時(shí)社會(huì)正處于一場(chǎng)意義深遠(yuǎn)的交通革命的邊緣。

美國(guó)每天的頭條新聞大肆宣揚(yáng)自動(dòng)駕駛汽車(chē)技術(shù)的最新成就、DARPA發(fā)起關(guān)于自動(dòng)駕駛的城市挑戰(zhàn)賽(這一比賽的地位等同于無(wú)人駕駛?cè)Φ膴W林匹克)、科技巨頭爭(zhēng)相在匹茲堡開(kāi)設(shè)了自動(dòng)駕駛研究機(jī)構(gòu)、汽車(chē)制造商競(jìng)相為他們的汽車(chē)配備更加智能和自主的系統(tǒng),包括自適應(yīng)巡航控制、停車(chē)輔助、避免碰撞、車(chē)道維護(hù)等。

比如2007年的DARPA城市挑戰(zhàn)賽,100余組參賽隊(duì)伍中,11輛自動(dòng)駕駛車(chē)因其卓越性能脫穎而出,冠軍就是“Boss”——CMU基于雪佛蘭太浩的自動(dòng)駕駛改裝車(chē)。

CMU機(jī)器人研究所在DARPA挑戰(zhàn)賽中的優(yōu)秀表現(xiàn),直接促使美國(guó)通用汽車(chē)公司對(duì)其捐贈(zèng)500萬(wàn)美金建立第二個(gè)實(shí)驗(yàn)室--自動(dòng)駕駛技術(shù)合作研發(fā)實(shí)驗(yàn)室。當(dāng)年帶隊(duì)參加這場(chǎng)比賽的CMU電子計(jì)算機(jī)工程系教授拉吉·拉庫(kù)馬(Raj Rajkumar),成為這所實(shí)驗(yàn)室的聯(lián)合主任。

但更大的意義是,從此全球開(kāi)啟了自動(dòng)駕駛產(chǎn)業(yè)化之路。

就以拉吉·拉庫(kù)馬來(lái)說(shuō),此后他創(chuàng)辦了Ottomatika公司(主攻自動(dòng)駕駛軟件和系統(tǒng)開(kāi)發(fā)),2015年該公司被世界第三大汽車(chē)零部件制造商德?tīng)柛J召?gòu)。到了2020年安波福(從德?tīng)柛7植鸪鰜?lái))和現(xiàn)代汽車(chē)共同出資40億美元,成立了現(xiàn)在的Motional,與Lyft、Uber、Via等公司都有合作。

此外迪安·波默洛和學(xué)生托德·約赫姆一起創(chuàng)辦了AssistWare,專(zhuān)門(mén)研究基于機(jī)器視覺(jué)的系統(tǒng)比如疲勞駕駛警告系統(tǒng)、車(chē)輛越位提醒,拿下一級(jí)汽車(chē)供應(yīng)商威世通的訂單,后來(lái)該公司在2006年5月達(dá)到頂峰,被康耐視公司收購(gòu),再后來(lái)就是康耐視將部分業(yè)務(wù)出售給日本TKHoldings了。

總之,當(dāng)初這些在金出武雄領(lǐng)導(dǎo)計(jì)算機(jī)視覺(jué)小組工作的人,都憑借那一時(shí)期的工作在美國(guó)建立聲名,從此在工業(yè)界獨(dú)當(dāng)一面。

說(shuō)實(shí)話,別看現(xiàn)在CMU機(jī)器人研究所在自動(dòng)駕駛方面很了不起,但當(dāng)時(shí)接過(guò)DARPA(國(guó)防高級(jí)研究計(jì)劃局)這種軍方資金的支持,如果成效甚微免不了一頓重?fù)簟?/p>

尤其是如果說(shuō)出CMU機(jī)器人研究所成立的背景,是由美國(guó)前副總統(tǒng)迪克·切尼(Dick Cheney)、海軍研究辦公室海軍上將布奇諾(Bacchico)打了包票,找來(lái)了匹茲堡當(dāng)?shù)仄髽I(yè)西屋電氣總裁湯姆·默林Tom Murrin談贊助,光面對(duì)這三人的“考核”都是巨大壓力。

金出武雄一次說(shuō)起類(lèi)似的事。他到達(dá)美國(guó)后不久,第一次參加DARPA會(huì)議,從早到晚連上通宵都在討論工作問(wèn)題,當(dāng)然他的英語(yǔ)不錯(cuò),常被人褒獎(jiǎng)“金出教授頭腦很活躍啊”,還曾在研究生時(shí)74小時(shí)連續(xù)不斷地思考問(wèn)題,但是,“當(dāng)我回到酒店洗澡時(shí),我的手上有頭發(fā),我認(rèn)為當(dāng)時(shí)壓力很大。”

在研究界活躍的研究者都有一個(gè)共同點(diǎn),就是擁有智慧體力。智慧體力是金出武雄造的詞,指的是能長(zhǎng)時(shí)間連續(xù)思考同一個(gè)問(wèn)題,從各方面來(lái)思考同一個(gè)問(wèn)題而怎么都不厭倦的能力。

金出武雄設(shè)法做到了沒(méi)有屈服于壓力,僅1991年這一年的論文和報(bào)告數(shù)量為25篇,這樣的研究強(qiáng)度保持了幾十年,堪稱(chēng)史上罕見(jiàn)。

唯一一位登上超級(jí)碗的大學(xué)教授 

21世紀(jì)之前,金出武雄已經(jīng)功成名就:CMU最高榮譽(yù)Helen Whitaker講座教授、CV領(lǐng)域最高榮譽(yù)之一Marr獎(jiǎng)、美國(guó)國(guó)家航空航天局(NASA)先進(jìn)技術(shù)咨詢(xún)委員會(huì)顧問(wèn)、美國(guó)兩院院士、IEEE / ACM fellow,諸如此類(lèi)......

但他一生最重要的角色,一定是CMU機(jī)器人研究所的所長(zhǎng)。

1992年,金出武雄從羅杰·瑞迪(Raj Reddy)手中接過(guò)了第二任所長(zhǎng)一職,從此奠定了CMU機(jī)器人研究所的江湖地位。

用他自己的話說(shuō):作為機(jī)器人研究所的所長(zhǎng),我得到了一個(gè)機(jī)會(huì)--把研究所發(fā)展成擁有200多位研究專(zhuān)家、在全世界最具盛名的機(jī)器人研究所的機(jī)會(huì)?!?/p>

故此,1995年,機(jī)器人研究所憑借自動(dòng)駕駛名聲大噪,僅僅是金出武雄完成的第一階段任務(wù)--幫助該所減輕經(jīng)費(fèi)壓力、擴(kuò)大師資力量,并將研究模塊衍生到自動(dòng)駕駛汽車(chē)一直到醫(yī)療機(jī)器人領(lǐng)域--機(jī)器人研究所從一個(gè)研究中心轉(zhuǎn)變?yōu)橐粋€(gè)擁有獨(dú)特研究生和本科課程的成熟學(xué)術(shù)部門(mén)。

此時(shí),距離金出武雄和團(tuán)隊(duì)亮相超級(jí)碗,還有六年。那是一場(chǎng)極致的視覺(jué)盛宴。

“我們涵蓋了一切,從理論到軟件,再到技術(shù)和硬件。我們的多功能性可能是我們真正的強(qiáng)項(xiàng),我為此感到自豪?!苯鸪鑫湫鄯Q(chēng)。

(注:超級(jí)碗(Super Bowl)是美國(guó)職業(yè)橄欖球聯(lián)盟年度冠軍賽。多年來(lái)都是全美收視率最高的電視節(jié)目,并發(fā)展為美國(guó)一個(gè)非官方的全國(guó)性節(jié)日,甚至超級(jí)碗中場(chǎng)秀有“美國(guó)春晚”之稱(chēng))

2001年1月28日,電視臺(tái)在轉(zhuǎn)播超級(jí)碗比賽時(shí),使用了一個(gè)搭載“機(jī)器人攝像機(jī)”的名叫“EyeVision”(幻影)的新式現(xiàn)場(chǎng)直播系統(tǒng)。當(dāng)時(shí),世界上約有五億人在電視機(jī)前收看了那場(chǎng)比賽。這個(gè)系統(tǒng)所用的技術(shù)是受在世界上擁有廣泛電視網(wǎng)絡(luò)的CBS公司的委托,由金出武雄和他的團(tuán)隊(duì)開(kāi)發(fā)的。

這一直播系統(tǒng)新在何處?

打個(gè)比方,現(xiàn)在我們經(jīng)常在刷到“運(yùn)動(dòng)會(huì)上攝影師跟拍,舉著相機(jī)與運(yùn)動(dòng)員同頻奔跑”的新聞。對(duì)于短跑比賽來(lái)說(shuō)這種攝像操作比較簡(jiǎn)單,但對(duì)于橄欖球這種集體配合的、對(duì)抗性的射球比賽,要把決勝一瞬間的精彩畫(huà)面捕捉進(jìn)電視直播,光靠人力根本不可能完成。

于是,金出武雄提出一個(gè)思路:“我認(rèn)為最好把相機(jī)放在你想看的地方,一個(gè)相機(jī)不行,就多加相機(jī)。”

球場(chǎng)內(nèi),他和團(tuán)隊(duì)在場(chǎng)地上方設(shè)置了200多臺(tái)機(jī)器人攝像機(jī)來(lái)覆蓋整個(gè)球場(chǎng)。球場(chǎng)外,CBS轉(zhuǎn)播車(chē)中設(shè)置有帶有監(jiān)視畫(huà)面的類(lèi)似移動(dòng)攝像機(jī)的裝置,并與場(chǎng)內(nèi)的機(jī)器人攝像機(jī)全部連接。

也就是說(shuō),當(dāng)場(chǎng)外的裝置做出“移動(dòng)鏡頭”或者“變焦”的操作時(shí),計(jì)算機(jī)同時(shí)進(jìn)行運(yùn)算,遠(yuǎn)程控制相應(yīng)的機(jī)器人攝像機(jī)做出同樣的操作,并且輸出拍攝畫(huà)面。所以,轉(zhuǎn)播車(chē)中的攝影師根據(jù)拍攝的位置,可以自由地選擇運(yùn)動(dòng)場(chǎng)內(nèi)的攝像機(jī),從而得到最理想的拍攝位置。

但效果并不僅僅而已。

“橄欖球比賽的時(shí)候要過(guò)那條線,過(guò)去是一堆人擠在那盯著,有了那個(gè)系統(tǒng)之后,就是‘啪’把那個(gè)時(shí)間停住,所有攝像機(jī)都轉(zhuǎn)過(guò)來(lái)看。例如,在四分衛(wèi)投球的那個(gè)瞬間,和傳統(tǒng)的單向拍攝不同,我們的攝像機(jī)一起旋轉(zhuǎn),一起拍攝投球人的方向。對(duì)于是否觸底得分的微妙情況,我們可以自由地將視點(diǎn)變換360°,一目了然并做出裁決。那個(gè)效果就像電影《黑客帝國(guó)》中的‘子彈時(shí)間’鏡頭一樣?!?/p>

所有攝像機(jī)把拍攝的視頻傳送到轉(zhuǎn)播車(chē)中,這樣對(duì)每個(gè)攝像機(jī)拍攝的畫(huà)面進(jìn)行合并剪輯的話,可以360°全方位地再現(xiàn)選手和球的移動(dòng)狀況。

那次“EyeVision”在超級(jí)碗中所體現(xiàn)出的效果得到了大家很高的評(píng)價(jià)。這項(xiàng)研究的投資公司想把這項(xiàng)技術(shù)投放市場(chǎng),結(jié)果它的股價(jià)在兩周內(nèi)翻了六倍。當(dāng)年擔(dān)任這屆“超級(jí)碗”的中場(chǎng)秀表演嘉賓美國(guó)歌手小甜甜布蘭妮,在這套直播系統(tǒng)的加持下制造了一場(chǎng)視覺(jué)盛宴,成為美國(guó)新生代流行文化的代表人物之一。

有趣的是,超級(jí)碗轉(zhuǎn)播當(dāng)天,金出武雄得到了25秒的時(shí)間對(duì)“EyeVision”系統(tǒng)中應(yīng)用的新技術(shù)進(jìn)行解釋。2001年超級(jí)碗一個(gè)30秒廣告220萬(wàn)美元,以后,金出武雄就戴上了“唯一出現(xiàn)在超級(jí)碗中的大學(xué)教授”的帽子。

他打趣道,“EyeVision是與世界上任何人開(kāi)啟精彩對(duì)話的門(mén)票?!痹贓yeVision之前, 當(dāng)他在飛機(jī)上與旁邊的人交談,會(huì)說(shuō)自己是CMU從事機(jī)器人技術(shù)研究的教授,僅此而已。 但是那場(chǎng)比賽后,當(dāng)告訴別人建立了EyeVision時(shí),所有人都說(shuō)“哦,那個(gè)我知道,就是你做的啊。”那時(shí)金出武雄就會(huì)非常自豪。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

在用于虛擬現(xiàn)實(shí)的3D相機(jī)室中,金出武雄被50臺(tái)攝像機(jī)包圍(1998年)

在準(zhǔn)備安裝EyeVision的工作人員的陪同下(美國(guó)佛羅里達(dá)州,2001年)

但后來(lái)回憶起來(lái),金出武雄說(shuō)比賽前的事故曾經(jīng)接二連三地出現(xiàn)。

真正轉(zhuǎn)播的日子是1月28日,前一年的9月就已經(jīng)開(kāi)始計(jì)劃了,可到了12月初也才能確保幾臺(tái)機(jī)器人攝像機(jī)就位。12月24日圣誕節(jié)前夕,在紐約巨人體育場(chǎng)用5臺(tái)攝像機(jī)做練習(xí)的時(shí)候,開(kāi)發(fā)中的軟件讓他們團(tuán)隊(duì)認(rèn)識(shí)到,要想使用30臺(tái)攝像機(jī)所做的準(zhǔn)備工作還差得很遠(yuǎn),起碼要200臺(tái)。

接著,機(jī)器人電源的的電容器又不知道什么原因爆了,電源又不能用了。都到了轉(zhuǎn)播的前一周1月21日,200臺(tái)機(jī)器人攝像頭中因?yàn)閲?yán)寒能動(dòng)的只有一半,而且還因?yàn)殡娙荼ǖ脑驍?shù)目還在減少。

解救了這場(chǎng)危機(jī)的是三個(gè)工作人員。

他們是研制完全自動(dòng)飛行直升飛機(jī)項(xiàng)目的成員,而且在圖像處理、計(jì)算機(jī)系統(tǒng)、通信軟件、電路等方面可以說(shuō)是專(zhuān)家中的專(zhuān)家。其中一位來(lái)自中國(guó),如今谷歌資深軟件工程師(principle level)滑蔚。管理Google Cloud AI的多個(gè)團(tuán)隊(duì),也是平安硅谷研究院院長(zhǎng)韓玫的先生。當(dāng)初韓玫博士師從金出武雄(1995--2001),滑蔚從臨校匹大畢業(yè)后進(jìn)入金出武雄團(tuán)隊(duì)(1999--2001),一邊等待韓玫畢業(yè)。

不過(guò)兩人的方向稍有不同,滑蔚參與了金出武雄發(fā)起的多個(gè)大型項(xiàng)目,如EyeVision、虛擬化現(xiàn)實(shí),重點(diǎn)研究了多攝像頭標(biāo)定、圖像配準(zhǔn)、面部表情分析、視覺(jué)跟蹤和模式識(shí)別等問(wèn)題。韓玫選的是導(dǎo)師金出武雄的強(qiáng)項(xiàng)--三維重建,博士論文做的是經(jīng)典的Structure from Motion (SfM) 方法研究。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

韓玫

此后,兩人幾乎在2001年初同一時(shí)間拿到NEC美國(guó)實(shí)驗(yàn)室的offer。同期華人有龔怡宏、朱勝火、余凱、王進(jìn)軍、王孝宇、林元慶、徐常勝、呂鳳軍、楊銘、徐偉、賈揚(yáng)清等等,此后他們中陸續(xù)有人回國(guó),余凱2012年加入百度、王進(jìn)軍2013年跟著龔怡宏回了西安交大、王孝宇在2017年10月加入云天勵(lì)飛、林元慶2017年11月創(chuàng)立Aibee......撐起了中國(guó)計(jì)算機(jī)視覺(jué)的半壁江山。(這段故事請(qǐng)看:硅谷NEC Lab往事:將中國(guó)企業(yè)拽進(jìn)AI時(shí)代的人。后續(xù)本文作者吳彤將推出韓玫的個(gè)人故事。歡迎添加微信交流:icedaguniang)

沈向洋、韓玫、田英利、肖京 

很多人可能有所不知,金出武雄門(mén)下的華人學(xué)生并不少。

除了之前提到的韓玫,還有陳梅(微軟云與AI首席科學(xué)家)、柯啟發(fā)(Uber高級(jí)工程總監(jiān))、田英利(紐約市立大學(xué)教授)、肖京(平安集團(tuán)首席科學(xué)家)、鐘華(文遠(yuǎn)知行工程資深副總裁)、李巖(文遠(yuǎn)知行CTO)、康洪文(慧川智能創(chuàng)始人)等等。

他們大多數(shù)人大都是跟著沈向洋(曾任微軟全球執(zhí)行副總裁,當(dāng)年是視覺(jué)計(jì)算組負(fù)責(zé)人)在微軟亞洲研究院(MSRA,當(dāng)時(shí)還叫微軟中國(guó)研究院)實(shí)習(xí),開(kāi)始對(duì)圖像感興趣,又追隨著沈向洋的腳步到CMU機(jī)器人研究所,慢慢都成為了金出武雄的學(xué)生。

這里面有個(gè)沈向洋的故事,他其實(shí)是羅杰·瑞迪(Raj Reddy)的學(xué)生,但在1991年進(jìn)入CMU后,卻并沒(méi)有走上導(dǎo)師所研究的語(yǔ)音識(shí)別這條路。沈向洋認(rèn)為,語(yǔ)音雖然重要,但人對(duì)外界的感知,95%是從視覺(jué)來(lái)的,所以誤打誤撞成了金出武雄的“半個(gè)學(xué)生”。

當(dāng)然,金出武雄給了沈向洋很多指導(dǎo)。沈向洋發(fā)表的博士論文是世界上最早有關(guān)由照片轉(zhuǎn)換成虛擬現(xiàn)實(shí)的研究,所設(shè)計(jì)的四分樹(shù)樣條數(shù)函數(shù)算法,則是世界上最好的運(yùn)動(dòng)參數(shù)估計(jì)算法之一。

韓玫跟沈向洋在CMU重疊過(guò)一年,韓95年入學(xué),沈96年畢業(yè),韓玫還做過(guò)沈向洋在微軟雷德蒙研究院的第一個(gè)實(shí)習(xí)生,兩人關(guān)系匪淺,“我三次換工作之前都是先問(wèn)沈向洋的意見(jiàn)?!?/p>

韓玫曾問(wèn)過(guò)金出武雄,“當(dāng)時(shí)你有沒(méi)有一個(gè)判斷,哪個(gè)學(xué)生很強(qiáng)?”

“我基本有一些判斷,誰(shuí)適合做教授,誰(shuí)適合在公司,誰(shuí)更有鋒芒,誰(shuí)更內(nèi)斂。當(dāng)時(shí)能看出來(lái)沈向洋是跟你們不太一樣的中國(guó)人,更外向一些,臉皮厚,沖上去跟人聊天。”

金出武雄描述,沈向洋怎么跟人聊呢?他發(fā)現(xiàn)別人都喜歡這個(gè)football(美式橄欖球),他就會(huì)專(zhuān)門(mén)去找新聞看,開(kāi)頭能唬人一陣,但說(shuō)的深一點(diǎn)專(zhuān)業(yè)術(shù)語(yǔ)他也不懂,他就回去再研究,第二天再找那個(gè)人聊。就是臉皮厚到不停地聊,跟人打交道的能力就練出來(lái)了,慢慢就成了圈子里的意見(jiàn)領(lǐng)袖。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

沈向洋

1997年,柯啟發(fā)來(lái)到CMU,1998年和1999年田英利、肖京也來(lái)了。

他們?nèi)说穆臍v有不少相似之處。肖京稱(chēng)柯啟發(fā)是“嫡系師兄”。兩人本碩都在中科大和中科院自動(dòng)化所的模式識(shí)別與人工智能實(shí)驗(yàn)室,同是時(shí)任所長(zhǎng)馬頌德的學(xué)生。

據(jù)肖京所言,柯啟發(fā)還曾指導(dǎo)過(guò)他的本科畢業(yè)論文,畢業(yè)后兩人都曾在日本企業(yè)和微軟供職,當(dāng)初肖京一進(jìn)微軟就是柯啟發(fā)帶領(lǐng)的Bing搜索團(tuán)隊(duì)。

田英利則早于他們幾年到中科院做研究員。當(dāng)時(shí)國(guó)內(nèi)的模式識(shí)別和機(jī)器人研究剛剛起步,馬頌德后來(lái)又與田英利定下兩年之約--博士學(xué)成之后要回來(lái)工作兩年--正是柯啟發(fā)和肖京讀碩期間。后來(lái)田英利來(lái)到CMU做博士后,加入了當(dāng)時(shí)剛剛啟動(dòng)不久的“人臉的表情識(shí)別”課題。

(后續(xù)本文作者吳彤將推出田英利、柯啟發(fā)、肖京的個(gè)人故事。歡迎添加微信交流:icedaguniang)

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云


田英利、柯啟發(fā)、肖京

前文說(shuō)過(guò),人臉是金出武雄博士期間的研究課題,二十年后,一幫學(xué)生的到來(lái)將其進(jìn)一步發(fā)展到“面部表情分析技術(shù)”的高度。

不像以前的識(shí)別系統(tǒng),充其量只注意到“快樂(lè)”或“憤怒”等廣泛類(lèi)別。金出武雄和團(tuán)隊(duì)希望運(yùn)用心理學(xué)和機(jī)器學(xué)習(xí)的方法,做三維的人臉跟蹤,以及人類(lèi)的微小表情變化的識(shí)別和分析。一旦成功,這種技術(shù)就能廣泛應(yīng)用于安全、司法、醫(yī)療和人機(jī)交互等領(lǐng)域。

經(jīng)過(guò)一年的摸索,2000年,他們的研究迎來(lái)突破。這其中,Jeffrey Cohn教授起到了關(guān)鍵作用。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云


Jeffrey Cohn

Jeffrey Cohn是隔壁匹茲堡大學(xué)的心理學(xué)系教授,擅長(zhǎng)微表情計(jì)算。他與金出武雄的認(rèn)識(shí)卻頗為有趣,據(jù)田英利所說(shuō),“巧就巧在Jeffrey Cohn的兒子和金出武雄的兒子是同學(xué),一次約在一起做作業(yè),Jeffrey Cohn發(fā)現(xiàn)金出武雄兒子用的那張草稿紙的背面,就是他爸爸做的人臉識(shí)別的演算,便直接約了金出武雄見(jiàn)面?!?/p>

因此,自九十年代以來(lái)他就與金出武雄保持著密切的跨學(xué)科合作,神奇地推動(dòng)了情感計(jì)算領(lǐng)域的發(fā)展。

后來(lái),這一團(tuán)隊(duì)除了在當(dāng)時(shí)建立了第一套全自動(dòng)的人的微表情識(shí)別系統(tǒng),田英利還為此建立了微表情公開(kāi)數(shù)據(jù)庫(kù),肖京將這種技術(shù)從二維擴(kuò)展到了三維,使得人臉表情識(shí)別技術(shù)的應(yīng)用范圍更加廣泛。

不久后,MIT的一位女教授關(guān)注到了田英利的工作,還邀請(qǐng)過(guò)她到MIT一起合作。雖然沒(méi)有成行,但值得一提的是,這位女教授就是冠有“情感計(jì)算”之母的Rosalind Picard(她在1997年提出了“情感計(jì)算”的概念)。

這充分說(shuō)明了她的研究成果得到了國(guó)際一流學(xué)術(shù)機(jī)構(gòu)的認(rèn)可和關(guān)注,并推動(dòng)了情感計(jì)算領(lǐng)域在2000年后迎來(lái)一波發(fā)展浪潮。

當(dāng)時(shí)除了金出武雄團(tuán)隊(duì)之外,加州大學(xué)的The Salk Institute for Biological Studies(索爾克生物研究所)Terry Sejnowski教授的團(tuán)隊(duì)勢(shì)頭甚猛,他們主要研究人機(jī)交互,尤其側(cè)重表情識(shí)別。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云


Rosalind Picard

Terry Sejnowski(神經(jīng)網(wǎng)絡(luò)的先驅(qū),早在1986年,與Geoffrey Hinton共同發(fā)明了玻爾茲曼機(jī))

因此,美國(guó)中央情報(bào)局組織了一個(gè)比賽,邀請(qǐng)了卡內(nèi)基梅隆大學(xué)和加州大學(xué)兩個(gè)團(tuán)隊(duì)。這個(gè)比賽的主要目的是測(cè)試他們的系統(tǒng)在測(cè)謊方面的效果,還請(qǐng)來(lái)了Pietro Perona做第三方評(píng)判。

盡管只有兩個(gè)團(tuán)隊(duì),但是比賽參與者來(lái)自多個(gè)國(guó)家和地區(qū):田英利來(lái)自中國(guó)、金出武雄來(lái)自日本、Jeffrey Cohn來(lái)自美國(guó)、Pietro Perona來(lái)自波蘭,對(duì)方團(tuán)隊(duì)也來(lái)自多個(gè)國(guó)家,因此大家統(tǒng)稱(chēng)為“聯(lián)合國(guó)戰(zhàn)隊(duì)”。

田英利分享了一個(gè)細(xì)節(jié),那天比賽的返程路上,大家都坐電梯下樓,金出武雄大聲說(shuō)笑,“英利,我最近老覺(jué)得有點(diǎn)累,怎么樣才能不累呢?”

為了保證工作連續(xù)性,通常是金出武雄的夫人中午來(lái)送飯,做出很漂亮的壽司,但很多時(shí)候,到了下午五六點(diǎn)他才想起吃飯,既不是午飯也不是晚飯,一邊吃一邊干活。

“我不知道,要是能找到讓你這么工作還不累的妙方,也告訴我一下?!碧镉⒗卮稹?/p>

那之后,當(dāng)金出武雄在講座上發(fā)言時(shí),經(jīng)常有人問(wèn)他,“你所做的一切都成功了”,或者,“你曾經(jīng)失敗過(guò)嗎?” 

金出武雄笑答,“我想如果我告訴你我失敗的時(shí)候,每個(gè)人都會(huì)更快樂(lè),但我相當(dāng)刻薄,所以我回答說(shuō),我的信念是一直做到成功,所以我的字典說(shuō)失敗在邏輯上是不可能的。 ”

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

金出武雄在辦公室,攝于2000年前后

2001年9月11日,一場(chǎng)有目的的自殺式撞機(jī)事件在美國(guó)發(fā)生,其中第四架被劫持的飛機(jī)墜落在匹茲堡。當(dāng)天,機(jī)器人研究所的電話響了,是美國(guó)聯(lián)邦調(diào)查局(FBI)打來(lái)的。

“我們想得到墜落現(xiàn)場(chǎng)詳細(xì)情況的地圖?!?/p>

他們是想要金出武雄團(tuán)隊(duì)使用勘查地形的自動(dòng)操縱迷你直升飛機(jī),到墜落現(xiàn)場(chǎng)的上空將散落各處的飛機(jī)殘骸的狀態(tài)用攝像機(jī)拍攝下來(lái)。幾天后,金出武雄他們將迷你直升飛機(jī)升到墜落現(xiàn)場(chǎng)上空,將激光傳感器拍攝的三維圖像經(jīng)過(guò)計(jì)算機(jī)處理,制成可以對(duì)現(xiàn)場(chǎng)情況一目了然的三維地圖,提交給了FBI。

“這真是非常典型的美國(guó)政府行為。當(dāng)國(guó)家遇到緊急情況時(shí),大學(xué)提供全面的協(xié)助。他們非?,F(xiàn)實(shí),只要有幫助的無(wú)論什么都要用上?!苯鸪鑫湫墼u(píng)價(jià)。

他和一眾的學(xué)生表示,911事件是他們研究生涯的一個(gè)重要節(jié)點(diǎn):要更加關(guān)注當(dāng)下的社會(huì)生活。

2001年,田英利加入IBM研究中心計(jì)算機(jī)視覺(jué)研究組,迅速將研究重心轉(zhuǎn)向了視覺(jué)監(jiān)控,研究如何自動(dòng)檢測(cè)不安全和不規(guī)則的行為并發(fā)出警報(bào),與語(yǔ)音語(yǔ)義背景的高雨青也多有接觸。如今在紐約市立大學(xué)生則和醫(yī)療走得緊密,最近正在建立一個(gè)手語(yǔ)視覺(jué)識(shí)別的系統(tǒng),幫助那些想要學(xué)習(xí)手語(yǔ)的人自動(dòng)判斷自己的手語(yǔ)準(zhǔn)確度,并在出錯(cuò)時(shí)給予提醒。

2004年,韓玫、滑蔚、徐偉、劉昕四人聯(lián)手打造的核心技術(shù)為基礎(chǔ)的初創(chuàng)公司Vidient,該公司的智能視頻監(jiān)控系統(tǒng)最先部署在美國(guó)舊金山國(guó)際機(jī)場(chǎng),每天預(yù)警上百件對(duì)潛在危機(jī)事件。自從2018年被師弟肖京招入平安硅谷研究院后,主打攻堅(jiān)業(yè)務(wù)驅(qū)動(dòng)的先進(jìn)AI技術(shù)研發(fā)。

至于金出武雄,他則更為決斷。

2001年,他辭去了機(jī)器人研究所所長(zhǎng)的職務(wù)。那一年他56歲。

同年,他在日本東京成立了“數(shù)字人類(lèi)研究中心”,擔(dān)任了首任主任。該中心觀察,測(cè)量和模擬人類(lèi)功能,以努力理解許多系統(tǒng)中這個(gè)最重要,但最不被理解的組成部分。2006年,他又在CMU成立“生活質(zhì)量技術(shù)工程研究中心”,同樣是擔(dān)任首任主任。該中心由美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)資助,旨在開(kāi)發(fā)智能系統(tǒng)以幫助老年人和殘疾人。

眾所周知NSF經(jīng)費(fèi)非常難拿,習(xí)慣于資助小型項(xiàng)目,但金出武雄從那拿了上千萬(wàn)美元,拉了56個(gè)學(xué)校一起做,是美國(guó)歷史經(jīng)費(fèi)最高,單位最多的項(xiàng)目之一。

在美國(guó),很多重要大學(xué)的所長(zhǎng)和主任等職務(wù)并不是輪流擔(dān)任的閑職。他們既是負(fù)責(zé)組織運(yùn)轉(zhuǎn)的經(jīng)營(yíng)者,也是老板、領(lǐng)導(dǎo)者。他們既需要制定戰(zhàn)略又負(fù)責(zé)指揮,所以這樣的人一定是精力充沛的。

金出武雄做了一個(gè)形容:就好比美國(guó)西部劇中的警長(zhǎng)都比助手強(qiáng)很多,拔槍他最快,絕不是走到現(xiàn)場(chǎng)大喊一聲“上啊”,身手卻已經(jīng)不如部下了,還要站在前面裝腔作勢(shì),既幫不上忙,部下們也會(huì)看輕他。

“要想不被別人當(dāng)成擺設(shè)的木偶,無(wú)論到了什么地位都要履行好自己的職責(zé)?!?/p>

鐘華、李巖、康洪文、蘇航

有人問(wèn):“金出武雄的中文名字有什么含義嗎?”

金出武雄回答說(shuō):“每個(gè)漢字倒是有自己的意思的,大概說(shuō)來(lái),‘金’是money(錢(qián))或是gold(黃金)的意思,‘出’是give out(提供)的意思,‘武’是soldiery(士兵)的意思,‘雄’是brave(勇敢),man(男人)的意思。 ”

“啊,連起來(lái)就是招財(cái)?shù)挠赂椅涫?!那拿研究資金一定很容易了。”

確實(shí)如此,在拿經(jīng)費(fèi)這件事上,金出武雄還是頗有心得的,幾乎所有人讀完他的研究計(jì)劃書(shū)都要說(shuō),“給這項(xiàng)研究經(jīng)費(fèi)提供支持,而且經(jīng)費(fèi)給他?!?/p>

遙想在1979年10月CMU機(jī)器人研究所成立時(shí),要達(dá)到研究的臨界質(zhì)量,計(jì)劃書(shū)上寫(xiě)的是需要“5~10名教師”和“每年200萬(wàn)~500萬(wàn)美元的資金”。但是在金出武雄10年任期中,研究員數(shù)量到了200人,研究所每年的研究費(fèi)預(yù)算大約是6500萬(wàn)美元。

最主要是美國(guó)國(guó)防部(DOD)的資助,此外還有美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA),美國(guó)太空總署(NASA),美國(guó)國(guó)立衛(wèi)生研究院(NIH),美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)等等。

因此,金出武雄給學(xué)生定了一條不成文規(guī)定:只允許做一個(gè)實(shí)習(xí)生。

等鐘華、李巖、康洪文、蘇航來(lái)到CMU,都是在911風(fēng)波之后。DARPA痛定思痛,拿著一堆錢(qián)到各個(gè)學(xué)校找人去做各種各樣的研究。尤其是鐘華,“我剛?cè)](méi)幾天就趕上了,本來(lái)想學(xué)習(xí)圖形學(xué),招我的導(dǎo)師Paul Heckbert幾個(gè)月前去了英偉達(dá)做首席科學(xué)家,我就成了‘沒(méi)人要’的狀態(tài)。”

趕巧,史建波剛從UC Berkeley畢業(yè)后來(lái)到CMU任教,非常年輕,從美國(guó)國(guó)防部拿到了一個(gè)叫做“Human ID”的項(xiàng)目。這個(gè)項(xiàng)目特別神奇,是從人的走路姿勢(shì)來(lái)判斷身份,意思是這個(gè)人可能改頭換面了,但是他走路姿勢(shì)這些特征還存在,可用來(lái)鎖定出恐怖分子。

與此同時(shí),等到Human ID項(xiàng)目快做完了,眼下又要去碰碰新的項(xiàng)目。

實(shí)際上,在鐘華入學(xué)之前,沈向洋就早已為他寫(xiě)好推薦信。雖然鐘華是沈向洋在微軟的第二個(gè)實(shí)習(xí)生,卻是最早跟著他發(fā)展微軟亞研的人,前十五號(hào)員工。當(dāng)時(shí)沈向洋在微軟亞研專(zhuān)門(mén)創(chuàng)立了一個(gè)“assistant researcher”的title給本科生,鐘華是第一個(gè)。那么自然,在推薦信中沈向洋對(duì)他不吝贊賞。

金出武雄找到鐘華,給了兩個(gè)項(xiàng)目選擇,“一個(gè)是無(wú)人機(jī)在樓里飛,另一個(gè)是在心臟里導(dǎo)航?!?/p>

鐘華開(kāi)玩笑吐槽,但這兩個(gè)項(xiàng)目的難度都非常大?!?002年那會(huì)無(wú)人機(jī)還非常不普及,給你一無(wú)人機(jī)不是在外面空曠地飛,要在樓里飛?穿過(guò)樓道進(jìn)屋?我一聽(tīng)臥槽這太難了,這不是一個(gè)人干的事,就選了另一個(gè)?!?/p>

那時(shí)金出武雄和匹茲堡大學(xué)附屬醫(yī)院(UPMC)的醫(yī)生合作非常多,一個(gè)醫(yī)生(名字是David Schwartzman)找過(guò)來(lái),希望做不開(kāi)胸的心臟微創(chuàng)手術(shù),還得往里面塞支架,迫切需要一種心臟導(dǎo)航的系統(tǒng)。

說(shuō)難也難,說(shuō)易也易,導(dǎo)航定位早在八十年代就被金出武雄應(yīng)用在戶(hù)外機(jī)器人上,做了活火山口勘測(cè)、極地研究、深海作業(yè)。但心臟導(dǎo)航需要了解大量的生物學(xué)知識(shí),包括心臟的解剖結(jié)構(gòu),生理、病理改變,超聲影像等,以及心臟超聲與別的超聲的不同之處在于它還得了解血液動(dòng)力學(xué)的知識(shí)。

但他們幾個(gè)人對(duì)此的熱情不減反增。鐘華說(shuō)到,“我記得我畢業(yè)論文答辯那幾天,金出武雄的母親去世,他回日本去處理喪事。時(shí)差原因,他白天處理日本的事,晚上處理美國(guó)的事,我答辯那天問(wèn)要不要推遲,他說(shuō)不要推遲,我線上參加。那時(shí)候他已經(jīng)72小時(shí)沒(méi)睡了,但精神看上去還是很好。”

最終那套心臟超聲波導(dǎo)航系統(tǒng)在2007年推出,花費(fèi)了五年時(shí)間,包含手術(shù)導(dǎo)管的實(shí)時(shí)3D位置和心臟圖像。當(dāng)時(shí)市面上最好的系統(tǒng)精度還在厘米級(jí),他們已經(jīng)提升到毫米級(jí)。后來(lái)那位醫(yī)生拉著鐘華成立了一個(gè)公司,兩年后將IP賣(mài)給一家醫(yī)療器械公司,小賺了一筆。

后來(lái)的經(jīng)歷中,鐘華曾加入西門(mén)子、谷歌、曾再次創(chuàng)業(yè),也曾因幾位創(chuàng)始人意見(jiàn)不一致無(wú)奈離職,郁悶地“一個(gè)猛子扎進(jìn)太平洋里”。不過(guò)他這個(gè)人最厲害的地方就是不發(fā)怨言:“臥槽!人進(jìn)海了,手機(jī)還在兜里,正好誰(shuí)都別找我了?!?/p>

一周后鐘華重振旗鼓,老同學(xué)李巖的電話打來(lái),“要不要來(lái)神州優(yōu)車(chē)?”

那時(shí)候李巖已經(jīng)從CMU畢業(yè),先去了微軟、Facebook,2015年底被同學(xué)劉亞霄(現(xiàn)亞馬遜AWS中國(guó)區(qū)CTO)找到,說(shuō)神州優(yōu)車(chē)打算在硅谷成立實(shí)驗(yàn)室,缺個(gè)帶頭人,便推薦了李巖。

李巖提到,汽車(chē)是一個(gè)新的領(lǐng)域,也是一個(gè)能夠充分體現(xiàn)計(jì)算機(jī)視覺(jué)和人工智能的最佳平臺(tái)。無(wú)論是從手機(jī)、增強(qiáng)現(xiàn)實(shí)還是虛擬現(xiàn)實(shí),它們可能都不是真正集大成的產(chǎn)品。鐘華也沒(méi)猶豫。他和李巖知根知底,兩人都是清華計(jì)算機(jī)系,在微軟亞研時(shí)都是沈向洋的實(shí)習(xí)生,后面都拿到沈向洋的推薦信后踏進(jìn)CMU,前后腳都到了金出武雄門(mén)下。兩人一拍即合。

2016年,李巖、鐘華還有幾個(gè)跟過(guò)來(lái)的老搭檔,花了三四個(gè)月,把整個(gè)神州之前所有的那套轎車(chē)系統(tǒng)和派遣系統(tǒng)全改了,放到了云端(AWS)。這是當(dāng)時(shí)的一個(gè)痛點(diǎn),經(jīng)常掛,所有人租不到車(chē),老陸(陸正耀)經(jīng)常罵,“系統(tǒng)一掛一分鐘多少錢(qián)就沒(méi)了。”

那會(huì)百度也在硅谷也在做自動(dòng)駕駛,兩撥人經(jīng)常這么來(lái)往,后來(lái)不知道誰(shuí)起的頭,“要不咱們別這么吹了,一起干算了?!焙髞?lái)就創(chuàng)立了景馳科技。當(dāng)然自動(dòng)駕駛?cè)Φ臓?zhēng)議一直都不少,說(shuō)的最多的是誰(shuí)跳槽誰(shuí)空降誰(shuí)挖人,背后牽扯一纜子事情。直到2017年,事情終于告一段落,公司改名文遠(yuǎn)知行,李巖擔(dān)任CTO,鐘華擔(dān)任工程資深副總裁,韓旭擔(dān)任CEO、呂慶擔(dān)任CFO。故事回歸到最應(yīng)該討論的技術(shù)軌道上。

李巖第一時(shí)間與金出武雄聯(lián)系,并邀請(qǐng)他擔(dān)任顧問(wèn)。

2019年,距離金出武雄發(fā)布了世界上第一輛自動(dòng)駕駛車(chē)輛,已經(jīng)是第34個(gè)年頭。他來(lái)到了文遠(yuǎn)知行全球總部廣州,關(guān)心技術(shù),也關(guān)心商業(yè)化落地,還為融資做了很多幫助。

(后續(xù)本文作者吳彤將推出鐘華、李巖的個(gè)人故事,重點(diǎn)談及他們?cè)谖鏖T(mén)子研究院往事,涉及當(dāng)今醫(yī)學(xué)影像圈的大牛呂樂(lè)、鄭冶楓等人。歡迎添加微信交流:icedaguniang)

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

顧烈、鐘華、金出武雄、李巖、韓旭(2019年)

值得一提,在這張合照的左邊,也是金出武雄的一個(gè)學(xué)生,顧烈。以前是西安交大少年班的,早年和鐘華和李巖都在微軟亞洲研究院共事,做的是圖像和視頻檢索,人臉檢測(cè)和對(duì)齊,2002年幾人約莫著同一時(shí)間拜入金出武雄門(mén)下。畢業(yè)后顧烈去了華爾街做量化基金,那地正是全世界最聰明的量化投資者的聚集地--WorldQuant(世坤投資)。

哈工大金融智能量化投資研究中心的羅勇曾在知乎有一段細(xì)節(jié)描述--“世坤就是全球量化界的黃埔軍校,加上它背后的千禧基金(Millennium),培養(yǎng)出了一批頂級(jí)的Quant人才,其中就包括九坤投資的創(chuàng)始人王琛、合伙人姚聰,誠(chéng)奇資產(chǎn)創(chuàng)始人何文奇,均投資馬志宇,明汯投資創(chuàng)始人裘慧明等。2017年時(shí)世坤的北京分公司就已經(jīng)達(dá)到了月薪10萬(wàn)。”

不過(guò)關(guān)于顧烈的江湖傳聞很少,頗為神秘,但多年好友鐘華提到他時(shí)脫口而出,“他是個(gè)神童。2009年畢業(yè)后在世坤做到現(xiàn)在,是他職業(yè)欄中僅有的第二段工作?!保ū疚闹皇潜揭唤牵鄡?nèi)幕添加作者微信知曉,歡迎投資界同道交流)

那次到訪中國(guó),金出武雄還特意去了一趟杭州,看望了自己的另一個(gè)學(xué)生,康洪文。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

康洪文、金出武雄

康洪文算得上是金出武雄與Martial Hebert聯(lián)合培養(yǎng)的“關(guān)門(mén)弟子”,等到康洪文博士畢業(yè)后Martial晉升了CMU的院長(zhǎng)。

讀博期間的康洪文對(duì)人工智能的應(yīng)用落地萌生了念頭,2012年畢業(yè)后,他成立“慧川智能”(HUNCH.AI),第一筆投資來(lái)自導(dǎo)師金出武雄,緊接著又獲得沈向洋、童士豪、張磊等眾多大佬的投資。

不過(guò)相比“慧川智能”,大家可能更熟悉另一個(gè)名字——“智影”。

2017年,康洪文回國(guó)進(jìn)行業(yè)務(wù)拓展,并迅速鎖定了視頻及短視頻制作賽道。當(dāng)時(shí)中國(guó)市場(chǎng)正處于從圖文到視頻的轉(zhuǎn)變過(guò)程,內(nèi)容生產(chǎn)者逐步開(kāi)始轉(zhuǎn)向短視頻平臺(tái),在抖音、快手、西瓜等地方試水。

敏銳捕捉到當(dāng)時(shí)市場(chǎng)的增量需求,康洪文提出了一種算法,“文字生成視頻——Text to Video”,將一維文字?jǐn)?shù)據(jù)自動(dòng)生成三維視頻數(shù)據(jù)。用戶(hù)只需要輸入腳本文字,直接通過(guò)云端生成相應(yīng)的視頻內(nèi)容,自動(dòng)配音,并且能進(jìn)行在線進(jìn)行編輯和修改,同時(shí)預(yù)覽、渲染、視頻文件導(dǎo)出和下載等全部在平臺(tái)云端完成。

在過(guò)去幾年中,智影服務(wù)包括了湖南衛(wèi)視、芒果TV、浙江衛(wèi)視等省級(jí)上星頻道,這些第一批吃螃蟹的媒體,通過(guò)智影成為最早與AIGC商業(yè)化應(yīng)用接觸的頻道。他們借助智影的工具也完成了眾多在當(dāng)時(shí)看來(lái)不可能的任務(wù),包括央視2019國(guó)慶七十周年大閱兵短視頻自動(dòng)化生產(chǎn)、以及2020疫情期間湖南衛(wèi)視歌手云錄制。

2021年初,康洪文所創(chuàng)立的這家人工智能公司最終被騰訊全資收購(gòu),他本人出任“騰訊智影”的高級(jí)總監(jiān),負(fù)責(zé)推進(jìn)集團(tuán)的智能化內(nèi)容創(chuàng)作工作。

康洪文說(shuō),“早在2018年就與騰訊開(kāi)始接觸,通過(guò)兩年的雙方溝通和考察最終在2021年完成全現(xiàn)金收購(gòu)。騰訊給智影的定位是‘AI視頻中臺(tái)’,支持內(nèi)部各個(gè)業(yè)務(wù)線,如騰訊視頻、騰訊會(huì)議。等到2022年底AIGC概念鋪天蓋地火起來(lái)時(shí),騰訊突然意識(shí)到,原來(lái)買(mǎi)的是一個(gè)AIGC公司,累積突破千萬(wàn)級(jí)營(yíng)收?!?/p>

這次收購(gòu)對(duì)雙方是雙贏的。如果站在2023年看當(dāng)時(shí)的收購(gòu),可以說(shuō)騰訊在AIGC新紀(jì)元開(kāi)啟前,就撿了個(gè)大寶貝。兩年時(shí)間,AIGC技術(shù)和概念的發(fā)展帶來(lái)價(jià)值和估值的增長(zhǎng)可能在十倍以上,而康洪文通過(guò)智影的收購(gòu)幫助所有歷史投資人成功高收益退出。

與此同時(shí),在大模型技術(shù)的催化下,康洪文關(guān)于人工智能商業(yè)化落地的夢(mèng)想再次被點(diǎn)燃。2023年10月,康洪文作別騰訊,開(kāi)始了自己的新征程。新項(xiàng)目是大語(yǔ)言模型與多模態(tài)AIGC結(jié)合的新方向,目前已經(jīng)獲得多位投資人的投資,其中不乏慧川智能的歷史投資人。

如今再說(shuō)起跟隨金出武雄的日子,康洪文吐露:我對(duì)CMU的教育體系,尤其是金出武雄對(duì)自己的培養(yǎng),有一種發(fā)自?xún)?nèi)心的認(rèn)可和感謝。這不僅僅是說(shuō)當(dāng)初導(dǎo)師幫我張羅融資、引薦人脈,他也讓我明白,經(jīng)歷過(guò)PhD訓(xùn)練的人是最好的創(chuàng)業(yè)者。

“博士論文開(kāi)題就像是你的商業(yè)計(jì)劃書(shū):為什么這個(gè)問(wèn)題存在、為什么這個(gè)問(wèn)題值得解決、為什么是我能解決、我用什么方式去解決、解決這個(gè)問(wèn)題之后能夠給用戶(hù)和社會(huì)創(chuàng)造什么樣的價(jià)值。開(kāi)題后,進(jìn)入論文的正式研究,學(xué)生需要開(kāi)發(fā)新技術(shù),和創(chuàng)業(yè)時(shí)候的產(chǎn)品研發(fā)、技術(shù)創(chuàng)新和迭代一樣。另外學(xué)生需要學(xué)會(huì)團(tuán)隊(duì)合作,這就是創(chuàng)業(yè)時(shí)與合作伙伴、投資方的協(xié)作。最后如果幸運(yùn)通過(guò)論文答辯,就等同于市場(chǎng)愿意買(mǎi)單了?!?/p>

最近,康洪文作為主要捐贈(zèng)人牽頭成立了以“金出武雄”名字命名的講席教授,以資助未來(lái)在CMU任教的青年教授。兜兜轉(zhuǎn)轉(zhuǎn),老師成就了當(dāng)初的學(xué)生,學(xué)生又成就了如今的老師。

在康洪文之后,金出武雄的辦公室依舊走進(jìn)過(guò)非常多的華人學(xué)者,有目前紐約州立大學(xué)石溪分校的副教授尹兆正、清華計(jì)算機(jī)系的副研究員蘇航、微軟云與AI首席科學(xué)家陳梅、谷歌從事CV研究的潘吉彥,他們幾乎都趁那段時(shí)間打開(kāi)了學(xué)術(shù)聲譽(yù)。

蘇航感慨萬(wàn)千,能夠得到金出武雄的指導(dǎo)是一件非?!靶疫\(yùn)”的事情。因?yàn)樗粌H能夠一針見(jiàn)血地指出問(wèn)題所在,還能夠提供宏觀和微觀兩個(gè)方面的指導(dǎo)。

“我們寫(xiě)論文之前,他要求我們把要解決的問(wèn)題說(shuō)一下,跟他做一次presentation,寫(xiě)幾頁(yè)P(yáng)PT,包括這個(gè)工作的重點(diǎn)、難點(diǎn)、實(shí)驗(yàn)設(shè)計(jì),但他真正厲害的是,他不僅關(guān)注研究的大方向,他在指導(dǎo)時(shí)細(xì)致入微,我有一次寫(xiě)錯(cuò)了一個(gè)數(shù)學(xué)符號(hào)就被他發(fā)現(xiàn)了。”

僅用半年,蘇航的一篇論文作為特邀稿件發(fā)在MICCAI上。這是一個(gè)跨醫(yī)學(xué)影像計(jì)算(MIC)和計(jì)算機(jī)輔助介入(CAI) 兩個(gè)領(lǐng)域的綜合性學(xué)術(shù)會(huì)議,屬于頂級(jí)會(huì)議,蘇航也成為中國(guó)大陸的第二位獲獎(jiǎng)?wù)摺?/p>

(限于篇幅,康洪文、蘇航、陳梅的故事將在后續(xù)系列中詳述。歡迎添加作者微信搶鮮交流:icedaguniang)

故事未完待續(xù)

當(dāng)今天全球各地?zé)崃业赜懻摯竽P?、無(wú)人駕駛、AIGC、數(shù)字人、虛擬現(xiàn)實(shí)......憧憬著未來(lái)各種研究合作的時(shí)候,金出武雄在做什么?

2023年的11月初,卡內(nèi)基梅隆大學(xué)舉行了一次盛大的計(jì)算機(jī)視覺(jué)研討會(huì),回顧了最近50周年來(lái)的CV發(fā)展變革。到場(chǎng)的不僅有金出武雄和他的諸多學(xué)生們、他大半個(gè)人生中的重要合作者,過(guò)去他從世界各地挖來(lái)的精英學(xué)者、還有如今在計(jì)算機(jī)視覺(jué)前沿的各類(lèi)項(xiàng)目發(fā)起人。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

會(huì)議開(kāi)始,所有人都安靜下來(lái),金出武雄快步走上臺(tái)。臺(tái)下的人身體微微前傾,大家都知道,待會(huì)金出武雄第一句話一定不會(huì)鋪墊,而是直切正題。

他有一個(gè)很重要的策略,就是“先出手中最好的牌”,無(wú)論過(guò)去在大型國(guó)際會(huì)議上的演講,還是機(jī)器人研究所開(kāi)的研討發(fā)言,他都會(huì)從聽(tīng)眾最關(guān)心的結(jié)論開(kāi)始。

“第一張PPT竟然是金出武雄三十年前的一頁(yè)筆記?!?/p>

那是金出武雄從當(dāng)年筆記本上撕下來(lái)一頁(yè),一份他對(duì)于自動(dòng)駕駛的設(shè)計(jì),密密麻麻的一張紙,Martial當(dāng)年還開(kāi)玩笑,“我打賭30年之后自動(dòng)駕駛就做成了?!?/p>

不過(guò)30年后很快來(lái)了,Martia在臺(tái)下又補(bǔ)了一句,“現(xiàn)在看至少還得30年才行。”金出武雄笑著把話又拋回去,“都是因?yàn)槟銈冞@幫學(xué)生不聽(tīng)話,沒(méi)有百分百執(zhí)行老板的指示,所以自動(dòng)駕駛還要搞。”

這個(gè)場(chǎng)景很像CMU計(jì)算機(jī)專(zhuān)業(yè)研究生學(xué)院的一個(gè)傳統(tǒng)--“黑色星期五”,也就是教授們決定是否開(kāi)除學(xué)生的評(píng)鑒日。

所有的教師集中到一個(gè)教室,會(huì)議的召開(kāi)常常是大家侃侃而談,特別是涉及到否定結(jié)論的時(shí)候。因?yàn)檫@種否定和學(xué)生一生的命運(yùn)相關(guān),所以往往會(huì)陳述一個(gè)小時(shí),甚至有時(shí)候會(huì)更久。

但對(duì)于那些已經(jīng)畢業(yè)的老學(xué)生們就不一樣了,趁著重回學(xué)校的機(jī)會(huì),他們聚在一起互相談?wù)摦?dāng)年那封名為“黑色星期五”的郵件究竟是怎么寫(xiě)的。一般為“做了非常了不起的研究”“寫(xiě)了不少論文”“總是關(guān)心研究以外的事情,而研究沒(méi)有絲毫進(jìn)展”“最近,結(jié)婚了”,等等。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

2023年 CMU RI 開(kāi)展了CV研討會(huì),從左到右 田英利、鐘華、李巖、沈向洋、金出武雄、康洪文、韓玫

現(xiàn)在學(xué)生們反過(guò)來(lái)評(píng)價(jià)老師,給到的回答非常多,譬如:

“金出武雄的成就清單很長(zhǎng)、種類(lèi)繁多且獨(dú)一無(wú)二?!薄八怯?jì)算機(jī)視覺(jué)領(lǐng)域的第一批研究人員。他的研究方法不受限制,與如今業(yè)界主流的模仿人類(lèi)視覺(jué)特征的方法不同。”“你沒(méi)法給他貼個(gè)標(biāo)簽,究竟是深度學(xué)習(xí)的人、還是做工程的人。為了解決問(wèn)題,他不限定用任何算法,不限定用任何學(xué)科,”“他是出了名的‘爭(zhēng)強(qiáng)好勝’,熬一個(gè)通宵后第二天還會(huì)和學(xué)生們?cè)谇驁?chǎng)打車(chē)輪戰(zhàn)。”

不過(guò)一個(gè)最亮眼的評(píng)價(jià)是,相比于他做了什么,他沒(méi)做什么才更值得關(guān)注。

“從金出武雄自身來(lái)講,他沒(méi)有去做商人。我相信他也懂這個(gè)道理,因?yàn)樯虡I(yè)上的成功不一定是技術(shù)最牛。但他培養(yǎng)的學(xué)生都愿意去業(yè)界闖一闖,有需要他的地方,他還是會(huì)來(lái)?!?/p>

本文作者吳彤長(zhǎng)期關(guān)注人工智能、醫(yī)療領(lǐng)域,熱衷于系統(tǒng)完整地記錄故事。歡迎同道微信交流,icedagunian

雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

金出武雄和他的中國(guó)學(xué)生們,計(jì)算機(jī)視覺(jué)五十載風(fēng)云

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)