0
「如何看待肖健雄離開普林斯頓大學(xué)去創(chuàng)業(yè)?」答案不言而喻,「學(xué)而優(yōu)則商」已是計算機視覺圈(或泛人工智能圈)習(xí)以為常的事情。
因此有人總結(jié)學(xué)術(shù)界大牛從商之路的三種選擇:一是教授被工業(yè)界挖走,帶領(lǐng)各個大公司的研究院;二是有著極強技術(shù)背景的學(xué)生在畢業(yè)后或經(jīng)過短暫的職業(yè)生涯后聯(lián)合幾個志同道合的同學(xué)(或朋友)共同創(chuàng)業(yè);三是教授從高校離職,創(chuàng)立自己的公司。
毫無疑問,肖健雄屬于第三條路徑。
肖健雄是 MIT 人工智能實驗室的博士。創(chuàng)業(yè)前,他是學(xué)術(shù)圈里的明星人物,周圍的朋友和同事喜歡稱他為 Professor X(「X 教授」)。
在學(xué)生時代,肖健雄曾先后獲得包括 ECCV(歐洲計算機視覺會議)、Google Research 在內(nèi)的最佳論文獎等。2013 年從 MIT 畢業(yè)后,他在普林斯頓大學(xué)計算機系擔(dān)任助理教授,后創(chuàng)辦了普林斯頓大學(xué)計算機視覺和機器人實驗室(Computer vision and robotics lab)。
在他的個人網(wǎng)站上,肖健雄是這樣介紹自己的:在計算機視覺,自動駕駛和機器人技術(shù)方面有十多年的研究和工程經(jīng)驗,也是 3D 深度學(xué)習(xí)、RGB-D 識別和地圖、大數(shù)據(jù)、機器人深度學(xué)習(xí)等領(lǐng)域的先鋒。
有了這樣的背景,又是華人創(chuàng)業(yè)者,這讓他很快成為駐扎在硅谷的中國資本追捧的對象。
去年 6 月,當(dāng)他離開普林斯頓大學(xué)決定要去創(chuàng)業(yè)時,外界便好奇:「X 教授」會創(chuàng)立一個什么樣的公司?「教授創(chuàng)業(yè)一定緊密扎根自己的學(xué)術(shù)成果。所以我想健雄老師公司的關(guān)鍵詞也多半和 Deep Learning(深度學(xué)習(xí))、Vision (尤其是 3D vision) 緊緊相關(guān)?!乖腥诉@樣猜測。
最終,肖健雄創(chuàng)辦的 AutoX 向外界揭曉謎題——這是一家為自動駕駛汽車提供軟件(包括感知、決策和控制)解決方案的科技公司。
憑借在學(xué)術(shù)界的名聲,肖健雄目前已為 Auto X 招來 20 余人,他們大部分來自美國頂尖高校:MIT、斯坦福大學(xué)、伯克利,并曾經(jīng)在微軟、Facebook、蘋果、Magicleap 以及本田有過工作經(jīng)驗。
「為什么是(選擇)自動駕駛?」今年 5 月,在 TiEcon 2017 上,肖健雄在演講上回答了這一問題。
他說,自動駕駛是一個「讓人興奮的領(lǐng)域」?;仡欉^去幾十年在科技領(lǐng)域發(fā)生的變革,從個人電腦、互聯(lián)網(wǎng)再到智能手機,幾乎改變了每個人的生活。而未來三十年能改變每個人生活的將會是自動駕駛汽車。
更讓他「超級興奮」的是,自動駕駛是他所擅長領(lǐng)域(計算機視覺和機器人)的大規(guī)模應(yīng)用。
在自動駕駛的生態(tài)系統(tǒng)中,參與者有汽車廠商、Tier1、芯片公司、出行服務(wù)公司等等,肖健雄指出,要將自動駕駛生態(tài)打通,需要一個非常好的 AI 軟件平臺——這是 AutoX 可以施展拳腳的地方。
在自動駕駛的世界里,特斯拉是為數(shù)不多使用基于攝像頭的方法來實現(xiàn)全自動駕駛的公司。在特斯拉第二代 AutoPilot 硬件上,特斯拉希望通過 8 個攝像、前向雷達、超聲波雷達和 GPS 數(shù)據(jù)來實現(xiàn)全自動駕駛。沒有激光雷達,這是特斯拉與主流自動駕駛公司最大的區(qū)別。
但 AutoX 選擇了一條比特斯拉更激進的方式。
今年 3 月,AutoX 拿到加州 DMV 頒發(fā)的自動駕駛路試牌照,隨后這家公司對外公布了一段在不同天氣下的自動駕駛路測視頻。
值得注意的是,這輛改造自林肯 MKZ 的原型車并沒有搭載諸如激光雷達、毫米波雷達、超聲波雷達、差分 GPS 等傳感器,取而代之的是總成本不到 500 美金的 7 個攝像頭——這相當(dāng)于一臺智能手機的價格。
肖健雄想要解決的問題,正擊中自動駕駛領(lǐng)域痛點——造價高昂的傳感器無法快速將科研成果商業(yè)化。其中一個例子是,在谷歌分拆出來的自動駕駛公司 Waymo 長達 10 年的研究中,最大的一個進展是將傳感器價格降低由原來的 75000 美元降低到 7500 美元。
在 TiEcon 2017 上,肖健雄說:「AutoX 的使命是使自動駕駛技術(shù)平民化,自動駕駛并不是奢侈的,而是人人都能享受到的技術(shù)?!?/p>
攝像頭的好處是,即使是非常低端的攝像頭,依然有較高的分辨率。攝像頭對物體的識別包括交通燈的識別非常清晰。當(dāng)然,這一方案的最大優(yōu)勢是硬件成本非常低并且易于集成。
但問題是,目前僅僅依靠純視覺方案可靠嗎?肖健雄答:「Make AI stronger,make software better.」(讓 AI 更強,讓軟件更好。)
聽完他在 TiEcon 的演講后,臺下一位觀眾評價:AutoX Jianxiong Xiao has more faith in camera-based rather than sensor-based autonomous driving.(肖健雄對基于攝像頭而不是基于傳感器的自動駕駛更有信心。)
作為新創(chuàng)公司,AutoX 目前的收集的數(shù)據(jù)還不夠多,不足以讓其系統(tǒng)做出更好的決策。未來,AutoX 希望打造一個自動駕駛車隊來收集更多數(shù)據(jù)并不斷完善這一解決方案。
今年 7 月,在 CVPR(國際計算機視覺與模式識別會議)的現(xiàn)場,雷鋒網(wǎng)與肖健雄博士聊了聊 AutoX 的新動向以及他關(guān)于自動駕駛的思考。以下是對話實錄(有刪減):
雷鋒網(wǎng):介紹 AutoX 的最近情況,比如團隊規(guī)模、最近計劃。
肖健雄:最近增長到大概 20 多個人,增長速度可能沒有其他公司那么快,我們喜歡把最好的人招進來。我們招人依舊是兩個標(biāo)準(zhǔn):又紅又專,就是專業(yè)技能非常強大,又特別注重 Teamwork。
目前有一些計劃但不方便透露。我們可以說的是會在 2 年內(nèi)將產(chǎn)品推向市場,讓用戶可以用到。
雷鋒網(wǎng):AutoX 的方案是舍棄激光雷達、差分 GPS ,使用汽車前端的 7 個攝像頭,這樣成本也很低。但從安全性的角度說,你們是如何考慮的?如果只用攝像頭可以做到什么樣水準(zhǔn)的自動駕駛?遇到惡劣天氣、逆光等極端情況,如何應(yīng)對?
肖健雄:我們從來沒有說要放棄安全性,但很多人就把安全性當(dāng)成一個不努力做視覺的借口。
安全性并不是說物理世界信息不足,而在于軟件要足夠好。我覺得在理論上絕對可以靠 Camera 做到非常安全。只要有所投入,在這個領(lǐng)域花更多精力,跑出來的效果并不會差。
惡劣天氣和逆光主要靠提高算法的魯棒性,提高數(shù)據(jù)級,當(dāng)然相機也不能太差?;谶@個前提,其他就是拼軟件了。
雷鋒網(wǎng):你是否覺得視覺可以解決自動駕駛一切問題?
肖健雄:我覺得長遠(yuǎn)來說,肯定可以解決自動駕駛一切問題,問題是這個時間我們是否有耐心等待,比如說花 10 年、20 年實現(xiàn)完全無人駕駛。
我們從來不排斥其他傳感器,也不排斥其他技術(shù),只是說專攻在相機上。我們的論點是:大家太小看相機了,導(dǎo)致沒有努力把它的功能提高。它還有很多油水可「榨」,只是大家沒有努力「榨」而已。
雷鋒網(wǎng):你之前演講說要打造「自動駕駛大腦」,這個「大腦」是怎樣的?
肖健雄:自動駕駛大腦有點像操作系統(tǒng),往大說,比如 Windows;往小說,比如 Linux Kernel 的核心代碼。
我們現(xiàn)在做的是最核心的 kernel,包括感知和決策兩個模塊。我們把 kernel 搭建好,然后在這個基礎(chǔ)上加上其他傳感器、其他服務(wù)層。
雷鋒網(wǎng):現(xiàn)在很多公司目標(biāo)是做 Level 4 級別的自動駕駛技術(shù),目標(biāo)是非常遠(yuǎn)大的,但離落地產(chǎn)業(yè)化很遠(yuǎn),你如何看待這一級自動駕駛的商業(yè)化問題?
肖健雄:我覺得大公司像谷歌可以這樣玩,因為它有足夠多的錢,但絕大部分的創(chuàng)業(yè)公司不行。初創(chuàng)公司每一到兩年需要融資,然后沒賺到一分錢,我覺得這是不健康的方式。
我一開始為什么選擇 Camera ,因為激光雷達在將來 10 年后才可能很便宜,但兩到三年后可以便宜嗎?絕對便宜不了,沒那么快的。
雷鋒網(wǎng):你覺得在無人駕駛這個領(lǐng)域,創(chuàng)業(yè)者或后來者還能從中找到哪些機會?
肖健雄:我覺得要做得有特色,比如集中在 niche market(小眾市場)。沒有特色、大而全,就做 Level 5,十幾年后才賺到錢,我覺得基本沒有機會,也沒有辦法生存。
這與普通初創(chuàng)公司并不一樣,比如滴滴或 Uber,做一個 App、搭建一個服務(wù)器就可以開始了,然后大家集中火力干 6 個月,短期內(nèi)就能占領(lǐng)市場,取得很好的成績。
但自動駕駛不是這樣的,即使我們集中火力干 6 個月,還是不能實現(xiàn)全自動駕駛。這不是錢可以解決的問題,而是需要更多技術(shù)積累。
所以我更看好漸進式的路徑,先輔助駕駛,然后再升級,我覺得這是有道理的。絕大部分汽車廠也是這樣,他們不會馬上就實現(xiàn)自動駕駛,消費者就能買上這樣一輛汽車。
雷鋒網(wǎng):在自動駕駛領(lǐng)域,從 2009 年到 2017 年,你印象最深刻是什么?
肖健雄:我覺得印象最深刻的就是大家觀念上的變化,以前自動駕駛覺得不可能實現(xiàn),覺得不 work,只是純科學(xué)研究。大家對這一領(lǐng)域過于悲觀。
現(xiàn)在很多人覺得自動駕駛可能實現(xiàn)了,又過于樂觀。很多人包括像 Elon Musk、黃仁勛都覺得無人駕駛問題已經(jīng)解決,我覺得他們想得太簡單。
無論是過于悲觀還是過于樂觀,這兩種方式都不正確。最好是理性看待:你要看到它確實很有前途,但又是一種漸進式的進化。
雷鋒網(wǎng):AutoX 期待與什么樣的公司合作?
肖健雄:我們對整個交通和移動出行都非常感興趣,合作伙伴主要有四種:
第一是汽車廠商。這是我們最想合作的伙伴,主流的主機廠可以讓我們的產(chǎn)品進入主流車型。一開始可能不是完全無人駕駛,而是輔助駕駛,可以是 L2、L2.5、L3,不同 Level(級別)的輔助駕駛。這是我們與其他自動駕駛公司的區(qū)別,我們更喜歡漸進式的模式——一軟件逐步升級、數(shù)據(jù)逐漸積累。
第二是與主機廠相關(guān)的 Tier1,通過與他們合作,我們聯(lián)合開發(fā)將軟件、硬件,然后銷售給主機廠,將它裝進主流車型。
第三是 Uber、滴滴這樣的出行公司。但這種模式的問題在于:要真正達到無人駕駛才能開始商業(yè)化。這個門檻會更高、周期會更長,可能要很多年后才會普及。
第四是物流公司,包括快遞、卡車等等,無人駕駛?cè)绻禽d人,可能要求更高,載貨要求則會低一些。
雷鋒網(wǎng):談一談你參加 CVPR 的感觸。
肖健雄:現(xiàn)在這個領(lǐng)域真的引起了大家的關(guān)注。以前始我從事 CV 研究的時候,這算是一個冷門行業(yè),根本沒什么人關(guān)注,當(dāng)時會議規(guī)模也很小。現(xiàn)在都四五千人,太夸張了。
CVPR 受到這么大關(guān)注對我們這個領(lǐng)域的好處是,可以吸引到社會最杰出的人才進來,這對整個領(lǐng)域快速發(fā)展非常重要。
*在CVPR的Workshop上,從左至右:Fisher Yu、彭軍、肖健雄、倪凱、吳甘沙、侯曉迪 圖片來自馭勢CMO雨嘉
雷鋒網(wǎng):今年 CVPR 很多自動駕駛相關(guān)的中國公司,比如滴滴、圖森、地平線、Momenta、AutoX 都在積極參與,這些公司或多或少都做著與深度學(xué)習(xí)相關(guān)的事情。你覺得深度學(xué)習(xí)給自動駕駛帶來什么改變?
肖健雄:深度學(xué)習(xí)對自動駕駛、對 AI 領(lǐng)域的影響是巨大無比,不能小覷。
現(xiàn)在自動駕駛公司使用深度學(xué)習(xí),已經(jīng)成為常識。比如,我以前在普林斯頓教書,有兩個星期就是教深度學(xué)習(xí),學(xué)生們學(xué)完后都懂了,然后他們各自去做自己的項目。
我覺得深度學(xué)習(xí)已經(jīng)有一點像「你會不會使用電腦、使用 office?!顾栽诓痪玫膶砦覀儾粦?yīng)該號稱「我是基于深度學(xué)習(xí)的公司」,這就好象說「我們是一家基于使用電腦的 IT 公司」一樣。
深度學(xué)習(xí)進展還是很快的,同時我覺得有一些進展不一定真正可以實用。
比如 GAN(生成式對抗網(wǎng)絡(luò),Generative Adversarial Networks),我覺得這在非人命相關(guān)的領(lǐng)域是十分有用的,但在自動駕駛上我會持保留態(tài)度。因為外界沒區(qū)分清楚這到底是純學(xué)術(shù)研究還是可以真正使用的技術(shù)。
現(xiàn)在很多技術(shù)還不完美,可能只是一個非常初級的想法,還需要更多時間才會演變得更好。比如 CV(計算機視覺),也是 20、30 年前有了初步的 idea,進化到現(xiàn)在才達到適用的水平。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。