0
本文作者: 新智駕 | 2017-12-14 16:30 | 專題:GAIR硅谷智能駕駛峰會 |
*“Professor X”、AutoX創(chuàng)始人肖健雄
2016年春天,被同學(xué)和同事親切地稱為“Professor X”的肖健雄結(jié)束了其為人艷羨的普林斯頓大學(xué)教授生涯,也離開了其一手創(chuàng)辦的“計算機(jī)視覺與機(jī)器人實驗室”(Computer Vision and Robotics Labs)。
同年秋天,肖健雄舉家橫穿美國,從新澤西搬到硅谷。在這里,肖健雄開啟了創(chuàng)業(yè)之路——他創(chuàng)辦了一家名為 AutoX 的科技公司,為自動駕駛汽車提供軟件(包括感知、決策和控制)解決方案。
目前 AutoX 已獲美國加州交管局認(rèn)可,被允許在該州進(jìn)行自動駕駛路測。同臺競技的還有特斯拉、Waymo、Uber 以及汽車汽車廠商、Tier 1以及其他科技公司。
身處群狼環(huán)飼的境況,肖健雄并不擔(dān)心。在接受采訪時,他表示,AutoX 團(tuán)隊在計算機(jī)視覺方面的專業(yè)知識是那些大公司無法比擬的。正是憑借著這些專業(yè)研究,這家公司在成立六個月后,迅速開發(fā)出了自動駕駛原型車,在花費(fèi)較少成本的情況下,效果據(jù)稱并不亞于那些資本實力雄厚的競爭對手們。
肖健雄是 MIT 人工智能實驗室的博士。創(chuàng)立AutoX前,他是學(xué)術(shù)圈里的明星人物,周圍的朋友和同事喜歡稱他為 Professor X(「X 教授」)。
在學(xué)生時代,肖健雄曾先后獲得包括 ECCV(歐洲計算機(jī)視覺會議)、Google Research 在內(nèi)的最佳論文獎等。2013 年從 MIT 畢業(yè)后,他在普林斯頓大學(xué)計算機(jī)系擔(dān)任助理教授,后創(chuàng)辦了普林斯頓大學(xué)計算機(jī)視覺和機(jī)器人實驗室(Computer Vision and Robotics Lab)。
在他的個人網(wǎng)站上,肖健雄是這樣介紹自己的:在計算機(jī)視覺,自動駕駛和機(jī)器人技術(shù)方面有十多年的研究和工程經(jīng)驗,也是 3D 深度學(xué)習(xí)、RGB-D 識別和地圖、大數(shù)據(jù)、機(jī)器人深度學(xué)習(xí)等領(lǐng)域的先鋒。
有了這樣的背景,又是華人創(chuàng)業(yè)者,這讓他很快成為駐扎在硅谷的中國資本追捧的對象。比如種子輪資金,投資者為硅谷最大的華人背景創(chuàng)投基金之一丹華資本(DHVC)。最新的消息是,國內(nèi)自主品牌上汽也參與了 AutoX 的新一輪融資。
值得一提的是,2018 年 1 月 16 日,在雷鋒網(wǎng)在硅谷舉辦的GAIR硅谷智能駕駛峰會上,肖健雄教授將出席本次大會并參與圓桌討論,到時我們可以聽聽這位技術(shù)大牛又會帶來哪些新的思考。關(guān)于GAIR硅谷智能駕駛峰會更多詳情,請訪問我們的官網(wǎng) https://gair.leiphone.com/gair/gairsv2018。
「為什么是(選擇)自動駕駛?」今年 5 月,在 TiEcon 2017 上,肖健雄在演講上回答了這一問題。
他說,自動駕駛是一個「讓人興奮的領(lǐng)域」。回顧過去幾十年在科技領(lǐng)域發(fā)生的變革,從個人電腦、互聯(lián)網(wǎng)再到智能手機(jī),幾乎改變了每個人的生活。而未來三十年能改變每個人生活的將會是自動駕駛汽車。
更讓他「超級興奮」的是,自動駕駛是他所擅長領(lǐng)域(計算機(jī)視覺和機(jī)器人)的大規(guī)模應(yīng)用。
在自動駕駛的生態(tài)系統(tǒng)中,參與者有汽車廠商、Tier1、芯片公司、出行服務(wù)公司等等,肖健雄指出,要將自動駕駛生態(tài)打通,需要一個非常好的 AI 軟件平臺——這是 AutoX 可以施展拳腳的地方。
在自動駕駛的世界里,特斯拉是為數(shù)不多使用基于攝像頭的方法來實現(xiàn)全自動駕駛的公司。在特斯拉第二代 AutoPilot 硬件上,特斯拉希望通過 8 個攝像、前向雷達(dá)、超聲波雷達(dá)和 GPS 數(shù)據(jù)來實現(xiàn)全自動駕駛。沒有激光雷達(dá),這是特斯拉與主流自動駕駛公司最大的區(qū)別。
但 AutoX 選擇了一條比特斯拉更激進(jìn)的方式。今年 3 月,AutoX 拿到加州 DMV 頒發(fā)的自動駕駛路試牌照,隨后這家公司對外公布了一段在不同天氣下的自動駕駛路測視頻。
值得注意的是,這輛改造自林肯 MKZ 的原型車并沒有搭載諸如激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)、差分 GPS 等傳感器,取而代之的是總成本不到 500 美金的 7 個攝像頭——這相當(dāng)于一臺智能手機(jī)的價格。
肖健雄想要解決的問題,正擊中自動駕駛領(lǐng)域痛點(diǎn)——造價高昂的傳感器無法快速將科研成果商業(yè)化。其中一個例子是,在谷歌分拆出來的自動駕駛公司 Waymo 長達(dá) 10 年的研究中,最大的一個進(jìn)展是將傳感器價格降低由原來的 75000 美元降低到 7500 美元。
在 TiEcon 2017 上,肖健雄說:「AutoX 的使命是使自動駕駛技術(shù)平民化,自動駕駛并不是奢侈的,而是人人都能享受到的技術(shù)?!?/p>
攝像頭的好處是,即使是非常低端的攝像頭,依然有較高的分辨率。攝像頭對物體的識別包括交通燈的識別非常清晰。當(dāng)然,這一方案的最大優(yōu)勢是硬件成本非常低并且易于集成。
但問題是,目前僅僅依靠純視覺方案可靠嗎?肖健雄答:「Make AI stronger,make software better.」(讓 AI 更強(qiáng),讓軟件更好。)
聽完他在 TiEcon 的演講后,臺下一位觀眾評價:AutoX Jianxiong Xiao has more faith in camera-based rather than sensor-based autonomous driving.(肖健雄對基于攝像頭而不是基于傳感器的自動駕駛更有信心。)
作為新創(chuàng)公司,AutoX 目前的收集的數(shù)據(jù)還不夠多,不足以讓其系統(tǒng)做出更好的決策。未來,AutoX 希望打造一個自動駕駛車隊來收集更多數(shù)據(jù)并不斷完善這一解決方案。
今年 7 月,在 CVPR(國際計算機(jī)視覺與模式識別會議)的現(xiàn)場,雷鋒網(wǎng)與肖健雄博士聊了聊 AutoX 的動向以及他關(guān)于自動駕駛的思考。以下是對話實錄(有刪減):
雷鋒網(wǎng):AutoX 的方案是舍棄激光雷達(dá)、差分 GPS ,使用汽車前端的 7 個攝像頭,這樣成本也很低。但從安全性的角度說,你們是如何考慮的?如果只用攝像頭可以做到什么樣水準(zhǔn)的自動駕駛?遇到惡劣天氣、逆光等極端情況,如何應(yīng)對?
肖健雄:我們從來沒有說要放棄安全性,但很多人就把安全性當(dāng)成一個不努力做視覺的借口。
安全性并不是說物理世界信息不足,而在于軟件要足夠好。我覺得在理論上絕對可以靠 Camera 做到非常安全。只要有所投入,在這個領(lǐng)域花更多精力,跑出來的效果并不會差。
惡劣天氣和逆光主要靠提高算法的魯棒性,提高數(shù)據(jù)級,當(dāng)然相機(jī)也不能太差?;谶@個前提,其他就是拼軟件了。
雷鋒網(wǎng):你是否覺得視覺可以解決自動駕駛一切問題?
肖健雄:我覺得長遠(yuǎn)來說,肯定可以解決自動駕駛一切問題,問題是這個時間我們是否有耐心等待,比如說花 10 年、20 年實現(xiàn)完全無人駕駛。
我們從來不排斥其他傳感器,也不排斥其他技術(shù),只是說專攻在相機(jī)上。我們的論點(diǎn)是:大家太小看相機(jī)了,導(dǎo)致沒有努力把它的功能提高。它還有很多油水可「榨」,只是大家沒有努力「榨」而已。
雷鋒網(wǎng):你之前演講說要打造「自動駕駛大腦」,這個「大腦」是怎樣的?
肖健雄:自動駕駛大腦有點(diǎn)像操作系統(tǒng),往大說,比如 Windows;往小說,比如 Linux Kernel 的核心代碼。
我們現(xiàn)在做的是最核心的 kernel,包括感知和決策兩個模塊。我們把 kernel 搭建好,然后在這個基礎(chǔ)上加上其他傳感器、其他服務(wù)層。
雷鋒網(wǎng):現(xiàn)在很多公司目標(biāo)是做 Level 4 級別的自動駕駛技術(shù),目標(biāo)是非常遠(yuǎn)大的,但離落地產(chǎn)業(yè)化很遠(yuǎn),你如何看待這一級自動駕駛的商業(yè)化問題?
肖健雄:我覺得大公司像谷歌可以這樣玩,因為它有足夠多的錢,但絕大部分的創(chuàng)業(yè)公司不行。初創(chuàng)公司每一到兩年需要融資,然后沒賺到一分錢,我覺得這是不健康的方式。
我一開始為什么選擇 Camera ,因為激光雷達(dá)在將來 10 年后才可能很便宜,但兩到三年后可以便宜嗎?絕對便宜不了,沒那么快的。
雷鋒網(wǎng):你覺得在無人駕駛這個領(lǐng)域,創(chuàng)業(yè)者或后來者還能從中找到哪些機(jī)會?
肖健雄:我覺得要做得有特色,比如集中在 niche market(小眾市場)。沒有特色、大而全,就做 Level 5,十幾年后才賺到錢,我覺得基本沒有機(jī)會,也沒有辦法生存。
這與普通初創(chuàng)公司并不一樣,比如滴滴或 Uber,做一個 App、搭建一個服務(wù)器就可以開始了,然后大家集中火力干 6 個月,短期內(nèi)就能占領(lǐng)市場,取得很好的成績。
但自動駕駛不是這樣的,即使我們集中火力干 6 個月,還是不能實現(xiàn)全自動駕駛。這不是錢可以解決的問題,而是需要更多技術(shù)積累。
所以我更看好漸進(jìn)式的路徑,先輔助駕駛,然后再升級,我覺得這是有道理的。絕大部分汽車廠也是這樣,他們不會馬上就實現(xiàn)自動駕駛,消費(fèi)者就能買上這樣一輛汽車。
雷鋒網(wǎng):在自動駕駛領(lǐng)域,從 2009 年到 2017 年,你印象最深刻是什么?
肖健雄:我覺得印象最深刻的就是大家觀念上的變化,以前自動駕駛覺得不可能實現(xiàn),覺得不 work,只是純科學(xué)研究。大家對這一領(lǐng)域過于悲觀。
現(xiàn)在很多人覺得自動駕駛可能實現(xiàn)了,又過于樂觀。很多人包括像 Elon Musk、黃仁勛都覺得無人駕駛問題已經(jīng)解決,我覺得他們想得太簡單。
無論是過于悲觀還是過于樂觀,這兩種方式都不正確。最好是理性看待:你要看到它確實很有前途,但又是一種漸進(jìn)式的進(jìn)化。
雷鋒網(wǎng):AutoX 期待與什么樣的公司合作?
肖健雄:我們對整個交通和移動出行都非常感興趣,合作伙伴主要有四種:
第一是汽車廠商。這是我們最想合作的伙伴,主流的主機(jī)廠可以讓我們的產(chǎn)品進(jìn)入主流車型。一開始可能不是完全無人駕駛,而是輔助駕駛,可以是 L2、L2.5、L3,不同 Level(級別)的輔助駕駛。這是我們與其他自動駕駛公司的區(qū)別,我們更喜歡漸進(jìn)式的模式——一軟件逐步升級、數(shù)據(jù)逐漸積累。
第二是與主機(jī)廠相關(guān)的 Tier1,通過與他們合作,我們聯(lián)合開發(fā)將軟件、硬件,然后銷售給主機(jī)廠,將它裝進(jìn)主流車型。
第三是 Uber、滴滴這樣的出行公司。但這種模式的問題在于:要真正達(dá)到無人駕駛才能開始商業(yè)化。這個門檻會更高、周期會更長,可能要很多年后才會普及。
第四是物流公司,包括快遞、卡車等等,無人駕駛?cè)绻禽d人,可能要求更高,載貨要求則會低一些。
雷鋒網(wǎng):談一談你參加 CVPR 的感觸。
肖健雄:現(xiàn)在這個領(lǐng)域真的引起了大家的關(guān)注。以前始我從事 CV 研究的時候,這算是一個冷門行業(yè),根本沒什么人關(guān)注,當(dāng)時會議規(guī)模也很小?,F(xiàn)在都四五千人,太夸張了。
CVPR 受到這么大關(guān)注對我們這個領(lǐng)域的好處是,可以吸引到社會最杰出的人才進(jìn)來,這對整個領(lǐng)域快速發(fā)展非常重要。
*在CVPR的Workshop上,從左至右:Fisher Yu、彭軍、肖健雄、倪凱、吳甘沙、侯曉迪 圖片來自馭勢CMO雨嘉
雷鋒網(wǎng):今年 CVPR 很多自動駕駛相關(guān)的中國公司,比如滴滴、圖森、地平線、Momenta、AutoX 都在積極參與,這些公司或多或少都做著與深度學(xué)習(xí)相關(guān)的事情。你覺得深度學(xué)習(xí)給自動駕駛帶來什么改變?
肖健雄:深度學(xué)習(xí)對自動駕駛、對 AI 領(lǐng)域的影響是巨大無比,不能小覷。
現(xiàn)在自動駕駛公司使用深度學(xué)習(xí),已經(jīng)成為常識。比如,我以前在普林斯頓教書,有兩個星期就是教深度學(xué)習(xí),學(xué)生們學(xué)完后都懂了,然后他們各自去做自己的項目。
我覺得深度學(xué)習(xí)已經(jīng)有一點(diǎn)像「你會不會使用電腦、使用 office。」所以在不久的將來我們不應(yīng)該號稱「我是基于深度學(xué)習(xí)的公司」,這就好象說「我們是一家基于使用電腦的 IT 公司」一樣。
深度學(xué)習(xí)進(jìn)展還是很快的,同時我覺得有一些進(jìn)展不一定真正可以實用。
比如 GAN(生成式對抗網(wǎng)絡(luò),Generative Adversarial Networks),我覺得這在非人命相關(guān)的領(lǐng)域是十分有用的,但在自動駕駛上我會持保留態(tài)度。因為外界沒區(qū)分清楚這到底是純學(xué)術(shù)研究還是可以真正使用的技術(shù)。
現(xiàn)在很多技術(shù)還不完美,可能只是一個非常初級的想法,還需要更多時間才會演變得更好。比如 CV(計算機(jī)視覺),也是 20、30 年前有了初步的 idea,進(jìn)化到現(xiàn)在才達(dá)到適用的水平。
PS:2018 年 1 月 16 日,雷鋒網(wǎng)在美國科技大本營硅谷舉辦 GAIR 硅谷智能駕駛峰會上,肖健雄教授將出席在現(xiàn)場帶來主題演講。此外,還有將有近百家自動駕駛產(chǎn)業(yè)鏈公司在現(xiàn)場交流。詳情請訪問 https://gair.leiphone.com/gair/gairsv2018。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章