0
本文作者: 伍文靚 | 2021-09-29 00:50 |
9 月 27 日,阿里宣布小蠻驢累計(jì)配送訂單超過(guò) 100 萬(wàn)單,并表示將啟動(dòng)自動(dòng)駕駛卡車(chē)研發(fā)。
長(zhǎng)久以來(lái),這家互聯(lián)網(wǎng)巨頭常以自動(dòng)駕駛「投資者」的身份示人,但關(guān)于阿里自身在自動(dòng)駕駛方面的踐行以及其背后的靈魂人物王剛,外界所知甚少。
王剛,阿里集團(tuán)副總裁、達(dá)摩院自動(dòng)駕駛實(shí)驗(yàn)室負(fù)責(zé)人,先后師從人工智能領(lǐng)域頂級(jí)學(xué)者 Li Fei-Fei(李飛飛)和 David Forsyth。2016 年獲新加坡南洋理工大學(xué)終身教職。
近日,雷鋒網(wǎng)與王剛展開(kāi)了一場(chǎng)對(duì)話,試圖描繪完整王剛以及阿里自動(dòng)駕駛鮮為人知的故事。
--
2017 年,王剛放棄新加坡南洋理工大學(xué)的終身教職,毅然決定從學(xué)術(shù)界邁入工業(yè)界。
阿里,是他的第一站,這一扎下去,就是五年。
他說(shuō),自己喜歡聚焦、認(rèn)準(zhǔn)了就磕到底,不會(huì)既要、又要還要。
相比起「科學(xué)家」陽(yáng)春白雪的人設(shè),王剛身上確實(shí)透露著一股「重慶娃」的闖勁兒。
進(jìn)入阿里后,王剛作為技術(shù)負(fù)責(zé)人,與阿里人工智能實(shí)驗(yàn)室(AI Lab)團(tuán)隊(duì)一起將天貓精靈從 Demo 打造成產(chǎn)品。4 個(gè)月時(shí)間就成了出貨百萬(wàn)規(guī)模的爆款。
而后,他又揮一揮衣袖,走了一條看似跨度極大、難度極高的路——從 0 到 1 做自動(dòng)駕駛。
也因如此,阿里的自動(dòng)駕駛故事正式按下了啟動(dòng)鍵。
故事,要從 15 年前說(shuō)起。
當(dāng)時(shí),王剛就讀于哈工大電子信息與工程學(xué)院。盡管他一直對(duì)圖像處理感興趣,但他從來(lái)也不會(huì)想到,自己與人工智能結(jié)緣的方式竟然源于對(duì)一篇論文的思考。
作為非科班出身的王剛,此前已對(duì)圖像處理做了不少研究,而他也比同級(jí)人更早開(kāi)始關(guān)注學(xué)術(shù)界論文。
大四的某一天,人工智能頂會(huì)CVPR中的一篇論文提到的方法與王剛的想法不謀而合,于是,他給論文作者寫(xiě)了一封信,此后二者的交流越來(lái)越多,而這也成了一張開(kāi)往新世界的船票,載著王剛漂洋過(guò)海來(lái)到了人工智能領(lǐng)域。
2005 年,王剛從哈工大電子與信息工程學(xué)院畢業(yè),進(jìn)入美國(guó)伊利諾伊大學(xué)香檳分校( UIUC )深造,并跟隨導(dǎo)師在計(jì)算機(jī)視覺(jué)方向上做了不少前沿研究。
UIUC 有著全球領(lǐng)先的計(jì)算機(jī)專業(yè),計(jì)算機(jī)視覺(jué)之父 Thomas S. Huang 曾在這里任教、圖靈獎(jiǎng)唯一華人獲得者姚期智也曾在這里求學(xué)。
至此,王剛才算是真正跨進(jìn)了人工智能領(lǐng)域的大門(mén),一切都仿佛命中注定般順利。
但王剛發(fā)現(xiàn),當(dāng)時(shí)在 UIUC 乃至是整個(gè)人工智能圈,很多學(xué)生做研究喜歡「刷榜」,特別在意各大賽事最后的結(jié)果。
他也清晰地意識(shí)到,頂級(jí)學(xué)者學(xué)術(shù)理念則有一個(gè)很大的共同點(diǎn),就是會(huì)更關(guān)注本質(zhì)問(wèn)題。
于是,關(guān)注事物本身、挖掘事物背后的本質(zhì),是王剛求學(xué)以及工作期間最注重的。即便是在離開(kāi)學(xué)校多年后的今天亦是如此。
在阿里做自動(dòng)駕駛,王剛一直在強(qiáng)調(diào) AI 技術(shù)的本質(zhì)就是更好地構(gòu)建一個(gè)數(shù)據(jù)驅(qū)動(dòng)系統(tǒng),也就是他所理解的「第一性原理」。
在與雷鋒網(wǎng)交流的過(guò)程中,他一共提到了十七次「本質(zhì)」、十六次「第一性原理」,邏輯縝密?chē)?yán)謹(jǐn)。
尋找技術(shù)與生活的連接點(diǎn)
在自身積累了足夠扎實(shí)的科研基礎(chǔ)后,王剛于 2010 年開(kāi)啟了一段新的旅程——入職新加坡南洋理工大學(xué)(NTU),組建了自己的研究團(tuán)隊(duì)。
這一年他只有 28 歲,發(fā)表頂會(huì)論文近 10 篇,論文引用量過(guò)千。
那時(shí),AI 圈還沒(méi)進(jìn)入深度學(xué)習(xí)論文的大水漫灌時(shí)代,王剛的這份成績(jī)?cè)谇嗄陮W(xué)者當(dāng)中已可圈可點(diǎn)。
隨著時(shí)間的推移,浸泡在新加坡 AI 圈的王剛逐漸感受到,這里與美國(guó)的學(xué)術(shù)氛圍以及學(xué)術(shù)應(yīng)用有著明顯的差異。他進(jìn)一步向解釋說(shuō):
“在美國(guó)就是,兩耳不聞窗外事,一心只讀圣賢書(shū);包括我的導(dǎo)師也不太關(guān)心這些應(yīng)用,更多關(guān)注的是解決 fundamental 的學(xué)術(shù)問(wèn)題。但新加坡的大環(huán)境更強(qiáng)調(diào)與工業(yè)界結(jié)合。”
也正是在 NTU 任職的這段時(shí)間,王剛與工業(yè)界的聯(lián)系開(kāi)始多了起來(lái)。
據(jù)了解,基于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)兩大主線,他帶領(lǐng)團(tuán)隊(duì)開(kāi)發(fā)了各種 AI 技術(shù)應(yīng)用,范圍覆蓋了服裝、駕駛、醫(yī)藥、安保等多個(gè)主流領(lǐng)域,并且將一些技術(shù)轉(zhuǎn)讓給了商業(yè)公司。
其中,他們?cè)?2011 年研發(fā)了一個(gè)服裝檢索自動(dòng)系統(tǒng),是比淘寶拍立淘更早的圖搜應(yīng)用;他們也曾推出過(guò)一個(gè) 3D 人類行為標(biāo)準(zhǔn)數(shù)據(jù)集 NTU rgb+d,后為學(xué)術(shù)界和工業(yè)界所用。
不僅如此,王剛還曾聯(lián)合創(chuàng)立了一家名為 I3 Precision 的公司,并親自出任 CTO,希望通過(guò)技術(shù)的手段來(lái)提高藥物驗(yàn)證的效率。
遺憾的是,這些項(xiàng)目受限于應(yīng)用場(chǎng)景等各種原因,當(dāng)時(shí)并沒(méi)有給市場(chǎng)帶來(lái)變革性的影響。
不過(guò)基于此類實(shí)踐,王剛也逐漸塑造一套關(guān)于「應(yīng)用」的清晰認(rèn)知,為其后來(lái)將能力輸出給工業(yè)界、尋找技術(shù)與生活的連接點(diǎn),打下了基礎(chǔ)。
對(duì)此,王剛告訴雷鋒網(wǎng),學(xué)術(shù)研究是百花齊放的:有人數(shù)十年磨一劍,為了科研理想甘坐冷板凳。
就像神經(jīng)網(wǎng)絡(luò)教父 Geoffrey Hinton,曾在一場(chǎng)長(zhǎng)達(dá) 10 余年的計(jì)算機(jī)科學(xué)學(xué)術(shù)之爭(zhēng)中不占上風(fēng),有關(guān)神經(jīng)網(wǎng)絡(luò)的論文也常常被學(xué)術(shù)期刊拒收。但 Geoffrey Hinton 最終證明了自己是對(duì)的。
在此之外,同樣也要有人去關(guān)注 AI 技術(shù)的應(yīng)用問(wèn)題——王剛認(rèn)為,自己就是一個(gè)偏向應(yīng)用型的學(xué)者。
而且,相比起「科學(xué)家」,王剛更愿意將自己定義為「工程師」。
在他看來(lái),科學(xué)家要去發(fā)現(xiàn)新的規(guī)律、創(chuàng)造新的知識(shí)、構(gòu)建新的準(zhǔn)則;而工程師則是以產(chǎn)品的形態(tài),讓準(zhǔn)則能夠 work 起來(lái)。
經(jīng)過(guò)多年的研究積累,王剛心中的準(zhǔn)則已非常明確:
在如今的計(jì)算機(jī)架構(gòu)下,AI 想要實(shí)現(xiàn)長(zhǎng)足的發(fā)展就必須把數(shù)據(jù)驅(qū)動(dòng)做好;如果沒(méi)有足夠多的養(yǎng)料,科學(xué)家也很難發(fā)現(xiàn)新的規(guī)律去推動(dòng) AI 進(jìn)步。
那么,數(shù)據(jù)從何而來(lái)?
從產(chǎn)品出發(fā),或許不失為一條好路子。
2016 年,王剛獲得南洋理工大學(xué)終身教職。但僅僅在一年后,他就毅然離開(kāi)了新加坡,舉家回國(guó),從學(xué)術(shù)界邁入了產(chǎn)業(yè)界。
其實(shí),對(duì)王剛關(guān)于技術(shù)應(yīng)用的思考進(jìn)行一番了解后,他放棄體面而穩(wěn)定的高校工作也就沒(méi)有那么難理解了。
尤其現(xiàn)在身處中國(guó)的人工智能圈,王剛更加堅(jiān)定了要走產(chǎn)業(yè)落地路線的決心。
他向雷鋒網(wǎng)透露,從美國(guó)、新加坡、到中國(guó),越往東越強(qiáng)調(diào)產(chǎn)學(xué)研,國(guó)內(nèi)一些教授的晉升評(píng)獎(jiǎng)也會(huì)將工業(yè)界的成果作為參考指標(biāo)。
“很多人吐槽我們太功利、不注重深層次的研究,其實(shí)不然。因?yàn)槊總€(gè)國(guó)家的國(guó)情不一樣,中國(guó)更注重產(chǎn)學(xué)研的結(jié)合,做好應(yīng)用再做深也是一種途徑?!?/p>
在王剛看來(lái),現(xiàn)階段只有先做到從無(wú)到有、才能慢慢再做到深、再做到優(yōu),這樣更符合發(fā)展規(guī)律。
做產(chǎn)品,最重要的是思維問(wèn)題
阿里,是王剛在工業(yè)界的第一個(gè)落腳點(diǎn)。
關(guān)于在工業(yè)界的去向,他曾給自己定下兩個(gè)基本點(diǎn):
一是自己要做繼續(xù)做 AI 研究;二是團(tuán)隊(duì)的 Leader 要懂業(yè)務(wù),而不是只懂研究。
2017 年 3 月,阿里啟動(dòng)了一項(xiàng)代號(hào)為 NASA 的計(jì)劃,將面向機(jī)器學(xué)習(xí)、智能芯片、生物識(shí)別等前沿技術(shù)組件全新的團(tuán)隊(duì),并動(dòng)員全球兩萬(wàn)多名科學(xué)家和工程師投身新技術(shù)戰(zhàn)略;王剛正是其中的一員。
看起來(lái),阿里非常契合王剛的需求。而且阿里是一個(gè)足夠大的舞臺(tái),能夠讓他盡情施展拳腳。
不過(guò),王剛加入阿里人工智能實(shí)驗(yàn)室后,并非一把上自動(dòng)駕駛,而是臨危受命接過(guò)了天貓精靈的研發(fā)擔(dān)子。
根據(jù)他當(dāng)時(shí)的觀察,人工智能產(chǎn)品在云上的應(yīng)用已有許多案例,如人臉識(shí)別、語(yǔ)言識(shí)別等。但是端方面,還是一個(gè)相對(duì)空白的市場(chǎng)。
而且終端產(chǎn)品需要考慮到場(chǎng)景、計(jì)算等多方面的制約,挑戰(zhàn)性更大,是為自己打開(kāi)工業(yè)界入口的好機(jī)會(huì)。
幾個(gè)月后,王剛和團(tuán)隊(duì)一起研發(fā)出了初代貓精「天貓精靈 X1」,天貓精靈正式從 demo 走向可以交付的量產(chǎn)產(chǎn)品,并且很快就成了出貨百萬(wàn)的爆款。
眼看天貓精靈的發(fā)展越來(lái)越好,就在這時(shí),王剛又做了一個(gè)出人意料的決定——主動(dòng)請(qǐng)纓,帶領(lǐng)團(tuán)隊(duì)從 0 到 1 做自動(dòng)駕駛。
“這個(gè)事情是值得做的,它屬于技術(shù)應(yīng)用的第一象限,既有社會(huì)價(jià)值也有商業(yè)價(jià)值?!蓖鮿偨忉尩馈?/p>
而他的這個(gè)決定,也獲得了阿里高層的支持和重視。
2017 年 10 月,NASA 計(jì)劃的實(shí)體承載組織達(dá)摩院正式亮相,其中就下設(shè)了自動(dòng)駕駛實(shí)驗(yàn)室,隨后由王剛擔(dān)任掌舵人。
最初,由于沒(méi)有合適的場(chǎng)地,王剛就帶著幾個(gè)小伙伴在西溪園區(qū)的車(chē)庫(kù)邊上進(jìn)行簡(jiǎn)單改建,然后開(kāi)始買(mǎi)車(chē)、改裝、路測(cè)。
這段車(chē)庫(kù)「創(chuàng)業(yè)」的歷程,就是小蠻驢的源起。
盡管進(jìn)入工業(yè)界之后的一切都還算順利,但王剛也坦言,以前做的前沿研究很多都沒(méi)有用武之地了,他更多的還是給團(tuán)隊(duì)上帶來(lái)思維上的轉(zhuǎn)變。
比如,無(wú)論是做 NLP 還是做視覺(jué),無(wú)論是做天貓精靈還是小蠻驢,團(tuán)隊(duì)都要思考兩個(gè)問(wèn)題:
一個(gè)是怎么獲取場(chǎng)景數(shù)據(jù),一個(gè)是怎么用好這些數(shù)據(jù)。
據(jù)王剛分享,他剛接手天貓精靈時(shí)發(fā)現(xiàn)語(yǔ)料短缺問(wèn)題比較嚴(yán)重,這會(huì)直接拖慢產(chǎn)品化的進(jìn)度,但由于還未形成產(chǎn)品,很難從用戶處獲取語(yǔ)料;相當(dāng)于陷入了一個(gè)矛盾的困境。
為了解決這個(gè)問(wèn)題,王剛提議花錢(qián)找志愿者編輯語(yǔ)料,試圖通過(guò)這種方式來(lái)弄明白用戶與智能音箱交互的喜好,然后再把這些語(yǔ)料收集起來(lái),用于算法訓(xùn)練。
另一方面王剛發(fā)現(xiàn),很多工程師小伙伴習(xí)慣使用最前沿的技術(shù)去解決最簡(jiǎn)單的問(wèn)題。
比如,智能音箱經(jīng)常會(huì)接到開(kāi)燈關(guān)燈的指令。
由于定向思維,很多工程師會(huì)讓智能音箱應(yīng)用自然語(yǔ)言理解技術(shù)去理解開(kāi)燈關(guān)燈這樣的短語(yǔ)。但王剛認(rèn)為這是一個(gè)非常樸素的問(wèn)題,寫(xiě)一個(gè)規(guī)則就能輕松解決。
自動(dòng)駕駛也是如此。
起步做自動(dòng)駕駛時(shí),阿里一直是以乘用車(chē)作為實(shí)驗(yàn)平臺(tái)來(lái)跑算法,當(dāng)時(shí)并沒(méi)有明確的產(chǎn)品方向。在宣布進(jìn)軍末端物流賽道后,難免引起了團(tuán)隊(duì)里一些同學(xué)的心理落差。
不過(guò),王剛堅(jiān)信末端物流是一個(gè)正確的戰(zhàn)略選擇:
技術(shù)人員都希望做看起來(lái)更有挑戰(zhàn)事情(比如 Robotaxi),這種對(duì)待技術(shù)的態(tài)度應(yīng)該鼓勵(lì),但大家有時(shí)候可能被外面的噪音給干擾了。
他進(jìn)一步說(shuō)道,自動(dòng)駕駛系統(tǒng)無(wú)疑需要數(shù)據(jù)驅(qū)動(dòng),如果只有幾百輛測(cè)試車(chē),數(shù)據(jù)量夠不夠支撐公開(kāi)道路上完全無(wú)人駕駛的實(shí)現(xiàn)?答案是否定的,而且也沒(méi)有任何一家公司能夠負(fù)擔(dān)起幾萬(wàn)、幾十萬(wàn)輛路測(cè)車(chē)所需的資金。
與此同時(shí),國(guó)內(nèi)末端物流未來(lái)的市場(chǎng)規(guī)模預(yù)計(jì)會(huì)超過(guò) 300 萬(wàn)臺(tái),市場(chǎng)需求是有的。
基于這樣的思考,阿里選擇先找到一個(gè)垂直產(chǎn)品落地,然后再通過(guò)這個(gè)產(chǎn)品產(chǎn)生價(jià)值、推動(dòng)業(yè)務(wù)發(fā)展,從而實(shí)現(xiàn)規(guī)?;⑶覍W(xué)習(xí)更多的場(chǎng)景知識(shí)。
而末端物流與阿里業(yè)務(wù)生態(tài)是完美吻合的,落地場(chǎng)景無(wú)須擔(dān)心。
開(kāi)啟大小蠻驢時(shí)代
事實(shí)上,阿里自動(dòng)駕駛實(shí)驗(yàn)室很少對(duì)外發(fā)聲,王剛也不喜出風(fēng)頭。
“大家沒(méi)必要相互制造焦慮。只有真正做到的時(shí)候,我們才說(shuō)做到?!北M管王剛這句話有些拗口,但這是他一直信奉的原則。
低調(diào)耕耘三年多,他們?cè)谌ツ?9 月正式推出了小蠻驢。一年后的今天,他們又迎來(lái)了一個(gè)里程碑:
小蠻驢配送快遞突破 100 萬(wàn)單。
據(jù)了解,小蠻驢已落地全國(guó) 22 個(gè)省份 52 個(gè)城市 160 個(gè)校園;北至哈爾濱、南至南寧,累計(jì)為 20 多萬(wàn)人提供了快遞服務(wù)。
就目前而言,小蠻驢的車(chē)隊(duì)規(guī)模超過(guò) 200 臺(tái)車(chē),每天常態(tài)化超過(guò) 10 個(gè)小時(shí)。三年后車(chē)隊(duì)規(guī)模預(yù)計(jì)將擴(kuò)容到 1 萬(wàn)臺(tái)。
除了規(guī)模上的擴(kuò)張,在服務(wù)方面的改善王剛也進(jìn)行了分享。他認(rèn)為對(duì)一款新生產(chǎn)品來(lái)說(shuō),用戶的使用體驗(yàn)尤為重要,無(wú)論是價(jià)格還是服務(wù)的效果上都需要符合用戶的預(yù)期。目前,用戶對(duì)小蠻驢的滿意度維持在 98% 。
面對(duì)這些年外界的一些質(zhì)疑聲,王剛也回應(yīng)表示,末端物流雖然是低速場(chǎng)景,但并不是「低級(jí)難度」。
技術(shù)層面。物流小車(chē)與其他自動(dòng)駕駛車(chē)輛一樣涉及到算法、算力、硬件、系統(tǒng)等多個(gè)維度,而且要在公開(kāi)道路上行駛。
場(chǎng)景層面。末端物流屬于典型的非結(jié)構(gòu)化場(chǎng)景,交通參與者除了人和機(jī)動(dòng)車(chē),還包括各種小動(dòng)物、非機(jī)動(dòng)車(chē)、異形路障等,并且沒(méi)有規(guī)范的車(chē)道設(shè)計(jì)和通行規(guī)則。
成本層面。以大規(guī)模應(yīng)用為目標(biāo)的自動(dòng)駕駛產(chǎn)品,如果不能將成本降低到量產(chǎn)水平,一切都是紙上談兵。
總而言之,小蠻驢的 100 萬(wàn)單只是一個(gè)起點(diǎn),它為阿里在自動(dòng)駕駛技術(shù)上的進(jìn)一步發(fā)展打下了良好地基礎(chǔ)。
“至少代表著我們看到了自動(dòng)駕駛規(guī)模落地的曙光?!蓖鮿?cè)绱嗽u(píng)價(jià)小蠻驢的成績(jī)。
基于小蠻驢的自動(dòng)駕駛技術(shù)框架 AutoDrive 以及智能仿真平臺(tái)等,大蠻驢的研發(fā)也在緊鑼密鼓的準(zhǔn)備中。
王剛告訴我們,大蠻驢是達(dá)摩院正在研發(fā) L4 級(jí)自動(dòng)駕駛卡車(chē),適用于城配物流,應(yīng)用場(chǎng)景包括城市快遞網(wǎng)點(diǎn)-快遞末端節(jié)點(diǎn)之間的物流配送等。
據(jù)介紹,目前大蠻驢已與菜鳥(niǎo)開(kāi)始小范圍的路測(cè)合作。預(yù)計(jì) 3 年之后,能在上萬(wàn)條公開(kāi)道路上見(jiàn)到這款無(wú)人卡車(chē)的身影。
同時(shí)也不排除阿里日后布局乘用車(chē)的可能性。
畢竟,阿里做自動(dòng)駕駛的整體邏輯已經(jīng)開(kāi)始逐漸清晰——從低速到中速到高速,從垂直領(lǐng)域、非載人領(lǐng)域逐步泛化到更主流更廣泛的場(chǎng)景。
“我很愛(ài)折騰。”在交流的過(guò)程中,王剛曾這么評(píng)價(jià)自己。
從電子信息工程跨到人工智能、從海外回到國(guó)內(nèi)、從學(xué)術(shù)轉(zhuǎn)到工業(yè)、從天貓精靈做到小蠻驢。他確實(shí)一直在嘗試各種挑戰(zhàn)、不斷擴(kuò)大自己的能力邊界。
“我也很幸運(yùn)。”他回憶起自己的過(guò)往。
他告訴我們,當(dāng)初進(jìn)入工業(yè)界,太太十分支持他的決定,并與他一同回國(guó);當(dāng)初他要做自動(dòng)駕駛,即便面臨巨大的不確定性,公司也非常相信他的判斷。
如果他不愛(ài)折騰,又少幾分幸運(yùn),阿里自動(dòng)駕駛的故事可能會(huì)完全改寫(xiě)。
但好在,一切都是最好的安排。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。