0
本文作者: 吳德新 | 2018-01-11 23:18 | 專題:CES 2018 國際消費電子展 |
CES 2018是這家成立兩年半的公司第二次參加CES。上屆CES,地平線與Intel合作推出基于Arria FPGA的ADAS原型。因為原型所展現(xiàn)出的高性能、低功耗以及團(tuán)隊敏捷的開發(fā)效率,這年地平線獲得了Intel Capital領(lǐng)投的上億美金的A+輪融資。
而后今年的拉斯維加斯,地平線在第二代BPU架構(gòu)的基礎(chǔ)上再次推出基于Intel FPGA的自動駕駛系統(tǒng)原型。更重要的是,他們還帶來了數(shù)月前流片成功的2款人工智能專用芯片。
征程1.0處理器
本屆CES開始前,雷鋒網(wǎng)再次采訪了地平線創(chuàng)始人兼CEO余凱,請他聊一聊過去2年地平線研發(fā)芯片的經(jīng)驗,以及芯片發(fā)布之后應(yīng)用和落地的思考。
(1月16日,雷鋒網(wǎng)將在舊金山灣區(qū)舉辦GAIR硅谷智能駕駛峰會,峰會將邀請中美兩地數(shù)十家自動駕駛公司演講,并有近百家兩地產(chǎn)業(yè)鏈公司到場。訪問詳情:gair.leiphone.com/gair/gairsv2018。我們也邀請了地平線創(chuàng)始人兼CEO余凱老師在本次峰會上分享公司的最新動態(tài)和技術(shù)思考。)
在剛剛過去的12月,地平線于北京召開盛大的發(fā)布會,對外展示的正是2款嵌入式人工智能專用處理器:面向智能駕駛應(yīng)用的征程1.0和面向攝像頭應(yīng)用的旭日1.0。兩款處理器均是基于地平線的第一代BPU架構(gòu)——高斯架構(gòu)。關(guān)鍵性能指標(biāo)分別是:可實時處理1080P@30的視頻,每幀中可同時對200個目標(biāo)進(jìn)行檢測、跟蹤、識別,典型功耗1.5W,每幀延時小于30ms。
對外,地平線早在一年多前就公布了3代BPU架構(gòu)設(shè)計的路線圖:高斯架構(gòu) - 伯努利架構(gòu) - 貝葉斯架構(gòu)。三代架構(gòu),性能與功耗比依次提升,工藝也從40nm演進(jìn)到16nm。在內(nèi)部,自2015年10月招募第一位芯片工程師開始,地平線今天組建了一支60人左右的專業(yè)芯片團(tuán)隊。
針對地平線芯片的發(fā)布,國內(nèi)人工智能領(lǐng)域泰斗張鈸院士的評價是,用算法和軟件來定義硬件,專門面向深度學(xué)習(xí)算法的硬件極大地提高了計算效率,這為硬件的發(fā)展提供了新思路。而對地平線來說,這也恰恰是2款芯片研發(fā)的難點,需要團(tuán)隊同時具備軟件算法和硬件兩個領(lǐng)域的經(jīng)驗思考。
按照原定的研發(fā)規(guī)劃,地平線會在去年的5月份進(jìn)行芯片的流片。余凱當(dāng)時正在底特律出差,5月的深夜他與芯片團(tuán)隊溝通,決定推遲流片排期。
余凱向我們解釋:一般來講,在對芯片硬件開始設(shè)計前,芯片的整個軟件架構(gòu)需要完全確定。但實際上,針對深度學(xué)習(xí)優(yōu)化的人工智能專用芯片很少有人做過,在研發(fā)的過程中算法和軟件團(tuán)隊會修改甚至推翻一些小的決策點,于是這對于硬件團(tuán)隊來說造成了非常大的挑戰(zhàn),導(dǎo)致在原定的芯片排期內(nèi)仿真做得不夠。好在推遲排期后,他們又與臺積電積極協(xié)調(diào),爭取一個月內(nèi)重新安排了流片。
地平線給自己設(shè)計的定位是具有自主芯片IP,提供完整開放嵌入式人工智能解決方案的供應(yīng)商,而這兩年,地平線主要的業(yè)務(wù)領(lǐng)域是自動駕駛和IoT。如何面向自動駕駛和廣泛的IoT領(lǐng)域提供一個通用的優(yōu)化過的計算架構(gòu),使得芯片開發(fā)有很高的效率,同時針對垂直應(yīng)用場景又有很好的效果,這可能是芯片研發(fā)的第二個難點。
這也是為什么這次發(fā)布的2款處理器都是視覺處理器。2款處理器都是基于高斯架構(gòu),但針對不同的應(yīng)用場景做了不同的封裝。同樣團(tuán)隊配置上,地平線在60來人的芯片團(tuán)隊之外,建立了一個100 - 200人之間的應(yīng)用開發(fā)團(tuán)隊,負(fù)責(zé)自動駕駛和IoT兩個方向。
2016年,地平線向博世授權(quán)了一份與ADAS相關(guān)的軟件,這也是公司當(dāng)年一項重要的業(yè)務(wù)。而隨著高斯架構(gòu)的確立,地平線先后在GPU、ARM、FPGA等多個平臺上實現(xiàn)了基于自主IP架構(gòu)的解決方案。比如CES 2017上,地平線采用Intel FPGA搭建基于高斯架構(gòu)的ADAS系統(tǒng),并就這個系統(tǒng)在與一部分的車企和供應(yīng)商開展合作,正在功能驗證的階段。
眼下,征程1.0是一顆工業(yè)級的芯片,余凱說團(tuán)隊希望在未來1年之內(nèi)推出車規(guī)級的芯片。同時,面向車輛前裝的周期是漫長的。地平線目前可以向行業(yè)客戶提供基于征程1.0的Level 2級別的ADAS解決方案。基于其在本屆CES上展示的第二代BPU架構(gòu)原型系統(tǒng),之后也陸續(xù)會推出Level 3和限定場景下L4的解決方案。
余凱說,今年內(nèi),基于第二代BPU架構(gòu)的征程2.0將會推出,相比于征程1.0會有長足的提升。征程2.0會面向自動駕駛做更多的優(yōu)化,并且會實現(xiàn)基于像素級別的識別框架,計算復(fù)雜性也會更高。
發(fā)布會上,地平線還對外公布了與2家車企的合作,一家是奧迪,一家是長安。今年,地平線將與兩家在自主BPU架構(gòu)的基礎(chǔ)上,各自進(jìn)行自動駕駛的聯(lián)合開發(fā)和驗證。
附上:雷鋒網(wǎng)·新智駕在CES前采訪的對話節(jié)選,雷鋒網(wǎng)·新智駕做了不改變原意的刪減。
新智駕:地平線剛剛發(fā)布了旭日1.0和征程1.0,兩款芯片在硬件上有多大的差異?
余凱:這兩款芯片在硬件上,其實主要是封裝得不太一樣,里面的主要器件單元是一樣的。因為它在不同的場景下使用,它的模型復(fù)雜度不太一樣。
我們是使用同一代架構(gòu),高斯架構(gòu),采用不同的封裝。業(yè)界比如像NVIDIA是每三年一代架構(gòu),上一代架構(gòu)Pascal,這一代架構(gòu)Volta,然后基于Volta架構(gòu)的話,他們也會推出不同場景下不同的處理器,主要是一些接口都不一樣,比如說在車載的情況下,它對實時性的要求更高。
新智駕:我們是什么時候決定說把它分裝成兩個不同的芯片?
余凱:應(yīng)該說,我們應(yīng)該從一開始就瞄準(zhǔn)這兩個不同的市場。我們會根據(jù)這一代的架構(gòu),也會演化成不同的產(chǎn)品。我們也在考慮可能會基于這一代的架構(gòu),推出支持語音識別的芯片。
一般來講的話,架構(gòu)迭代的時間都是比較長的,一代架構(gòu)會根據(jù)不同的應(yīng)用封裝成不同的芯片,有不同的接口,這在業(yè)界都是常見的形式。
新智駕:像這一代芯片為什么選用的是40納米的工藝?
余凱:因為我們比較強(qiáng)調(diào)軟件跟算法的結(jié)合,我們不會追求純粹的半導(dǎo)體制程上的先進(jìn)性。我們會強(qiáng)調(diào)因為我們有更強(qiáng)大的軟件,即使用比別人更低的工藝,但是我們的整個系統(tǒng)性能也可以做到足夠好,甚至比別人更好。就像Mobileye其實很長一段時間也是用50納米的工藝。所以,這個就是軟硬結(jié)合的做法跟純粹做硬件思路不太一樣的地方。
Mobileye的EyeQ4是28納米的,其實跟我們下一代的,今年年底要推出來的新的一代芯片是差不多的。因為EyeQ4是面向L3級和L4級自動駕駛,我們這一代芯片主要是面向L2級的ADAS,所以跟EyeQ3是對標(biāo)的。
新智駕:40納米跟28納米相比,在成本或者排期上會有多大的優(yōu)勢?
余凱:光流片費就會節(jié)省幾百萬美金。
新智駕:地平線的芯片團(tuán)隊現(xiàn)在大概有多大?
余凱:我們整個的芯片架構(gòu)、芯片設(shè)計、芯片驗證,然后再加上系統(tǒng)軟件固件團(tuán)隊的話,現(xiàn)在有五六十人。
新智駕:根據(jù)地平線12月公布的幾個解決方案,一個方向是自動駕駛,一個是零售,還有一個是安防三個應(yīng)用領(lǐng)域。那么芯片和算法的底層開發(fā),與幾個方向的應(yīng)用開發(fā)怎樣協(xié)調(diào)?
余凱:圍繞應(yīng)用,我們現(xiàn)在內(nèi)部定義的其實是兩個方向,一個是智能IOT,一個就是自動駕駛。兩個方向的應(yīng)用開發(fā)會由兩個團(tuán)隊負(fù)責(zé),芯片算法是一個公共的底層平臺團(tuán)隊。應(yīng)用開發(fā)的團(tuán)隊現(xiàn)在加起來有100到200號人之間,自動駕駛這塊會多一些。
新智駕:你們的芯片,之后是一年會進(jìn)行一次迭代?
余凱:對,一開始是這樣,一年迭代一次架構(gòu)。我們可能往第二代架構(gòu)去迭代的速度會更快一點,第二代會比第一代更加強(qiáng)大。
新智駕:基于高斯架構(gòu),會有多個面向應(yīng)用的芯片。隨著架構(gòu)的迭代,芯片越來越專用化,會不會變成不同的架構(gòu)?
余凱:我們盡量不希望這樣,這樣做的話會讓我們的底層資源變得太分散,我們會盡量通過軟件來面對不同的應(yīng)用場景。
新智駕:之前講到你們的芯片特點是高性能、低功耗、低成本,相比之下,低成本大概是多低呢?
余凱:跟端上面處理的GPU比的話,我們希把成本至少做低一個數(shù)量級。
新智駕:怎樣跟基于EyeQ3的ADAS比較?
余凱:目前征程1.0的話,其實是一個工業(yè)級的處理器,不是車規(guī)級的。所以我們一開始會去做ADAS的后裝市場。我們也有計劃,把我們的處理器推向車規(guī)級。
新智駕:發(fā)布會上,地平線也公布了與奧迪、長安的合作,具體是怎樣的?
余凱:我們跟奧迪在聯(lián)合研發(fā)自動駕駛技術(shù),明年的話,我們會有聯(lián)合研發(fā)的樣車出來;長安的話,我們是成立一個聯(lián)合實驗室,也是面向自動駕駛,雙方共同去聯(lián)合研發(fā)。
新智駕:比如會基于征程有一些合作嗎?
余凱:其實會遠(yuǎn)超征程的范圍,也可以理解為是基于征程的二代處理器,他們提出應(yīng)用場景,我們提供軟件跟處理器。
新智駕:目前征程1.0是一個工業(yè)級的芯片,比如現(xiàn)在有一家汽車廠商希望合作,一般是怎樣去開展?
余凱:其實一般都是這樣的。Mobileye跟它的合作伙伴,一開始的芯片也都是工業(yè)級的,然后會跟客戶先完成功能測試,功能測試通常都要三年的時間,然后在這個三年時間里,不斷地去完成車規(guī)級和系統(tǒng)級的功能安全驗證。
新智駕:像這樣提前兩年去定義一款芯片,難點會在哪里?
余凱:兩年前這個定義芯片的話,那個時候你好多決定,其實都是需要在不是很確定的情況下去做的。打個比方,你的輪子還沒有在裝的過程中,你車就開始跑了,所以這個風(fēng)險很大。好在我們一次性流便成功了,這是我們覺得很興奮的一件事情。
不是很確定的情況,比如說,你不知道芯片所支持的算法架構(gòu),是不是能夠去滿足未來應(yīng)用的需求。比如說15年的時候幾乎沒有人做深度神經(jīng)網(wǎng)絡(luò)的定制化優(yōu)化,我們自己做了,然后還做得比較激進(jìn),那么現(xiàn)在看起來的話,這個策略是非常對的。
新智駕:像你們的芯片流程,跟傳統(tǒng)的芯片設(shè)計流程會有什么不一樣?
余凱:很多不一樣。一般來講,一個典型的芯片,在開始設(shè)計之前,整個軟件框架一定要定下來,一旦開始的話就不能再改了。
我們是在2015年那么早的情況下做這個事情,然后我們有一些小的一些決策點,可能會不斷地推翻。所以當(dāng)時的話硬件的同學(xué)已經(jīng)開始著手了,結(jié)果這邊軟件還時不時修改,所以其實是搞的硬件的設(shè)計人員挺抓狂的。
做算法研發(fā)的同學(xué)的思維是,軟件我可以隨時改,有一個新的idea的話就可以改,但硬件,你就什么東西都得固定下來,一行代碼不能改。因為硬件一點點的改動,其實就意味著整個的巨大的工作量,會導(dǎo)致時間排期的不確定性。
我們做第二代的時候,會在軟件上做一些調(diào)整。因為硬件的改動,而導(dǎo)致驗證不充分的話,最后芯片研發(fā)會有很大的風(fēng)險。從我們這種做軟件背景的人來講,其實就是真正地對硬件研發(fā)有敬畏之心。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。