0
本文作者: 包永剛 | 2023-03-29 18:41 |
“希望到2030年,我們能夠?qū)崿F(xiàn)支持中國自動(dòng)駕駛成熟量產(chǎn)方案的落地?!卑仓\科技執(zhí)行副總裁、產(chǎn)品研發(fā)負(fù)責(zé)人劉澍在周易X2發(fā)布會(huì)上如是說。
其實(shí),安謀科技早已開始布局汽車市場(chǎng)。
去年發(fā)布了“星辰”STAR MC2 CPU車規(guī)級(jí)處理器,加上正在開發(fā)的車規(guī)安全類IP,以及Arm已有的車規(guī)ISP。本周最新發(fā)布的面相智能駕駛、手機(jī)影像AI等市場(chǎng)的周易X2,為安謀科技押注汽車市場(chǎng)又增加了新的砝碼。
當(dāng)然,為了繁榮AI市場(chǎng),安謀科技還推出了“周易”NPU軟件開源計(jì)劃,安謀科技團(tuán)推測(cè)算這可以節(jié)省50%的軟件工作量。
押注汽車市場(chǎng)
“為什么我們這么關(guān)心中國的汽車市場(chǎng)?”劉澍解釋,“這和我們過去所看到的產(chǎn)業(yè)升級(jí)和新老格局的交替有重大的聯(lián)系。手機(jī)行業(yè)在2000年前后基本上是國外品牌主宰,從功能機(jī)到智能機(jī)升級(jí)的過程中,市場(chǎng)上涌現(xiàn)了一大批新的品牌、新的勢(shì)力。我們認(rèn)為,智能汽車行業(yè)可能也會(huì)重現(xiàn)這樣的格局,過去我們被歐美、日本品牌所壟斷,未來中國市場(chǎng)和中國品牌勢(shì)必在產(chǎn)業(yè)占有一席之地。”
相比手機(jī)芯片的市場(chǎng)規(guī)模,汽車芯片目前看起來還比較小,但具有市場(chǎng)潛力。
劉澍表示,汽車自動(dòng)駕駛應(yīng)用對(duì)人工智能的需求越來越多,不光是ADAS有更多的攝像頭、更多的雷達(dá),會(huì)產(chǎn)生更多需要處理的數(shù)據(jù),同時(shí),車內(nèi)車外的各種監(jiān)視、輔助的決策系統(tǒng),需要更高的幀率、更大的算力、更多人機(jī)交互、更多安全性需求等,這些都給對(duì)IP產(chǎn)品提出了更高的要求。
隨著智能駕駛從L2到L3、L4的演進(jìn),汽車對(duì)芯片和IP的要求會(huì)越來越高。而最新推出的周易X2瞄準(zhǔn)的正是中國新勢(shì)力汽車品牌。
當(dāng)然,周易X2不僅可以用于汽車領(lǐng)域,也可以應(yīng)用于更大算力的邊緣側(cè)服務(wù)器類型,例如手機(jī)、PC、平板電腦等應(yīng)用場(chǎng)景。
專為汽車市場(chǎng)需求優(yōu)化的特性
與前代產(chǎn)品周易X1基于V1、V2架構(gòu)不同,周易X2基于V3架構(gòu),也是首款基于V3架構(gòu)的產(chǎn)品,帶來了八大特性升級(jí),包含:
第一,通過支持多核Cluster實(shí)現(xiàn)更大的算力,可以支持10T-320T子系統(tǒng)的算力。
第二,支持更好的i-Tiling的技術(shù)方案,大幅減少帶寬需求,進(jìn)一步提升計(jì)算效率,降低系統(tǒng)的成本。
第三,通過專門的硬件加速調(diào)度器實(shí)現(xiàn)實(shí)時(shí)的任務(wù)調(diào)度和管理。
第四,支持int4/int8/int12/int16/int32,fp16/bf16/fp32多精度融合計(jì)算,計(jì)算效率與計(jì)算密度得到顯著提升。
第五,優(yōu)化的Transformer性能。
第六,增加了無損的權(quán)重壓縮的技術(shù),
第七,在低功耗領(lǐng)域進(jìn)行技術(shù)升級(jí),7nm工藝節(jié)點(diǎn)可以實(shí)現(xiàn)10TOP/W的能效。
第八,面向手持設(shè)備也做了專門的優(yōu)化,比如拍照的AI去噪聲,視頻的超分辨率、插幀等。
安謀科技產(chǎn)品總監(jiān)楊磊指出,面向車載領(lǐng)域,周易X2 NPU主要做的優(yōu)化包括三個(gè)方面:
首先,基礎(chǔ)的架構(gòu)層面專門針對(duì)汽車的場(chǎng)景做了優(yōu)化,通過多Cluster支持大算力的需求,既可以滿足智能座艙幾十T的算力需求,也能滿足ADAS或智能駕駛幾十到上百T的AI算力需求。
其次,為了滿足汽車需要很高的計(jì)算精度的需求,周易X2通過混合精度既兼顧了功耗、面積也兼顧了計(jì)算的準(zhǔn)確度來滿足汽車場(chǎng)景的需要。
最后,周易X2 NPU也針對(duì)車載專用的算法進(jìn)行定向的優(yōu)化,典型的代表是Transformer模型結(jié)構(gòu),專門做優(yōu)化。
“Transformer結(jié)構(gòu)優(yōu)化完的結(jié)果和我們自己相比,假設(shè)在算力相等的情況下,可以比上一代的周易 Z2 Transformer的性能提升10倍,是一個(gè)指數(shù)級(jí)的性能提升?!睏罾趶?qiáng)調(diào),
“通過面向汽車場(chǎng)景的這些優(yōu)化,我們希望通過成熟的軟件和硬件的IP產(chǎn)品,加快合作伙伴芯片的上市周期,以及最終的產(chǎn)品落地。我們可以看到國內(nèi)很多汽車窗口的時(shí)間預(yù)測(cè)是在2025年,我們這樣成熟的NPU的軟件和硬件可以加快合作伙伴芯片開發(fā)和設(shè)計(jì)的速度,并縮短最終汽車落地的周期。”
據(jù)悉,周易X2 NPU現(xiàn)在已經(jīng)到成熟階段,可以正式交付客戶,今年會(huì)有多款搭載周易X2 NPU的芯片產(chǎn)品面世。
開源NPU軟件
想要加速芯片的落地,軟件生態(tài)非常重要。
安謀科技科技做過一個(gè)有意思的統(tǒng)計(jì),過去一年國內(nèi)60個(gè)用到NPU的芯片項(xiàng)目,其中大概55%的項(xiàng)目都用自研NPU,并且這些自研NPU都不相同。
楊磊說:“每換一個(gè)硬件平臺(tái),不單換硬件,可能整個(gè)軟件的工具鏈都變了,這對(duì)應(yīng)用開發(fā)來講是極其復(fù)雜或者是痛苦的,因?yàn)橐煌5負(fù)Q軟件平臺(tái)或者是硬件平臺(tái),這樣極大地增大了應(yīng)用開發(fā)或者說創(chuàng)新的代價(jià)和周期?!?/p>
“我們發(fā)現(xiàn)在軟件部署的過程中存在很強(qiáng)烈的白盒開發(fā)的需求,希望工具鏈?zhǔn)且栽创a的形式提供的,而不是一個(gè)黑盒,越是這種以算法和數(shù)據(jù)為核心的合作伙伴,越有強(qiáng)烈的軟件工具鏈白盒的訴求?!睏罾谕瑫r(shí)表示。
據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))了解,AI軟件是影響AI落地的關(guān)鍵因素,想要把AI硬件用起來難度很高,學(xué)習(xí)成本和周期很高。
于是,基于上述的考慮,安謀科技推出了周易NPU軟件開源計(jì)劃。這個(gè)計(jì)劃首先對(duì)外開放NPU中間表示層規(guī)范、模型解析器、模型優(yōu)化器、驅(qū)動(dòng)等,并向相關(guān)合作伙伴提供“周易” Compass軟件平臺(tái),包括軟件模擬器、調(diào)試器、C編譯器等在內(nèi)的多種軟件工具。
后續(xù),安謀科技還將逐步開放更多資源,如模型量化、算子實(shí)現(xiàn)等源代碼。
“開源的好處是能擁有一個(gè)統(tǒng)一的方案,即使是用別人的硬件,這個(gè)項(xiàng)目提供的也是同樣的軟件方案?!睏罾谡f,“我們最新的一代V3架構(gòu)是免費(fèi)授權(quán),特別歡迎有自研NPU想法的合作伙伴也來兼容周易NPU的架構(gòu)。我們的NPU團(tuán)隊(duì)大概有130個(gè)人,初步測(cè)算基本上可以節(jié)省65人/年以上的工作,我們也希望通過這樣的手段,首先可以繁榮生態(tài),另外也希望能借此加強(qiáng)合作伙伴的AI創(chuàng)新。”
目前,周易NPU軟件開源計(jì)劃已經(jīng)有第一批合作伙伴率先加入,其中不乏來自AIoT、智能汽車、智能操作系統(tǒng)等領(lǐng)域的明星企業(yè)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。