丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給章敏
發(fā)送

1

高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

本文作者: 章敏 2016-09-28 17:31
導(dǎo)語:CEVA 今天發(fā)布第五代圖像和計算機視覺 DSP 產(chǎn)品 CEVA-XM6,具有更優(yōu)的性能、更強大的計算能力,以及更小的耗能。

導(dǎo)讀:CEVA 今天發(fā)布第五代圖像和計算機視覺 DSP 產(chǎn)品 CEVA-XM6,具有更優(yōu)的性能、更強大的計算能力,以及更低的耗能。深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、圖像/視覺處理已經(jīng)是計算機科學(xué)中很大的一些領(lǐng)域,然而它們依賴的許多工具仍處于初步階段。機器學(xué)習(xí)需要的實時、精確處理數(shù)據(jù)的能力也往往耗費很大。

注:本文首發(fā)于 ANAND TECH,作者 Ian Cutress,由雷鋒網(wǎng)編譯,未經(jīng)許可不得轉(zhuǎn)載。

高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)和圖像/視覺處理已經(jīng)成為一個很大的領(lǐng)域,然而,許多依賴它的應(yīng)用程序仍然處于初步階段。汽車是應(yīng)用這些領(lǐng)域最典型的例子,而解決汽車面臨的問題,需要同時深度理解和發(fā)展硬件與軟件,實時高精度處理數(shù)據(jù)的能力,為其他機器學(xué)習(xí)編碼打通了一系列道路,接踵而至的問題則是成本和功耗。CEVA-XM4 DSP 想成為第一個支持深度學(xué)習(xí)的可編程 DSP,且就在今天,有著軟件生態(tài)系統(tǒng)的新型 XM6 IP 也被推出,其效率更高,計算能力更強,還有新的節(jié)能專利。

玩 IP 游戲

當(dāng) CEVA 宣布 XM4 DSP 推斷定點算法中預(yù)訓(xùn)練的精度與全算法基本一樣,誤差不到 1 %時,它贏得了該領(lǐng)域許多的分析師獎項,CEVA 稱高性能和功率效率讓其從競爭,及軟件框架的初步進(jìn)展中脫穎而出。IP 公告發(fā)布于 Q1 2015 季度,第二年獲得了許可證,第一批使用 IP 生產(chǎn)的硅鋼將于今年下線。此后,CEVA 發(fā)布了其 CDNN2 平臺,它是一款一鍵編譯工具,訓(xùn)練網(wǎng)絡(luò),并將其轉(zhuǎn)換成適合 CEVA XM IPS 的代碼。新一代 XM6 整合了歷代 XM4 的特點,改進(jìn)了配置,可以訪問硬件加速器,還擁有新型的硬件加速器,而且,它還保留著 CDNN2 平臺的兼容性,這樣的編碼可兼容 XM4,也可以在 XM6 上高性能運行。

CEVA 屬于 IP 業(yè)務(wù),如 ARM,并與半導(dǎo)體公司合作,然后賣給 OEMs 。這通常需要很長的時間,來將新產(chǎn)品從構(gòu)思實際推入市場,尤其是在安全和汽車等行業(yè)正快速發(fā)展時。CEVA 將 XM6 改成了一種可擴展的、可編程的 DSP,它可以用單一的代碼庫橫跨市場,同時利用額外的功能來改善功率、性能,并降低成本。

 高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

今天的公告中,包括新型 XM6 DSP,CEVA 新系列的圖像和視覺軟件庫,一套新的硬件加速器,并將其融入 CDNN2 生態(tài)系統(tǒng)。CDNN2 是一款一鍵編譯工具,檢測卷積,并應(yīng)用優(yōu)于邏輯塊和加速器的最佳方法傳輸數(shù)據(jù)。

 高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

XM6 將支持 OpenCL 和 C++ 開發(fā)工具,以及軟件元素包括 CEVA 的計算機視覺、神經(jīng)網(wǎng)絡(luò)和有著第三方工具的視覺處理庫。硬件為標(biāo)準(zhǔn) XM6 核心的處理部分實現(xiàn) 了AXI 連接,從而與加速器和內(nèi)存交互。XM6 IP 里面有卷積的硬件加速器 CDNN 助手,它允許低功率固定功能硬件,處理神經(jīng)網(wǎng)絡(luò)系統(tǒng)的疑難部分,如 GoogleNet,校正魚眼上的圖像或扭曲鏡頭,圖像的失真已知,變換的函數(shù)是固定功能友好型的,以及其他的第三方硬件加速器。

 高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

XM6 的兩大新硬件功能,將幫助大多數(shù)圖像處理和機器學(xué)習(xí)算法。第一個是分散-聚集,或者說是閱讀一個周期中,L1 緩存到向量寄存器中的 32 地址值的能力。CDNN2 編譯工具識別串行代碼加載,并實現(xiàn)矢量化來允許這一功能,當(dāng)所需的數(shù)據(jù)通過記憶結(jié)構(gòu)分布時,分散-聚集提高了數(shù)據(jù)加載時間。由于 XM6 是可配置的 IP,L1 數(shù)據(jù)儲存的大小/相關(guān)性在硅設(shè)計水平是可調(diào)節(jié)的,CEVA 表示,這項功能對于任意尺寸的 L1 都有效。此級用于處理的向量寄存器是寬度為 8 的 VLIW 實現(xiàn)器, 這樣的配置才能滿足要求。

高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

第二功能稱為“滑動-窗口”數(shù)據(jù)處理,這項視覺處理的特定技術(shù)已被 CEVA 申請專利。有許多方法可以處理過程或智能中的圖像,通常算法將立刻使用平臺所需一塊或大片像素。對于智能部分,這些塊的數(shù)量將重疊,導(dǎo)致不同區(qū)域的圖像被不同的計算區(qū)域重用。CEVA 的方法是保留這些數(shù)據(jù),從而使下一步分析所需信息量更少。聽起來是否很簡單,在 2009 年,我做了類似的三維微分方程分析,確實是這樣,我很驚訝,它之前并沒有實現(xiàn)視覺/圖像處理。如果你有地方存儲的話,重復(fù)使用原始數(shù)據(jù),就可以節(jié)省時間,節(jié)省能源。

高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷 

CEVA 稱 XM6 在重矢量工作量中的性能增益是 XM4 的 3 倍,同比移植內(nèi)核平均提升了 2 倍。XM6 在編碼方面也比 XM4 更容易配置,提供“ 50% 額外的控制”。

高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷 

結(jié)合具體的 CDNN 硬件加速器(HWA),CEVA 指出,生態(tài)系統(tǒng)中的卷積層,如 GoogleNet 消耗了周期中的大部分時間。CDNN HWA 采用了此編碼,并用 512MACs 為它實現(xiàn)了固定的硬件, 使用 16 位支持實現(xiàn)了 8 倍的性能增益,且利用率為 95%。CEVA 提到使用 12 位的方法將節(jié)省芯片面積和成本,同時最小化精度損耗,但也有一些開發(fā)商要求用完整的 16 位方法,以支持未來的項目,因此,結(jié)果是選擇了 16 位。

 高效低耗計算快,CEVA 新推的 DSP 獨領(lǐng)風(fēng)騷

在該領(lǐng)域的汽車圖像/視頻處理方面,CEVA 有兩大競爭對手,分別是 MobilEye 和 NVIDIA ,后者推出了 TX1 以促進(jìn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理。基于 690 MHz 情況下,TX1 在 TSMC 20nm 的平面處理技術(shù),CEVA 說,他們內(nèi)部模擬給出的單體 XM6 在平臺方面效率提升了 25 倍,而且,比 AlexNet 和 GoogleNet 速度快四倍。當(dāng)然,盡管 XM6 也可以在 16nm 或 28nm 的 FinFET 運行,但這些都是其在 20nm 情況下運行的結(jié)果。這意味著,根據(jù)單批 TX1 公布的數(shù)據(jù),XM6 在 FP16 使用 Alexnet ,相比 67幀/秒,它可以執(zhí)行每秒運行 268 幀圖像,相比于 5.1 w,它只要 800 mW。在 16FF 中,功率的數(shù)值可能更低,CEVA 告訴我們,他們內(nèi)部度量最初是在 28 nm / 16FF 情況下完成的,但他們在 20 nm 情況下,使用了 TX1 對其各個方面重新進(jìn)行了度量。應(yīng)該指出的是,TX1 多批次的數(shù)值表明,其效率比單批次更好,然而,它沒能提供其他更多的對比值。CEVA 還用 DVFS 方案實現(xiàn)了功率門控,當(dāng) DSP 的各個部分或加速器空閑時,可降低功率。

很明顯,NVIDIA 的優(yōu)勢是其解決方案的可用性,和 CUDA/OpenCL 軟件開發(fā),這兩方面 CEVA 都想通過一鍵軟件平臺來實現(xiàn),如 CDNN2 ,并改善硬件,如 XM6 ??纯茨男┌雽?dǎo)體合作伙伴和未來的實現(xiàn)工具,能將這種圖像處理與機器學(xué)習(xí)結(jié)合起來。CEVA 指出,智能手機、汽車、安全和商業(yè)應(yīng)用,如無人機、自動化將是主要目標(biāo)。

Via:ANAND TECH

推薦閱讀:

微軟 CEO 納德拉:我們的 AI 之路將會與眾不同

未來無人駕駛首秀,竟不是自動駕駛轎車?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說