0
本文作者: 叢末 | 2018-12-14 10:29 |
雷鋒網(wǎng) AI 科技評(píng)論按:深度學(xué)習(xí)已經(jīng)在安防,金融,自動(dòng)駕駛等領(lǐng)域得到了廣泛的應(yīng)用。市場(chǎng)上的方案大多是基于 GPU 或者精簡(jiǎn)指令集 RISC 架構(gòu),通過(guò)增加多個(gè)處理單元提升計(jì)算能力。
近日,在雷鋒網(wǎng) AI 研習(xí)社公開(kāi)課上,鯤云科技 FAE 團(tuán)隊(duì)負(fù)責(zé)人方舟講解基于數(shù)據(jù)流架構(gòu)的 AI 方案和適配的工具鏈。公開(kāi)課回放視頻網(wǎng)址:
分享嘉賓:
方舟,鯤云科技 FAE 團(tuán)隊(duì)負(fù)責(zé)人,目前負(fù)責(zé)鯤云硬件平臺(tái)、軟件平臺(tái)與編譯器技術(shù)支持。他是帝國(guó)理工模擬與數(shù)字芯片設(shè)計(jì)碩士,愛(ài)爾蘭 IRC 獎(jiǎng)學(xué)金獲得者。
分享主題:基于定制數(shù)據(jù)流的 AI 應(yīng)用
分享提綱:
數(shù)據(jù)流定制架構(gòu)與指令集架構(gòu)的區(qū)別
數(shù)據(jù)流定制架構(gòu)的原理和發(fā)展
開(kāi)發(fā)快速應(yīng)用數(shù)據(jù)流定制架構(gòu)的方法
數(shù)據(jù)流定制架構(gòu)的應(yīng)用
雷鋒網(wǎng) AI 研習(xí)社將其分享內(nèi)容整理如下:
今天的分享分為四個(gè)部分:
第一部分,講一下數(shù)據(jù)流定制架構(gòu)是什么以及它與指令集架構(gòu)有什么區(qū)別。
第二部分,介紹數(shù)據(jù)流定制架構(gòu)的原理和基本發(fā)展歷史。
第三部分,介紹開(kāi)發(fā)快速應(yīng)用數(shù)據(jù)流定制架構(gòu)的方法,鯤云科技如何通過(guò)工具鏈來(lái)解決終端用戶(hù)在使用高性能定制化架構(gòu)的同時(shí),還能保持應(yīng)用的簡(jiǎn)單化和普遍性。
第四部分,介紹數(shù)據(jù)流定制架構(gòu)的應(yīng)用和實(shí)際落地項(xiàng)目。
首先,大家可以看一下下面這個(gè)簡(jiǎn)單的數(shù)學(xué)公式,它表示了神經(jīng)網(wǎng)絡(luò)在做卷積時(shí)的基本操作,那為什么我們需要一個(gè)定制化的架構(gòu)以及它怎樣實(shí)現(xiàn)高性能?
(關(guān)于定制 AI 數(shù)據(jù)流架構(gòu)的講解,請(qǐng)回看視頻 00:02:10 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
我們先來(lái)看一個(gè)經(jīng)典的指令集架構(gòu):
(關(guān)于這個(gè)經(jīng)典指令集架構(gòu)的講解,請(qǐng)回看視頻 00:04:47 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
我們?cè)倏匆粋€(gè)指令集執(zhí)行例子,這是一個(gè)典型的加法操作。
(關(guān)于這個(gè)指令集執(zhí)行案例的講解,請(qǐng)回看視頻 00:07:20 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
經(jīng)典指令集的好處包括:
首先,現(xiàn)在大部分的 GPU、CPU 都是基于指令集的架構(gòu),應(yīng)用層可以通過(guò)軟件和編輯器去將語(yǔ)言最終轉(zhuǎn)化為機(jī)器的語(yǔ)言,即二進(jìn)制的碼,以很高的效率去執(zhí)行指令和操作,保證兼容性的優(yōu)勢(shì)。
其次,針對(duì)特定領(lǐng)域的專(zhuān)用架構(gòu),可以使用開(kāi)發(fā)工具將應(yīng)用下載到架構(gòu)中,從而實(shí)現(xiàn)高效的計(jì)算。
相較于指令集,數(shù)據(jù)流的核心就是保證每個(gè)時(shí)鐘周期進(jìn)行有效計(jì)算,那就要保證有數(shù)據(jù)時(shí)時(shí)刻刻地流入計(jì)算單元,得到數(shù)據(jù)輸出后,將最終數(shù)據(jù)存儲(chǔ)到內(nèi)存中,或進(jìn)行到下一步流水線操作。
(關(guān)于這個(gè)指令集執(zhí)行案例的講解,請(qǐng)回看視頻 00:10:20 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
下面是一個(gè)典型的基于神經(jīng)網(wǎng)絡(luò) SSD 的架構(gòu):
(關(guān)于該部分的講解,請(qǐng)回看視頻 00:11:00 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
數(shù)據(jù)流架構(gòu)能實(shí)現(xiàn)性能的極大提升,同時(shí)需要解決在復(fù)雜計(jì)算架構(gòu)下對(duì)于高計(jì)算效率保持,以及高定制架構(gòu)對(duì)于不同深度學(xué)習(xí)算法的通用性支持。這是鯤云的一個(gè)基于數(shù)據(jù)流架構(gòu)的 AI 解決方案,它的優(yōu)勢(shì)包括:
是一種輸入到輸出的數(shù)據(jù)流架構(gòu)
最大化 AI 性能,全面使用架構(gòu)下的計(jì)算單元
使用硬件流水線架構(gòu)完成,數(shù)據(jù)與控制
(關(guān)于定制 AI 數(shù)據(jù)流架構(gòu)的講解,請(qǐng)回看視頻 00:17:50 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
快速實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)檢測(cè),第一個(gè)是實(shí)現(xiàn)底層參數(shù)化:可配置通路。下圖來(lái)自創(chuàng)始人在 1994 年發(fā)表的一篇論文,講述了如何在定制化的架構(gòu)里,采用不同的操作來(lái)執(zhí)行通用人工智能算法。
(關(guān)于底層參數(shù)化的講解,請(qǐng)回看視頻 00:24:15 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
第二個(gè)就是進(jìn)行多層并行可拓展的優(yōu)化。通過(guò)實(shí)現(xiàn)數(shù)據(jù)并行、Filter 并行、Channel 并行、Layer 并行以及加速器引擎并行的優(yōu)化,來(lái)支撐高性能計(jì)算。
(關(guān)于多層并行可拓展的優(yōu)化的講解,請(qǐng)回看視頻 00:27:00 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
這是一個(gè)數(shù)據(jù)并行的例子:
基于特定的數(shù)據(jù)流架構(gòu),它可能不像指令集的通用性那么強(qiáng),那就需要一個(gè)工具來(lái)將算法解構(gòu)導(dǎo)入架構(gòu)結(jié)構(gòu)去完成神經(jīng)網(wǎng)絡(luò)計(jì)算的過(guò)程,下面就是我們基于 AI 所做的框架工具鏈——RainBuilder:
(關(guān)于 Rainbuilder 的具體介紹,請(qǐng)回看視頻 00:31:55 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
目前我們公司整套數(shù)據(jù)流架構(gòu)方案的應(yīng)用方向主要包括四大領(lǐng)域:
機(jī)器人、無(wú)人機(jī)以及自動(dòng)駕駛
攝像頭
傳感器
服務(wù)器
(關(guān)于產(chǎn)品應(yīng)用方向的具體介紹,請(qǐng)回看視頻 00:35:45 處,http://www.mooc.ai/open/course/588?=aitechtalkfangzhou)
現(xiàn)在,鯤云科技也在招聘各類(lèi)工程師,期待大家加入!
以上就是本期嘉賓的全部分享內(nèi)容。更多公開(kāi)課視頻請(qǐng)到雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)) AI 研習(xí)社社區(qū)(http://ai.yanxishe.com/)觀看。關(guān)注微信公眾號(hào):AI 研習(xí)社(okweiwu),可獲取最新公開(kāi)課直播時(shí)間預(yù)告。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。