丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
AI+ 正文
發(fā)私信給張夢華
發(fā)送

0

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn) | CCF-GAIR 2020

導(dǎo)語:天元深度學(xué)習(xí)框架的技術(shù)特點(diǎn)、迭代歷程與開源生態(tài)。

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

雷鋒網(wǎng)按:8 月 7 日 - 9 日,由中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,鵬城實(shí)驗(yàn)室、深圳市人工智能與機(jī)器人研究院協(xié)辦的第五屆 CCF-GAIR 2020 全球人工智能與機(jī)器人峰會(huì)如期落地。

8 日,大會(huì)與 AI 研習(xí)社、OpenI 啟智社區(qū)聯(lián)合舉辦“AI 源創(chuàng)專場”,重點(diǎn)討論了新基建背景下,國內(nèi)開源創(chuàng)新建設(shè)將催生的新勢能,以及其將引發(fā)和促進(jìn)的新產(chǎn)業(yè)機(jī)會(huì)。

會(huì)上,曠視研究院高級(jí)技術(shù)總監(jiān)田忠博做了主題為《天元深度學(xué)習(xí)框架的開源演進(jìn)》的分享。

曠視在數(shù)據(jù)、算力、算法方面有三大驅(qū)動(dòng):數(shù)據(jù)管理平臺(tái) MegData 、深度學(xué)習(xí)云計(jì)算平臺(tái) MegCompute、深度學(xué)習(xí)框架 MegEngine,三者共同構(gòu)成了曠視的 AI 生產(chǎn)力平臺(tái) Brain++。

田忠博首先追溯了 Brain++ 的發(fā)展,從曠視在 AI 生產(chǎn)力基礎(chǔ)設(shè)施構(gòu)建上所積累的強(qiáng)大能力以及天元深度學(xué)習(xí)框架開源初衷展開,解析了天元深度學(xué)習(xí)框架的技術(shù)特點(diǎn)、迭代歷程,及其正在努力構(gòu)建的開源生態(tài)。雷鋒網(wǎng)將田忠博的演講進(jìn)行了不改變?cè)獾木庉嫞韵聻槿模?/span>

大家好,我是曠視研究院的田忠博,我今天跟大家分享曠視在天元深度學(xué)習(xí)框架上的進(jìn)展,也希望能夠借助這個(gè)機(jī)會(huì)和在座的各位專家、各位同仁以及觀看現(xiàn)場直播的朋友們介紹曠視是如何通過開源開放推動(dòng) AI 行業(yè)發(fā)展的。

曠視 AI 生產(chǎn)力平臺(tái) Brain++

我們認(rèn)為,AI 有三個(gè)最主要的核心因素:數(shù)據(jù)、算力和算法。曠視自研的 AI 生產(chǎn)力平臺(tái) Brain++ 包括數(shù)據(jù)管理平臺(tái) MegData ,深度學(xué)習(xí)云計(jì)算平臺(tái) MegCompute,今天我要著重介紹的是其中最核心的組件——深度學(xué)習(xí)框架天元 MegEngine。現(xiàn)在曠視所有的算法研究和生產(chǎn)都是使用 MegEngine 進(jìn)行的。

簡單回顧一下曠視 Brain++ 的發(fā)展歷程。2014年,MegEngine 立項(xiàng),我們開始對(duì)它進(jìn)行研發(fā)。2015 年,曠視的研發(fā)和生產(chǎn)都遷移到了 Brain++ 體系上來,我們多次用這樣的技術(shù)獲得了國際頂級(jí) AI 競賽的冠軍,同時(shí)也依托這套技術(shù)在曠視研究院持續(xù)發(fā)布我們最領(lǐng)先的技術(shù)成果。2019 年,AI 生產(chǎn)力平臺(tái) Brain++ 在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上獲得了“世界互聯(lián)網(wǎng)先進(jìn)成果獎(jiǎng)”,這是對(duì)曠視技術(shù)理念和實(shí)踐的認(rèn)可。

2020 年 3 月,曠視決定將 Brain++ 的核心組件——深度學(xué)習(xí)框架天元 MegEngine 開源出來,我們也希望開源出來的框架能夠幫助更多企業(yè)、研究機(jī)構(gòu)以及學(xué)生更好地使用最新的 AI 技術(shù)。

我們第一個(gè)開源版本是天元 0.3.1,到 2020 年 6 月底,我們發(fā)布了 Beta 版,差不多經(jīng)歷了 90 天的時(shí)間。這期間有 339 個(gè) committers 為天元貢獻(xiàn)代碼,代碼量從 35 萬行增長到 48 萬行。 

我們也剛剛發(fā)布了 0.6 版本。我們有非常積極活躍的開發(fā)體系,希望把最新的工作和研究成果體現(xiàn)在天元的代碼倉庫中。

天元深度學(xué)習(xí)框架的技術(shù)特點(diǎn)

大家可能會(huì)想,現(xiàn)在已經(jīng)有很多的深度學(xué)習(xí)框架,天元的開源意義是什么?天元能給大家?guī)硎裁??我給大家介紹一下天元的總體架構(gòu)。

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

天元框架從上到下分成五個(gè)層次,最上面是服務(wù)開發(fā)者的 API 層,大家通過 API 層直接和深度學(xué)習(xí)框架打交道。我們提供了 Python 和 C++ 的接口,通過 C++ 接口可以進(jìn)行工業(yè)生產(chǎn)和研發(fā)。 

下面有統(tǒng)一的圖的表示層?,F(xiàn)在深度學(xué)習(xí)框架有動(dòng)態(tài)計(jì)算和靜態(tài)計(jì)算兩種流派,我們有動(dòng)態(tài)圖和靜態(tài)圖的表示方式,但在不同的表示方式下有統(tǒng)一的核心計(jì)算圖,這是天元比較重要的區(qū)別。

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

天元在核心的計(jì)算圖層提供了優(yōu)化和編譯功能,可以實(shí)現(xiàn)自動(dòng)求導(dǎo),完成復(fù)雜的圖優(yōu)化,使大家通過 API 層,將用戶表達(dá)的人類可理解的計(jì)算范式,轉(zhuǎn)化為機(jī)器易執(zhí)行的范式。

圖編譯層可以做復(fù)雜的代碼生成和代碼的算子融合,進(jìn)一步提升效率。

下面的一個(gè)層次是運(yùn)算和運(yùn)行管理。在運(yùn)行期間,我們需要管理內(nèi)存、不同設(shè)備的同步,這里包括計(jì)算的調(diào)度和內(nèi)存管理的調(diào)度。在計(jì)算調(diào)度方面,我們把所有的設(shè)備抽象成流,通過流調(diào)度器,跨異構(gòu)設(shè)備的圖形可以被非常好地管理起來。

同時(shí),我們?cè)趦?nèi)存方面也下了非常大的功夫。我們有一個(gè)非常先進(jìn)的靜態(tài)內(nèi)存管理器和管理機(jī)制,通過對(duì)整個(gè)計(jì)算流程的分析和分解,能夠排布、安排內(nèi)存最優(yōu)的方案。在我們的測算下,靜態(tài)可以給予相比主流框架 10% 到 20% 的提升。同時(shí)我們支持動(dòng)態(tài)內(nèi)存管理,可以把尺寸可變的內(nèi)存有效管理起來。

深度優(yōu)化器可以有效解決在內(nèi)存比較小的設(shè)備上進(jìn)行大規(guī)模模型訓(xùn)練的問題。 

最底層我們實(shí)現(xiàn)了一整套的計(jì)算內(nèi)核層,實(shí)現(xiàn)一套高性能的算子,可以實(shí)現(xiàn)跨設(shè)備異構(gòu)計(jì)算的統(tǒng)一接口,可以支持 X86、CUDA、ARM 和 ASIC 的設(shè)備,包括高性能異構(gòu)通信庫,支撐大規(guī)模分布式訓(xùn)練的需求。

深度學(xué)習(xí)框架天元非常重要、核心的特性就是可以同時(shí)在同一個(gè)框架內(nèi)訓(xùn)練、量化、推理。

曠視是全球領(lǐng)先的人工智能產(chǎn)品和解決方案公司,既做人工智能方面的技術(shù)研究,同時(shí)也有非常強(qiáng)烈的需求把最新的成果變成每個(gè)人都可以獲得的產(chǎn)品。所以我們?cè)谠O(shè)計(jì)框架之初就有非常強(qiáng)烈的想法,把訓(xùn)練和推理在同一個(gè)框架內(nèi)解決。

現(xiàn)在我們發(fā)現(xiàn)它有非常大的好處,比如說能夠?qū)崿F(xiàn)一次訓(xùn)練多端部署,能實(shí)現(xiàn)從訓(xùn)練到量化到推理的完整解決方案,可以支持各種主流量化范式,特別是量化感知訓(xùn)練,可以在精度幾乎無損失的情況下進(jìn)行低精度模型的生產(chǎn),同時(shí)保持最好的性能。 

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

訓(xùn)練、推理、量化放在一起,不需要復(fù)雜的模型轉(zhuǎn)化,不需要其它中間工具輔助,還可以借助這樣的機(jī)制,在整個(gè)流程中嵌入自動(dòng)模型優(yōu)化手段,極大加速從原始算法到產(chǎn)品生成的流程。

曠視發(fā)現(xiàn),靜態(tài)的計(jì)算范式和動(dòng)態(tài)范式各有長處。動(dòng)態(tài)便于科學(xué)實(shí)驗(yàn),靜態(tài)方案非常適合做生產(chǎn)部署,所以我們把靜態(tài)圖、動(dòng)態(tài)圖在同樣的范式內(nèi)整合起來。我們可以把動(dòng)態(tài)運(yùn)行的部分變成靜態(tài)運(yùn)行的部分,關(guān)掉也可以用動(dòng)態(tài)的方式執(zhí)行,可以利用動(dòng)態(tài)強(qiáng)大的表達(dá)能力和表達(dá)特性,很容易把全部的范式進(jìn)行快速的產(chǎn)品部署。我們也可以進(jìn)行混合編程,在部分結(jié)構(gòu)靈活地穿插起來。

對(duì)于現(xiàn)在的深度學(xué)習(xí)框架來說,計(jì)算速度和性能不僅在訓(xùn)練側(cè),部署側(cè)也越來越關(guān)鍵,我們可以看到,天元與主流框架訓(xùn)練時(shí)的對(duì)比,包括單卡和 8 卡的對(duì)比,都擁有明顯的性能優(yōu)勢。推理框架的性能也非常出色,有 10%、20% 甚至更多的性能提升。

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

得益于內(nèi)存方面的工作,我們不管在訓(xùn)練還是推理方面,對(duì)很多 IoT 設(shè)備、手機(jī)應(yīng)用功耗都更友好,適用面更多。

我們還有非常全面的平臺(tái)支持。Beta 版不僅包括英特爾 x86,還有 SSE、AVX、AVX512-VNNI。CUDA 支持 Maxwell、Pascal、Turing,ARM 支持 V7、V8、V8.2。天元可以實(shí)現(xiàn)更高的性能,更加靈活高效,而且可以在同一平臺(tái)上同時(shí)支持英特爾 8 和 float 32 的推理,這樣大家可以在同一個(gè)平臺(tái)上非常容易地調(diào)用自己的量化模型。

曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

天元還有一個(gè)特點(diǎn)是簡單易用。我們做開源框架,用戶是否容易上手使用非常關(guān)鍵。我們會(huì)不斷提升用戶使用體驗(yàn),完善優(yōu)化我們的文檔體系、工具體系,幫助大家快速上手。

現(xiàn)在的主流框架中,其實(shí)對(duì)于推理、量化的部分,相關(guān)介紹文章非常少,0.5.0 版本里我們完成了一整套推理部署教程,讓大家可以一步一步完成模型從訓(xùn)練到完整部署的全部過程。中間有推理性能分析工具和優(yōu)化文檔,可以看到各個(gè)算子在當(dāng)前設(shè)備上的性能,也可以幫我們發(fā)現(xiàn)當(dāng)前需要完善和提升的部分。同時(shí),我們可以提供很好的一致性,可以在 Linux、Windows、Mac、Android 甚至自己的應(yīng)用中,在一些無操作性的環(huán)境中部署和運(yùn)行。

我們提供了量化參考模型,大家可以拿到量化模型訓(xùn)練代碼以及預(yù)訓(xùn)練模型,得到具體的量化方式。同時(shí)我們有完整的對(duì)量化進(jìn)行操作解讀的方案,大家利用這樣標(biāo)準(zhǔn)化的量化方式就能夠自行對(duì)模型量化和優(yōu)化,而且使用方法非常簡單。

 曠視研究院田忠博:曠視深度學(xué)習(xí)框架天元的開源演進(jìn)  | CCF-GAIR 2020

這里我提到的是亞線性內(nèi)存優(yōu)化技術(shù),利用計(jì)算換取減少內(nèi)存的使用量。這是我們?cè)谠姓撐牡幕A(chǔ)上實(shí)現(xiàn)的一整套基于遺傳算法方案的搜索,可以通過邊界聯(lián)動(dòng)、塊的移動(dòng),在有殘差的結(jié)構(gòu)搜尋到最節(jié)省的因素,用最小的方案使得在幾乎不影響速度的情況下大幅度減少設(shè)備使用內(nèi)存。

天元框架技術(shù)生態(tài)

我們期待以更開放的心態(tài)和大家一起把項(xiàng)目做得更好,我們也在這里做了很多工作,一方面希望把自己的研究成果拿出來,比如我們建立的天元的研究中心,包括最近的圖像分類、檢測、分撥、自然語言處理和標(biāo)準(zhǔn)的量化模型,都是在使用最頻繁、最精煉的骨干網(wǎng)絡(luò)。

我們還引入新型的算法。大家知道生成式對(duì)抗網(wǎng)絡(luò),這是非常流行的方法,我們?cè)谔煸哪P椭行奶峁┝嘶?DCGAN 和 WGAN 的方式,也實(shí)現(xiàn)了 Simple Baseline 和 MSPN。

我們發(fā)表了一篇以開源為主要發(fā)布方式的論文,密集人群檢測的一些情況里,兩個(gè)人的重合非常高,以至于以前的檢測算法很難檢出,新的算法則可以把重疊嚴(yán)重的人體檢測出來,這樣的代碼也會(huì)通過天元發(fā)布出來。我們希望構(gòu)建學(xué)術(shù)方面的影響力,可以幫助大家更好地認(rèn)識(shí)天元和天元生態(tài),也希望大家和我們一起做這方面的學(xué)術(shù)研究。

為了方便大家使用,我們還提供了 MegStudio 開箱即用的 AI 環(huán)境,大家可以在上面注冊(cè)分配使用CPU 資源,試用我們的模型,也可以看一下天元現(xiàn)在的成熟程度和可用程度到底達(dá)到了什么樣的情況。

我們的網(wǎng)站上提供了豐富的文檔體系,包括如何做分布式訓(xùn)練,如何進(jìn)行亞線性性能的優(yōu)化,如何做模型部署,如何定制自己的算子,如何做量化,如何進(jìn)行分析以及安卓推理,包括文檔、API 文檔全部提供了中文翻譯,希望方便更多的、各個(gè)層次的開發(fā)者獲得想要的知識(shí)。

我們還在官方網(wǎng)站上提供了我們和北大的深度學(xué)習(xí)實(shí)踐系列課程,由曠視研究院院長的孫劍老師和資深研究員給大家授課,非常適合深度學(xué)習(xí)的初學(xué)者與愛好者了解這個(gè)行業(yè)的整體概況和先進(jìn)技術(shù)。我們還提供了 MegEngine使用入門課程,學(xué)習(xí) MegEngine 的使用方式。 

我們想做好天元的生態(tài),和更多合作伙伴合作。(崔)寶秋老師促成了我們和小米 MACE 的合作,另外我們也和 Tengine 合作。我們希望通過這樣的方式,更多體系內(nèi)的研究員和學(xué)生都能享受到整個(gè)開源社區(qū)給大家?guī)淼暮脰|西。

我們?cè)诮衲甑?9 月份,把第一個(gè)里程碑的版本天元 1.0 版本推給大家。我們希望天元的生態(tài)更加開放、更加完善、更加具有吸引力,希望把更多有競爭力、有吸引力的功能提供給大家,助力中國開放生態(tài)的發(fā)展。希望大家加入我們的社區(qū),和我們一起實(shí)踐天元的核心理念,共建開源社區(qū),謝謝大家。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說