0
本文作者: AI研習社 | 2020-04-08 17:14 |
隨著深度學習的發(fā)展,神經(jīng)網(wǎng)絡被廣泛應用于各種領域,模型性能的提高同時也引入了巨大的參數(shù)量和計算量。模型量化是一種將浮點計算轉成低比特定點計算的技術,可以有效的降低模型計算強度、參數(shù)大小和內(nèi)存消耗,但往往帶來巨大的精度損失。尤其是在極低比特(<4bit)、二值網(wǎng)絡(1bit)、甚至將梯度進行量化時,帶來的精度挑戰(zhàn)更大。
本次直播,我們邀請了商湯研究院--鏈接與編譯團隊的兩位研究員,分享團隊在模型量化方面的的一系列研究工作,其中包含CVPR 2020、ICCV 2019等多篇與北航劉祥龍老師團隊合作的論文成果。
一、課程信息
主題:如何做模型量化,訓練極低比特網(wǎng)絡
時間:4月9日(周四)20:00-21:00
觀看鏈接:↓↓↓
http://www.mooc.ai/open/course/786?from=leiphonecolumn_mooc0408
二、分享提綱
1、如何訓練極低比特(<4bit)的網(wǎng)絡
2、如何訓練高效的二值化網(wǎng)絡
3、如何用量化技術來加速模型訓練
4、模型量化在實際場景的落地
5、模型量化與網(wǎng)絡結構搜索結合
三、嘉賓介紹
余鋒偉
商湯科技研究院高級研究員
鏈接與編譯組負責人
余鋒偉研究員本碩畢業(yè)于北京航空航天大學計算機學院。曾獲得MOT16視頻多目標跟蹤冠軍,ASC世界大學生超級計算機競賽一等獎,華為獎學金,研究生國家獎學金等。現(xiàn)作為內(nèi)部開源技術中臺的架構師之一,負責訓練加速、自動模型部署、模型量化、神經(jīng)網(wǎng)絡編譯器等技術的研發(fā)和落地。在ECCV、ICCV、CVPR、ICLR上共發(fā)表5篇論文。
龔睿昊
商湯科技研究院見習研究員
鏈接與編譯組成員
龔睿昊同學曾獲得商湯科技未來之星、CCF優(yōu)秀大學生、北京市三好學生、國家獎學金等?,F(xiàn)主要研究方向為深度學習模型的量化加速技術,在ICCV、CVPR、ICLR、PR等期刊會議上發(fā)表6篇論文(其中1篇一作,4篇二作),期間負責量化框架的設計和開發(fā),支持量化模型在多業(yè)務線項目落地。
四、直播報名
掃碼添加AI研習社頂會小助手(AIyanxishe2)微信好友備注“論文解讀+量化”后進入報名微信群,獲取課件和直播間地址
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。