0
曠視研究院聯(lián)合北京大學數(shù)學科學學院機器學習實驗室開設的《深度學習實踐》全套課程(視頻+PPT,共計28課時)今日在AI研習社正式全面上線,讓你足不出戶也能享有高水平的教學資源。
“與其疫情宅家玩游戲,不如家里蹲大學把課上?!币咔槠陂g,我們每日聽到的最多的信息之一可能就是號召大家在線堅持學習。不過,在左有“名師授課”、右有“速成深度學習”,多重信息的圍攻之下,大部分人最終還是選擇了那條無數(shù)“英雄”選擇的道路——“收藏+下次一定”,重回電子虛擬世界,麻痹自己,蹉跎人生。
怎么辦?曠視研究院為你支招!
今日,曠視研究院聯(lián)合北京大學數(shù)學科學學院機器學習實驗室開設的《深度學習實踐》全套課程(視頻+PPT,共計28課時)全面向社會免費開放!從深度學習基礎理論到計算機視覺實踐,由曠視首席科學家兼研究院長孫劍,及身經(jīng)百戰(zhàn)的研發(fā)總監(jiān)、資深研究員親身授課,真正將高水平深度學習課程帶給大家。知識全面、循循善誘、透徹又不枯燥是本課程最大的特點。
《深度學習實踐》是曠視研究院聯(lián)合頂尖高校開設的系列深度學習精品課程之一。作為曠視的研發(fā)中心,曠視研究院一直基于自研的人工智能算法平臺Brain++和深度學習框架MegEngine開展最前沿學術(shù)、產(chǎn)業(yè)技術(shù)研究、交流,累計收獲27項世界冠軍;并實現(xiàn)在個人物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)、供應鏈物聯(lián)網(wǎng)三大領域的應用落地。值得一提的是,曠視后續(xù)將對Brain++及其核心框架、平臺進行開源、開放,強大的算力、SOTA模型、框架資源任你用,敬請期待~
此次課程錄制于2017年秋季曠視研究院在北京大學授課期間,已連續(xù)開設3年,后續(xù)將開放更多精彩課程供同學們學習、研究。
課程大綱
1、Lecture 1(Intro of CV and DL)
本節(jié)課是一堂入門性的概述課程,主要通過向?qū)W生介紹計算機視覺的含義,計算機視覺的主要應用場景,以及計算機視覺從經(jīng)典方法發(fā)展到現(xiàn)在基于深度學習的方法的理路變遷來引導學生獲得對該領域的一個全局性的理解。
2、Lecture 2(Math In DL)
本節(jié)課著重介紹深度學習技術(shù)中使用的數(shù)學知識。與其它課程、書籍不同,本課程忽略了很多過分抽象、復雜且使用頻率不高的內(nèi)容,以便同學們能夠較為容易地對深度學習涉及到的核心數(shù)學知識有良好掌握。
3、Lecture 3(Network Basics & Architecture Design)
本節(jié)開始正式介紹深度神經(jīng)網(wǎng)絡相關的基礎知識。在神經(jīng)網(wǎng)絡基礎介紹中,講者從視覺識別的困難切入,逐步深入分析了神經(jīng)網(wǎng)絡架構(gòu)的特點以及訓練優(yōu)化方法。進一步,課程還介紹了網(wǎng)絡架構(gòu)設計的具體細節(jié)。
4、Lecture 4(Computation Technology)
本課程介紹深度學習涉及的計算技術(shù),包含人們常用的深度學習框架背后實現(xiàn)的思想與原理;如何在現(xiàn)有如CPU、GPU的構(gòu)架下,實現(xiàn)快速數(shù)學計算;以及在分布式深度學習中的通信與優(yōu)化技術(shù)。
5、Lecture 5(Neural Network Approximation)
本課程介紹神經(jīng)網(wǎng)絡壓縮技術(shù)。眾所周知,一個真正有效地神經(jīng)網(wǎng)絡在訓練和推理過程中往往需要消耗高額的計算成本,如何更快、更高效地讓其進行工作就成了技術(shù)落地的關鍵。本課程從三個方面:低質(zhì)、稀疏與量化逐一介紹了神經(jīng)網(wǎng)絡壓縮技術(shù)。
6、Lecture 6(Modern Object Detection)
本課程介紹基于深度學習的物體檢測技術(shù)。物體檢測技術(shù)不要求系統(tǒng)精準識別某個物體的具體屬性,例如這輛車是保時捷 911,而是讓系統(tǒng)能夠在畫面中識別出所有被稱為車的物體,即(Category-level Recognition,而非Instance-level Recognition),本課將對此展開介紹。
7、Lecture 7(Text Detection and Recognition)
本課程介紹了近年來場景文字檢測與識別中的進展,以及曠視在該領域的工作與成果。具體而言,分為文字識別任務的背景與經(jīng)典方法回顧、近來基于深度學習的技術(shù)進展。需要強調(diào)的是在第三部分。課程重點介紹了文字識別任務的數(shù)據(jù)集與比賽。
8、Lecture 8(Image Segmentation)
當前,越來越多的應用場景需要精確且高效的圖像理解能力,如自動駕駛、室內(nèi)導航、甚至虛擬現(xiàn)實與增強現(xiàn)實等,圖像分割技術(shù)就是實現(xiàn)這一切的關鍵技術(shù)之一。本課程介紹了圖像分割中語義分割與實例分割技術(shù)的具體細節(jié)。
9、Lecture 9(Recurrent Neural Networks)
本課程從循環(huán)神經(jīng)網(wǎng)絡(RNN)的基礎到前言應用進行了介紹。作為圖靈完備的模型,循環(huán)神經(jīng)網(wǎng)絡相較于卷積神經(jīng)網(wǎng)絡能夠做更復雜的工作。從課程設置來看,在介紹了RNN基礎之后,課程會討論部分經(jīng)典RNN架構(gòu),如LSTM、有Attention的RNN和有External Memory的RNN。
10、Lecture 10 (Introduction to Generative Models)
本課程介紹生成式模型的基本概念與發(fā)展現(xiàn)狀,同時也針對其背后的數(shù)學原理進行細致剖析。生成式模型是概率統(tǒng)計與機器學習中的一類重要模型,指一系列用于隨機生成可觀測數(shù)據(jù)的模型,應用十分廣泛,可用來自不同的數(shù)據(jù)進行建模。
11、Lecture 11(Person Re-Identification)
本節(jié)課程著重于對行人重識別技術(shù)的解讀。作為圖像檢索領域的一個重要子問題,行人重識有著重要應用價值。為了幫助學生更好理解,課程以人臉識別為例,通過分析其與行人重識別的區(qū)別之處來向?qū)W生介紹后者。進一步,課程還介紹了如何依據(jù)一些額外時空信息來輔助開展行人重識別工作。
12、Lecture 12 (Shape from X)
本課程介紹3D重建,即研究如何用視覺的方法來獲得3維信息。具體而言,課程介紹了多種傳統(tǒng)建構(gòu)物體形狀的方法,與之相對應的,基于神經(jīng)網(wǎng)絡的3D重建在靈活性與效果上都有著顯著優(yōu)勢。
13、Lecture 13(Visual Object Tracking)
本課程介紹目標跟蹤技術(shù),由于不同種類的目標跟蹤任務的假設可能有巨大不同,所以本課程首先會介紹運動估計,然后分別專門介紹單目標跟蹤與多目標跟蹤。最后,講者對一些特殊且重要的情形(如快速運動、多個攝像頭)進行了分析。
14、Lecture 14(Neural Network in Computer Graphics)
本課程介紹計算機圖形學中的神經(jīng)網(wǎng)絡。具體而言,首先介紹了計算機圖形學的含義,與基本情況。進一步,對引入其中的神經(jīng)網(wǎng)絡技術(shù)進行專項解讀,涉及用神經(jīng)網(wǎng)絡進行渲染、進行3D建模以及visual media retouching。最后,課程介紹了如何將圖形學技術(shù)應用到計算機視覺問題之中。
更多信息
課程傳送門:
添加小助手,加入線上交流群:
最后講個真實的故事
1665年,牛頓在劍橋三一學院就讀期間,倫敦發(fā)生大瘟疫,造成數(shù)萬人死亡。牛頓回家自我隔離,親戚也不走,聚會也不去。
但正是這段清浄的時間,讓他有機會思考數(shù)學、光學、力學的問題,碩果累累,成功創(chuàng)立了二項式定理和光的分解,確立了牛頓第一、第二定律和引力定律的基本思想……
恩?仿佛聽到有人在談論我?
祝大家身體健康,少出門、多運動,提高免疫力的同時也不要忘了加倍努力學習思考哦~
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。