0
雷鋒網(wǎng)AI研習社按:計算機視覺是一門研究如何使機器“看”的科學,掌握解決具體計算機視覺任務的方法則會幫助我們解決大規(guī)模系統(tǒng)的復雜問題,其應用相當廣泛,最常見的如人臉識別,文字識別等等。這篇文章就來為大家從頭普及一下計算機視覺相關知識,包括計算機視覺的定義、研究方法和應用舉例,還會重點介紹深度學習歷史發(fā)展歷史,常見深度學習網(wǎng)絡介紹和開發(fā)平臺,幫助計算機視覺入門者和從業(yè)者進行有效的基礎夯實和系統(tǒng)梳理。
近日,在雷鋒網(wǎng)AI研習社舉辦的線上直播課上,來自上海交通大學的盧憲凱博士為大家分享了計算機視覺領域的入門知識。這也是盧博士CV系列課線上直播的第一期,后期會陸續(xù)由淺入深,為關注AI研習社的小伙伴持們續(xù)產(chǎn)出干貨,歡迎訂閱盧憲凱博士的免費直播課。
盧憲凱,上海交通大學博士,主要研究方向是目標跟蹤與深度學習。在多個計算機視覺期刊會議上發(fā)表多篇學術論文,包括IEEE Transaction on Multimedia、MTA、Neurocomputing、ICASSP。
分享內(nèi)容
計算機視覺定義和研究方法
計算機視覺的應用舉例:圖像分類,人臉識別;車輛檢測,行人檢測;語義分割,實例分割;目標跟蹤,視頻分割;圖像生成,視頻生成
深度學習歷史回顧
常見深度學習網(wǎng)絡介紹和開發(fā)平臺
計算機視覺概述和深度學習簡介
計算機視覺是指從圖像和視頻中提出數(shù)值或符合信息的計算系統(tǒng)。更形象一點講就是說,計算機視覺是讓計算機具備像人類一樣的眼睛,看到圖像,并理解圖像。
人類的視覺首先是通過眼睛看到一幅圖片,大腦來理解這個圖片。對于計算機來說,就會通過攝像頭或攝像機獲取這張圖片,然后利用計算機算法來看圖片,讀取信息。
計算機視覺最核心部分就是理解。第一步是提供數(shù)據(jù),包括靜態(tài)圖片,視頻。第二步是設計算法,讓計算機像人的大腦一樣理解數(shù)據(jù),這個過程需要機器學習和算法,或者現(xiàn)在比較火的神經(jīng)網(wǎng)路深度學習的方法。計算機視覺歸根結底就是做一個回歸或者分類的問題。后面講到的大部分關于計算機視覺的任務都可以用回歸或分類的問題對它建模。
計算機視覺非常重要的應用之一就是圖像分類。李飛飛創(chuàng)建的ImageNet數(shù)據(jù)集極大推動了計算機視覺的發(fā)展,也讓大家更理解了計算機視覺對大家的生活是起著非常重要的作用。
除了圖像識別任務外,還有特定目標的識別,比如車牌識別,人臉識別,還有比較精細的識別,年齡,性別,是否戴眼鏡,表情的識別,判斷一個人是否笑了。
計算機視覺里的第二個任務——目標檢測。目標檢測是在給定一個圖像,把我感興趣的前景目標檢測出來,并添加類別。目標檢測是頭像識別的進一步發(fā)展。目標檢測要知道圖片中有哪些類別,還有知道他們的位置。
行人檢測和車輛檢測。對人群密集處的檢測,對將來可能發(fā)生的異常事件起到預警作用。右邊的車輛檢測,可以統(tǒng)計車輛個數(shù),實時估計車流密度,這樣的話對于疏解城市交通是非常有幫助的。這兩個是做目標檢測中的兩個細化應用。
計算機視覺的第三個任務分割。分割包括兩種,圖像語義分割和個體分割。圖像語義分割是指給你一個張圖片,把圖中的物體分割開來。個體分割比語義分割更難,相當于在檢測任務上加上了分割。
視覺目標跟蹤,也有很多廣泛應用。如果拓展到多目標跟蹤,可應用在候機大廳或商場里面,對每個人實時跟蹤,建立每一個人的軌跡,比如某人突然和另一個人有了交互,就可判斷是否在打架。
還可應用在自動駕駛上面,比如前置攝像頭拍到前面的幾輛車,實時跟蹤,并計算出當前車與前車的距離。
視頻分割,前置攝像頭拍出街景照片,可用于無人駕駛。
視頻生成,有了當前幀可以預測下一幀,再結合攝像頭得到下一幀的樣子??梢詼p少計算資源消耗。
深度學習簡介
這幾年計算機視覺已經(jīng)和深度學習變得密不可分。計算機視覺研究已經(jīng)有很多有趣應用,比如圖像風格遷移。
生成對抗網(wǎng)絡(GAN)的有趣應用,比如可以將女性臉龐逐漸演化為男性臉龐。
直播換臉的應用
深度學習在人臉識別的應用。目前利用深度學習在LFW數(shù)據(jù)庫訓練人臉識別,錯誤率5%下降到0.5%
后期的課程會詳細介紹這幾個網(wǎng)絡VGGNet, GoogLeNet ,ResNet ,DenseNet。
常見的深度學習開發(fā)平臺
以上是計算機視覺系統(tǒng)課程的第一課,簡單介紹了一下計算機視覺的圖像識別,目標檢測,圖像和視頻分割,目標追蹤,圖像和視頻生成的一些常見應用,接下來盧憲凱博士還會結合深度學習講解實現(xiàn)這些任務需要的算法,模型以及實戰(zhàn)應用。下一次直播課程是深度卷積網(wǎng)絡的原理及模型介紹,以及如何搭建和訓練一個深度學習網(wǎng)絡。
雷鋒網(wǎng)提示:如想在第一時間獲取課程直播預告時間,請關注微信公眾號:AI研習社。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。