1
本文作者: 李尊 | 2016-09-13 18:35 |
今天下午,在北京舉行的GTC China 2016(GPU技術(shù)大會(huì))中,英偉達(dá)深度學(xué)習(xí)研究院對(duì)CNTK中圖像識(shí)別功能進(jìn)行了簡單介紹。
首先,我們來了解下CNTK。
CNTK(Computational Network Toolkit)是由微軟研究院開發(fā)的開源計(jì)算網(wǎng)絡(luò)工具包,它通過一個(gè)有向圖對(duì)一系列的計(jì)算步驟進(jìn)行描述,也是一個(gè)統(tǒng)一的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)工具包。
CNTK的總體架構(gòu)如上圖所示,這里我們可以簡單地分幾部分進(jìn)行理解,分別是上中下和左中右兩種理解邏輯。先說上中下部分,最下面的包含IDataReader這一層可以理解為基礎(chǔ)的數(shù)據(jù)。
想象訓(xùn)練一個(gè)典當(dāng)行的學(xué)徒鑒別古董的真假,你需要先拿一些真真假假的古董讓他自己去領(lǐng)會(huì),這個(gè)就是學(xué)習(xí)的過程,也是初始數(shù)據(jù)的輸入過程。
學(xué)習(xí)的結(jié)果就是第二層包含CN的東西
可以理解為典當(dāng)行學(xué)徒通過真真假假的古董所領(lǐng)悟到大腦的知識(shí)
最上面的IExecutionEngine
其實(shí)可以理解是這個(gè)典當(dāng)行學(xué)徒的個(gè)人行為,顧客拿了一個(gè)古董,讓其鑒別其真假,這就是最上層的作用或者是意思。
其次左中右部分,最左邊是輸入的原始數(shù)據(jù),這里引入了CN Description也就是網(wǎng)絡(luò)的描述
可以理解為典當(dāng)行學(xué)徒的師傅給予的指導(dǎo)性意見或者是古董鑒別教科書
而Features&Labels中的Features就是樣本或者古董,Labels可以理解是古董樣本上標(biāo)明真真假假的標(biāo)簽
中間的是ICNBuilder是學(xué)習(xí)的行為的驅(qū)使,IDataReader是仔細(xì)觀察并且檢驗(yàn)所學(xué)內(nèi)容的行為的驅(qū)使。最右邊的ILeaner是學(xué)習(xí)方法,CN之前解釋過了是學(xué)習(xí)的成果,IExecutionEngine也就是最終拿來真正東西進(jìn)行檢驗(yàn)的行為。
可以說CNTK的總體架構(gòu),描述了一個(gè)典當(dāng)行學(xué)徒的從入門到精通的學(xué)習(xí)過程。從樣本訓(xùn)練自己,形成自己的能力,然后使用其所學(xué)。
根據(jù)研究人員的描述,由于具備更為優(yōu)秀的交互能力,CNTK工具包中圖像識(shí)別速度比另外四個(gè)當(dāng)下主流的計(jì)算工具包都更加受開發(fā)者的歡迎。
在微軟最新發(fā)布的CNTK1.7版本中,CNTK已經(jīng)支持英偉達(dá)的最新的深度神經(jīng)網(wǎng)絡(luò)資料庫cuDNN5.1。
其實(shí)在Facebook、百度等巨頭的人工智能研究中,經(jīng)常用到英偉達(dá)的GPU。
Facebook的Big Sur服務(wù)器是圍繞本來為圖片處理而開發(fā)的大功率處理器——GPU來設(shè)計(jì)的。每8個(gè)GPU就配置一臺(tái)Big Sur服務(wù)器,F(xiàn)acebook使用的正是擅長于圖像識(shí)別的英偉達(dá)制造的GPU。
百度將把英偉達(dá)的GPU應(yīng)用到其無人駕駛系統(tǒng)的車載電腦中。這臺(tái)電腦可以解決汽車廠商在融合無人駕駛技術(shù)時(shí)面臨的一大問題:如何將人工智能技術(shù)集成到緊湊的電腦中,從而幫助汽車制定決策。除了為無人駕駛、以及深度學(xué)習(xí)的復(fù)雜計(jì)算提供強(qiáng)勁性能支持外,它還能夠同時(shí)驅(qū)動(dòng)多個(gè)高分辨率的顯示設(shè)備,應(yīng)用于智能汽車中的儀表盤、地圖導(dǎo)航、車載中控面板等。
幾乎所有巨頭都在依靠強(qiáng)大的圖形處理單元(GPUs)來進(jìn)行深度學(xué)習(xí)應(yīng)用,從而處理更為復(fù)雜的算法,能提高人工智能和識(shí)別能力,微軟在此方面也不甘落后。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。