深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

本文作者：圖普科技

編輯：谷磊

2017-07-04 12:58

導(dǎo)語(yǔ)：本文將從卷積神經(jīng)網(wǎng)絡(luò)的角度討論深度學(xué)習(xí)

雷鋒網(wǎng)按：本文由圖普科技編譯自《Medical Image Analysis with Deep Learning Part3》，是最近發(fā)表的《深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（二）》的后續(xù)文章。雷鋒網(wǎng)獨(dú)家首發(fā)。

本文將從卷積神經(jīng)網(wǎng)絡(luò)的角度討論深度學(xué)習(xí)。在本文中，我們將使用Keras和Theano，重點(diǎn)關(guān)注深度學(xué)習(xí)的基本原理。本文將展示兩個(gè)例子——其中一個(gè)例子使用Keras進(jìn)行基本的預(yù)測(cè)分析，另外一個(gè)使用VGG進(jìn)行圖像分析。

我們談?wù)摰脑掝}其實(shí)是相當(dāng)廣泛和深入的，需要更多的文章進(jìn)行探討。在接下來(lái)的一些文章中，我們將會(huì)討論醫(yī)學(xué)影像中DICOM和NIFTI格式之間的不同，并且研究如何使用深度學(xué)習(xí)進(jìn)行2D肺分割分析。除此之外，我們還將討論在沒(méi)有深度學(xué)習(xí)時(shí)，醫(yī)學(xué)圖像分析是如何進(jìn)行的；以及我們現(xiàn)在如何使用深度學(xué)習(xí)進(jìn)行醫(yī)學(xué)圖像分析。在這里，我非常歡迎和感謝我的新伙伴Flavio Trolese——4Quant的聯(lián)合創(chuàng)始人和ETH Zurich的講師——他將協(xié)助我整合所有討論的內(nèi)容。

在本文中，我們將討論Keras并且展示兩個(gè)示例——其中一個(gè)使用Keras完成簡(jiǎn)單的預(yù)測(cè)性分析任務(wù)，另一個(gè)進(jìn)行圖像分析。

何為Keras？

根據(jù)Keras官網(wǎng)的介紹，Keras是Theanos和Tensor Flow的一個(gè)深度學(xué)習(xí)庫(kù)。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

運(yùn)行于Theano和TensorFlow之上的Keras api

Keras是一個(gè)高級(jí)Python神經(jīng)網(wǎng)絡(luò)API，它能夠運(yùn)行于TensorFlow和Theano之上。Keras的開(kāi)發(fā)重點(diǎn)在于支持快速實(shí)驗(yàn)。

何為Theano和Tensor Flow？

James Bergstra教授等人在2010年的Scipy曾說(shuō)，Theano是一個(gè)CPU和GPU的數(shù)學(xué)表達(dá)式編譯器。換句話來(lái)說(shuō)，Theano是一個(gè)能夠讓你高效地對(duì)數(shù)學(xué)表達(dá)式進(jìn)行定義、優(yōu)化和評(píng)估的Python學(xué)習(xí)庫(kù)。Theano是由一些高級(jí)研究人員，如Yoshua Bengio，和“蒙特羅學(xué)習(xí)算法研究所”（MILA）共同研發(fā)的。下圖是發(fā)布于2010年Scipy上的Theano教程，圖中對(duì)比了Theano下的GPU和CPU與當(dāng)年其他的工具。這張圖片發(fā)表于原創(chuàng)論文——《Theano——CPU和GPU的Python數(shù)學(xué)編譯器》。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

《Theano——CPU和GPU的Python數(shù)學(xué)編譯器》作者：James Bergstra, Olivier Breuleux, Frédéric Bastien, Pascal Lamblin, Razvan Pascanu, Guillaume Desjardins,Joseph Turian, David Warde-Farley, Yoshua Bengio

建立在Theano之上的還有一些其他的深度學(xué)習(xí)庫(kù)，包括Pylearn2、GroundHog（同樣是由MILA開(kāi)發(fā)的）、Lasagne和Blocks and Fuel等。

《使用Theano計(jì)算的透明GPU》——James Bergstra

TensorFlow是由“谷歌機(jī)器智能研究所”組織下的“谷歌大腦”團(tuán)隊(duì)研發(fā)完成的。TensorFlow的開(kāi)發(fā)是為了進(jìn)行機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)的研究，除此之外，它還廣泛適用于其他的領(lǐng)域。根據(jù)TensorFlow官網(wǎng)介紹，TensorFlow是一個(gè)使用數(shù)據(jù)流圖表進(jìn)行數(shù)值計(jì)算的開(kāi)源軟件庫(kù)。圖表中的節(jié)點(diǎn)代表數(shù)學(xué)運(yùn)算，而表格邊緣則代表溝通節(jié)點(diǎn)的多維數(shù)據(jù)數(shù)組（tensors）。其中的代碼視覺(jué)上正如下圖所展示的：

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

圖片來(lái)源：《TensorFlow：異構(gòu)分布系統(tǒng)上的大規(guī)模機(jī)器學(xué)習(xí)》

使用Keras進(jìn)行預(yù)測(cè)性分析的示例

在本文中，我們將使用來(lái)自UCI網(wǎng)站的Sonar數(shù)據(jù)集來(lái)完成一個(gè)簡(jiǎn)單的預(yù)測(cè)模型示例。在下面的代碼中，我們直接從UCI網(wǎng)站獲取數(shù)據(jù)，并將這些數(shù)據(jù)按照60：:40的比例分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。我們使用Keras進(jìn)行預(yù)測(cè)建模，使用sklearn對(duì)標(biāo)簽進(jìn)行編碼。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

在下一個(gè)代碼片段中，我們使用之前定義好的函數(shù)來(lái)讀取數(shù)據(jù)集中的數(shù)據(jù)。打印數(shù)據(jù)集之后，我們會(huì)發(fā)現(xiàn)我們的獨(dú)立變量是需要進(jìn)行編碼的。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

我們使用來(lái)自Scikit-learn的LabelEncoder（標(biāo)簽編碼器）對(duì)標(biāo)簽進(jìn)行編碼，將字母R和M分貝轉(zhuǎn)換為數(shù)字0和1。一種熱編碼還將分類特征轉(zhuǎn)換成為了一種與算法更合適的格式。在這個(gè)示例中，我們的Y變量與R和M一樣是分類對(duì)象，使用標(biāo)簽編碼器，我們將這些字母變量轉(zhuǎn)換為了1或0。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

Scikit-learn的標(biāo)簽編碼器

之后，我們創(chuàng)建了一個(gè)使用Keras的模型：

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

在沒(méi)有任何預(yù)處理操作的情況下，使用簡(jiǎn)單模型的準(zhǔn)確度為81.64%

使用Keras進(jìn)行圖像分析的示例

為了更好地用Keras解釋圖像處理過(guò)程，我們將使用來(lái)自“Kaggle貓狗競(jìng)賽”的數(shù)據(jù)。這個(gè)競(jìng)賽的目的是開(kāi)發(fā)一個(gè)能夠用來(lái)區(qū)分圖像中包含的是一只狗還是一只貓的算法。對(duì)于人類來(lái)說(shuō)，區(qū)分貓狗是很簡(jiǎn)單的，但對(duì)于計(jì)算機(jī)來(lái)說(shuō)可就復(fù)雜的多了。在這項(xiàng)“區(qū)分貓狗”的挑戰(zhàn)中，有25000張標(biāo)記了貓狗的訓(xùn)練圖片，測(cè)試數(shù)據(jù)庫(kù)中還有12500張等著我們?nèi)?biāo)記。根據(jù)Kaggle官網(wǎng)，當(dāng)這個(gè)競(jìng)賽開(kāi)始時(shí)（2013年年底）：

“目前的文獻(xiàn)表明，機(jī)器分類器在這個(gè)任務(wù)上的準(zhǔn)確度能達(dá)到80%以上?！币虼?，如果我們能成功突破80%的準(zhǔn)確度，我們就能躍居2013年的技術(shù)發(fā)展最前沿。

想要了解更多細(xì)節(jié)、進(jìn)行下一步的學(xué)習(xí)或?qū)ι疃葘W(xué)習(xí)進(jìn)行尖端研究，我強(qiáng)烈推薦Fast.ai的網(wǎng)絡(luò)公開(kāi)課程。我在下面的代碼中引用了fast.ai，它為我們的學(xué)習(xí)提供了一個(gè)很好的起點(diǎn)。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

第一步：完成設(shè)置

從Kaggle網(wǎng)站上下載貓、狗的圖片數(shù)據(jù)，將其保存在你的電腦上。在本文提到的示例中，我會(huì)在我的iMac電腦上運(yùn)行代碼。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

基本的設(shè)置

Jeremy Howard提供了一個(gè)Python實(shí)用文件，幫助我們獲取已封裝的基礎(chǔ)函數(shù)。我們要做的第一步就是使用這個(gè)實(shí)用文件。下圖就是這個(gè)實(shí)用文件。隨著細(xì)節(jié)的深入，我們將一步步打開(kāi)這個(gè)文件，看看隱藏在文件背后的信息。

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

第二步：使用VGG

我們?cè)诘谝徊街泻?jiǎn)單地使用了一個(gè)完全為我們建立的模型，這個(gè)模型能夠識(shí)別各種各樣的圖像。第二步，我們將使用VGG。VGG是一個(gè)非常容易創(chuàng)建和理解的模型，它贏得了2014年的“ImageNet挑戰(zhàn)賽”。VGG imagenet團(tuán)隊(duì)創(chuàng)建了兩個(gè)模型——VGG 19和VGG 16。VGG 19是一個(gè)大型的、操作性能慢的、準(zhǔn)確度稍佳的模型；而VGG 16是一個(gè)小型的、操作性能快的模型。我們將會(huì)使用VGG 16，因?yàn)閂GG 19的操作性能比較慢，通常不值得在精確度上再做改進(jìn)。

我們建立了一個(gè)Python類——Vgg16。Vgg16能讓VGG 16模型的使用更加簡(jiǎn)單。在fast.ai的github上同樣能找到Vgg16，具體細(xì)節(jié)如下圖：

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

第三步：實(shí)例化VGG

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）

Vgg16建立于Keras（我們將在稍后討論更多關(guān)于Keras的內(nèi)容）之上。Keras是一個(gè)靈活的、易于使用的、建立在Theano和TensorFlow上的深度學(xué)習(xí)庫(kù)。Keras使用一個(gè)固定的目錄結(jié)構(gòu)來(lái)分批查看大量的圖像和標(biāo)簽，在這個(gè)目錄結(jié)構(gòu)下，每一類訓(xùn)練圖像都必須放置在單獨(dú)的文件夾里。

下面是我們從文件夾中隨意抓取的數(shù)據(jù)：

深度學(xué)習(xí)下的醫(yī)學(xué)圖像分析（三）