0
2019年8月24-26日,第三屆圖像計(jì)算與數(shù)字醫(yī)學(xué)國際研討會(huì)(ISICDM 2019),在西安索菲特酒店召開。研討會(huì)由國際數(shù)字醫(yī)學(xué)會(huì)與國家天元數(shù)學(xué)西北中心聯(lián)合主辦,西安電子科技大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院與空軍軍醫(yī)大學(xué)(第四軍醫(yī)大學(xué))生物醫(yī)學(xué)工程學(xué)院聯(lián)合承辦。
雷鋒網(wǎng)&AI掘金志第三次作為大會(huì)首席合作媒體,全程參與ISICDM的報(bào)道。
在8月24日上午的數(shù)字醫(yī)學(xué)與智能診療分會(huì)上,復(fù)旦大學(xué)的宋志堅(jiān)發(fā)表了題為《深度學(xué)習(xí)用于計(jì)算機(jī)輔助診斷與治療:面臨的問題、機(jī)遇與挑戰(zhàn)》的演講。
宋志堅(jiān)教授是復(fù)旦大學(xué)特聘教授、數(shù)字醫(yī)學(xué)研究中心主任、上海市MICCAI(Medical Image Computing and Computer Assisted Intervention )重點(diǎn)實(shí)驗(yàn)室主任。
在演講中,宋教授分享了團(tuán)隊(duì)在前列腺mpMRI(多參數(shù)磁共振)診斷、臨床數(shù)據(jù)增強(qiáng)以及頭頸部放療危險(xiǎn)部位分割的成果。
以mpMRI診斷為例,因?yàn)閿?shù)據(jù)量和特異性的問題,判斷前列腺癌是否具有臨床顯著性風(fēng)險(xiǎn),這是一個(gè)非常大的臨床需求。宋教授的團(tuán)隊(duì)建立了一個(gè)專門用于前列腺癌診斷的網(wǎng)絡(luò)架構(gòu),成績連續(xù)八個(gè)月在ProstateX Grand Challenge排在第一。
此外,宋教授還就AI在醫(yī)療領(lǐng)域的前景發(fā)表了自己的看法:“從經(jīng)濟(jì)角度來看,自第三次工業(yè)革命以來,新的創(chuàng)造財(cái)富的科技動(dòng)力還沒有真正到來,大家均在期盼第四次工業(yè)革命為人們帶來新的機(jī)遇和發(fā)展動(dòng)力?!?/p>
其中就包含了對(duì)人工智能所寄予的希望,深度學(xué)習(xí)是人工智能的核心技術(shù)之一。但是,目前深度學(xué)習(xí)還存在四個(gè)方面的問題(尤其是在醫(yī)學(xué)上的應(yīng)用):個(gè)別輿論宣傳偏離了科學(xué)本身、監(jiān)管政策、黑箱問題、隱私與黑客攻擊以及數(shù)據(jù)的數(shù)量與質(zhì)量。
以下是宋志堅(jiān)教授的演講內(nèi)容,雷鋒網(wǎng)作了不改變?cè)獾木庉?/strong>
宋志堅(jiān):我本人是從事手術(shù)導(dǎo)航、手術(shù)機(jī)器人領(lǐng)域研究的人員。這幾年,人工智能尤其是深度學(xué)習(xí)得到了廣泛應(yīng)用,我們也開展了一些這方面的研究工作,今天想結(jié)合我們實(shí)驗(yàn)室工作的具體工作,和大家交流一下深度學(xué)習(xí)給醫(yī)學(xué)診斷和治療帶來的機(jī)遇及其存在問題。
大家都知道,要讓計(jì)算機(jī)為我們?nèi)祟惞ぷ鳎瑤椭覀兘鉀Q問題,大致可以分為兩個(gè)思路。
第一個(gè)是人工建模的思路,這種思路的步驟是首先提出問題,然后對(duì)問題進(jìn)行深入的分析和探討,在這個(gè)基礎(chǔ)上提出算法,然后再根據(jù)算法來進(jìn)行編程。
另外一種思路就是機(jī)器學(xué)習(xí)方法,它也是人工建模,最典型的就是神經(jīng)網(wǎng)絡(luò),但是人工僅建一半的模型,剩下的一半模型,例如神經(jīng)網(wǎng)絡(luò)的參數(shù)不是人工確定的,而是通過對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練而獲得,亦即,根據(jù)我們希望輸出的結(jié)果和實(shí)際結(jié)果的差異,經(jīng)過反復(fù)迭代而最終將網(wǎng)絡(luò)參數(shù)確定下來。
如果網(wǎng)絡(luò)的隱層很多,一般稱之為深度學(xué)習(xí)網(wǎng)絡(luò)。這幾年深度學(xué)習(xí)的發(fā)展很快,它能解決許多非線性的問題。
以往我們靠人工建模較難以解決的問題,現(xiàn)在通過深度學(xué)習(xí)很可能可以取得很大的進(jìn)展。也就是說,深度學(xué)習(xí)給我們帶來了許多機(jī)遇。
牛津大學(xué)的科研人員進(jìn)行了一個(gè)評(píng)估,今后幾年哪些工作有可能會(huì)被人工智能所替代。其中與我們醫(yī)務(wù)人員最相關(guān)的就是外科醫(yī)生,從2016年算起,35年左右就有可能會(huì)被人工智能所替代(文章并未詳細(xì)說明替代到什么程度)。
近年來,深度學(xué)習(xí)在醫(yī)學(xué)診斷和治療方面的研究有很多,我們可以快速回顧一下這方面的進(jìn)展。
首先我們看一下人工智能在肺結(jié)節(jié)診斷方面的相關(guān)實(shí)驗(yàn),18名放射學(xué)專家有17個(gè)被人工智能超過;肺炎、心臟肥大的AUC指標(biāo)分別是0.63和0.87;3D CT 診斷在中風(fēng)方面的研究AUC達(dá)到了0.73。
而且,深度學(xué)習(xí)的診斷速度很快,是人工的150倍。
此外,還有利用深度學(xué)習(xí)對(duì)基因組學(xué)進(jìn)行研究的案例。
在皮膚病方面,皮膚癌的診斷準(zhǔn)確度達(dá)到0.96,黑素瘤方面達(dá)到了0.94。這方面的研究很普遍,進(jìn)展也很快。上面這個(gè)是很典型的基因組學(xué)的網(wǎng)絡(luò)結(jié)構(gòu),由于時(shí)間關(guān)系就不展開描述了。
這個(gè)是電子病歷,它將影像學(xué)、基因組學(xué)還有電子病歷作為輸入和訓(xùn)練對(duì)象,所建立的網(wǎng)絡(luò)可用于對(duì)疾病進(jìn)行自動(dòng)診斷。
人們對(duì)某一事物的認(rèn)識(shí)往往是通過科學(xué)實(shí)驗(yàn)或臨床實(shí)踐而來。針對(duì)深度學(xué)習(xí)在疾病診斷和治療領(lǐng)域的應(yīng)用,我們實(shí)驗(yàn)室開展了一些工作,我借助這個(gè)機(jī)會(huì)把我們的工作簡單介紹一下,具體介紹三個(gè)實(shí)例。
第一個(gè)介紹的是前列腺癌診斷的問題,判斷前列腺癌是否具有臨床顯著性風(fēng)險(xiǎn),這是一個(gè)非常大的臨床需求。
我們用的是多參數(shù)磁共振的數(shù)據(jù),因?yàn)閳D像量非常大,所以醫(yī)生診斷工作量就很大;另外一個(gè)重要原因是,醫(yī)生通過MRI對(duì)前列腺癌的診斷,和CT對(duì)肺臟、肝臟疾病的診斷不一樣,前列腺癌的特異性不是很好,診斷的難度要大一些。
所以,通過多參數(shù)磁共振圖像實(shí)現(xiàn)對(duì)前列腺癌的診斷診斷,是大家都在研究的前沿問題。
我們的整體思路是這樣:
首先,我們對(duì)前列腺癌進(jìn)行一個(gè)大致的位置確定,即預(yù)處理。
其次,我們建立一個(gè)專門用于前列腺癌診斷的網(wǎng)絡(luò)。在這個(gè)基礎(chǔ)上,我們對(duì)它進(jìn)行訓(xùn)練測試,看看它的準(zhǔn)確性,這是總體的框架。
具體而言,對(duì)每一種參數(shù)的前列腺的數(shù)據(jù),我們有一個(gè)連續(xù)卷積的過程。我們看每一個(gè)小方塊,放大以后是這樣的。我們對(duì)某一個(gè)圖像,比方說256*256的圖像,首先是3*3*64的卷積,卷積以后就形成了256×256*64個(gè)卷積。
卷積結(jié)束以后,我們?cè)龠M(jìn)行一個(gè)1*1*64的卷積的操作。這樣就把256*256*64變成了256*256*1,這是3*3的卷積,然后緊接著是一個(gè)5*5的卷積。
最后,我們把這兩個(gè)卷積連起來,再進(jìn)行一個(gè)pooling的操作。那么2*2的pooling之后,256*256就變成了128*128。
回過頭來看,假設(shè)是256*256的圖像,再是128*128*64,一直下來是一個(gè)8*8的圖像,我們把8*8圖像的每一個(gè)像素、每一個(gè)參數(shù)的卷積,結(jié)合前列腺癌的位置,把它連起來進(jìn)入全連接進(jìn)行判斷,最后可以得出一個(gè)結(jié)果。
我們用的數(shù)據(jù)集是SPIE所提供的Prostate X挑戰(zhàn)賽數(shù)據(jù)集,訓(xùn)練集利包含204名患者的330個(gè)病變,測試集包含了142名患者的208個(gè)病變。
現(xiàn)在測試下來,我們的成績連續(xù)八個(gè)月排在第一。
我認(rèn)為,最關(guān)鍵的是建立了一個(gè)專門用于前列腺癌診斷的網(wǎng)絡(luò)架構(gòu)。
我們做的第二個(gè)工作是臨床數(shù)據(jù)增強(qiáng)。
在前列腺穿刺導(dǎo)航研究當(dāng)中,首先要對(duì)前列腺進(jìn)行分割。這里面會(huì)遇到一個(gè)問題,就是臨床數(shù)據(jù)包括前列腺數(shù)據(jù)的獲取很難。此外,醫(yī)生在這方面的工作量很大。
因此我們做了一個(gè)圖像增強(qiáng)的工作,也就是怎樣由小數(shù)據(jù)形成大數(shù)據(jù)。
這個(gè)工作的基本思路是這樣:
首先我們對(duì)圖像進(jìn)行預(yù)處理。在此基礎(chǔ)上,我們針對(duì)每一個(gè)訓(xùn)練集的圖像,用統(tǒng)計(jì)模型對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)。也就是說,從概率統(tǒng)計(jì)上看,前列腺的輪廓最大概率的形狀有哪些?
所以,根據(jù)一組輪廓能生成多個(gè)新的輪廓,然后對(duì)某一個(gè)生成的輪廓,找到最接近的那個(gè)輪廓所對(duì)應(yīng)的圖像,然后用輪廓之間所對(duì)應(yīng)的最接近的關(guān)系,把對(duì)應(yīng)圖像的紋理進(jìn)行插值。
這樣,就由小數(shù)據(jù)生成了大數(shù)據(jù)。它的基本思路是這樣的,然后把原來提供的數(shù)據(jù)和我們生成的數(shù)據(jù)進(jìn)行訓(xùn)練,得出結(jié)果。
這個(gè)是由小數(shù)據(jù)生成大數(shù)據(jù)的一個(gè)圖示化結(jié)果。
我們可以看到,上面是原來提供的數(shù)據(jù),下面是我們模擬生成的??梢钥吹?,我們生成的圖像很漂亮,像真的一樣,那么它有沒有用呢?
我們做了試驗(yàn),使用CNN和Unet進(jìn)行驗(yàn)證。可以看到,隨著生成數(shù)據(jù)的增加,圖像分割精度也在迅速提升。
所以,我們生成的數(shù)據(jù)在網(wǎng)絡(luò)訓(xùn)練中是起作用的,能夠在數(shù)據(jù)不足的時(shí)候,用數(shù)據(jù)增強(qiáng)的方法,部分地解決問題。
這是我們以圖像分割為例對(duì)數(shù)據(jù)增強(qiáng)做的試驗(yàn),對(duì)增強(qiáng)的數(shù)據(jù)進(jìn)行驗(yàn)證,上圖分別是2D和3D上的前列腺分割結(jié)果。
第三個(gè)工作是頭頸部放療危及器官的分割。
頭頸部放療,通常要對(duì)一些危及器官進(jìn)行規(guī)避,即放療中不能損害到到這些危及器官。這么多的危及器官,一般有9到10個(gè),要靠人工勾畫,醫(yī)生的工作量很大,有沒有可能用人工智能的方法把危及器官自動(dòng)分割出來。
我們工作的基本思路是這樣:首先,因?yàn)橛?xùn)練集的圖像已經(jīng)是分割好了,我們把分割好的圖像把它提取出來,其他的都不要了,這樣就形成了兩個(gè)系列的圖像。對(duì)這兩個(gè)系列的圖像因?yàn)樗?xùn)練速度的問題我們進(jìn)行了下采樣。
對(duì)這個(gè)圖像,我們經(jīng)過傳統(tǒng)的計(jì)算方法,把已經(jīng)分割好的地方用一個(gè)小的立方體框住。
首先,訓(xùn)練找到頭頸部某一個(gè)器官的大致位置,把這個(gè)圖像輸入第一個(gè)名為LocNet的網(wǎng)絡(luò)(基本結(jié)構(gòu)和Unet相似),對(duì)它進(jìn)行訓(xùn)練。
訓(xùn)練是以我們關(guān)注的器官的位置作為標(biāo)準(zhǔn),看看我們訓(xùn)練的和它有什么區(qū)別?如果有區(qū)別的話,再進(jìn)行迭代把這個(gè)參數(shù)確定下來。
最后結(jié)果是,把整個(gè)器官的位置定位下來,然后根據(jù)這個(gè)位置來找到對(duì)應(yīng)圖像的位置,然后僅對(duì)這幅圖像我們所確定的與器官相關(guān)的位置進(jìn)行第二次訓(xùn)練,我們叫SegNet,通過它進(jìn)行訓(xùn)練分割。
測試數(shù)據(jù)時(shí),當(dāng)兩個(gè)網(wǎng)絡(luò)結(jié)構(gòu)定下來以后,把這個(gè)數(shù)據(jù)先定位,然后在定位的基礎(chǔ)上進(jìn)行分割。
這個(gè)是我們分割的具體可視化的結(jié)果。
可以看到,九個(gè)位置的分割都比較準(zhǔn)確。當(dāng)然這里面也有不準(zhǔn)確的,我們的測試數(shù)據(jù)有部分不是很準(zhǔn)確。
從整體平均數(shù)據(jù)比較,我們用了兩個(gè)參數(shù)。
一個(gè)是Dice系數(shù)。與國際上其他方法比較,九個(gè)部位里有五個(gè)排名第一,兩個(gè)排第二;第二個(gè),95% HDs距離,九個(gè)部位里有七個(gè)排第一,兩個(gè)排第二。可以看出,我們的工作還是比較成功的。
最后是我們的一些思考,對(duì)今后的機(jī)遇問題簡單介紹一下。
我們可以回顧一下工業(yè)革命的歷史。
第一次工業(yè)革命以蒸汽機(jī)為標(biāo)志,這個(gè)和醫(yī)學(xué)沒有太大關(guān)系,最起碼沒有直接關(guān)系。
第二次工業(yè)革命的標(biāo)志是電力的發(fā)明,這個(gè)應(yīng)該說和醫(yī)學(xué)有間接關(guān)系。
以計(jì)算機(jī)及信息技術(shù)為標(biāo)志的第三次工業(yè)革命和醫(yī)學(xué)的關(guān)系就密切多了,比方說CT、核磁共振、PET等均得力利于計(jì)算機(jī)技術(shù)。亦即,信息技術(shù)推動(dòng)了醫(yī)學(xué)的發(fā)展,尤其是推動(dòng)了診斷和治療的進(jìn)步。
現(xiàn)在,第四次工業(yè)革命尚未到來(有人說即將到來),而第三次工業(yè)革命的紅利已基本耗盡,這意味著什么呢?
意味著,新的增長點(diǎn)沒有形成,財(cái)富增量正在逐漸縮小,國際上部分利益集團(tuán),尤其是老牌發(fā)達(dá)國家的利益集團(tuán),要維持原來的生活水平,就不得不從別人口中搶蛋糕。所以大家就可以看到國際上會(huì)出現(xiàn)一些怪現(xiàn)象。例如,你不能生產(chǎn)電視機(jī),而我可以,那么我獲得了很多財(cái)富;以后你能夠生產(chǎn)了,但是我的質(zhì)量比你高,我還是能夠盈利。但如果技術(shù)長期沒有突破,后來居上,那么原來生產(chǎn)電視機(jī)的廠家利潤便會(huì)迅速下降。
在第四次工業(yè)革命的浪潮中,誰搶占了先機(jī),誰就將獲得更大的發(fā)展的空間。因此,這幾年對(duì)國家間的競爭非常重要。
目前,新的增長點(diǎn)有可能集中在如下幾個(gè)方面:一個(gè)是人工智能,其核心應(yīng)該是deep learning(深度學(xué)習(xí)),此外還有可控核聚變、石墨烯、量子信息、新能源等等。其中和醫(yī)學(xué)關(guān)系最密切的就是deep learning,但是,現(xiàn)在要在這方面實(shí)現(xiàn)突破的話,還有許多問題需要解決。
一、輿論偏離了科學(xué)
我們現(xiàn)在輿論上宣傳的內(nèi)容和實(shí)際上有一些差異。首先我們應(yīng)該認(rèn)清,深度學(xué)習(xí)和傳統(tǒng)方法最大的不同是,它并非完全依靠人工建模,而是相當(dāng)程度上依靠大數(shù)據(jù)訓(xùn)練形成參數(shù)并確定模型。因此,過去許多人工建模解決不了或解決不好的問題,通過深度學(xué)習(xí)能夠?yàn)槲覀兲岣咝碌臋C(jī)遇。但同時(shí),我們也要看到,深度學(xué)習(xí)也存在一些自身的問題。例如,傳統(tǒng)建模的方法如果推理很嚴(yán)謹(jǐn),那么一百個(gè)數(shù)據(jù)進(jìn)去,一百個(gè)都是準(zhǔn)確的。而人工智能這種方法,一百個(gè)數(shù)據(jù)進(jìn)去可能有幾個(gè)是不準(zhǔn)確的,但是在臨床上,這一百個(gè)數(shù)據(jù)是不允許出現(xiàn)問題的。
二、監(jiān)管政策
監(jiān)管政策法規(guī)會(huì)限制深度學(xué)習(xí)在臨床上的應(yīng)用。舉個(gè)例子,比方說國際工程師協(xié)會(huì)將自動(dòng)駕駛分為五級(jí),第五級(jí)就是完全的自動(dòng)駕駛,人已經(jīng)完全不干預(yù)。但是,現(xiàn)實(shí)政策上限制在Level 4上,也就是說,不能完全是自主駕駛,最起碼人要在旁邊看著。
在臨床層面應(yīng)用人工智能的話,大家普遍應(yīng)該是Level 3。就是說,不能把對(duì)疾病的診斷的重要事情全部交給人工智能,最起碼現(xiàn)階段很長一段時(shí)間內(nèi)不行。
三、黑箱問題
歐洲通用數(shù)據(jù)保護(hù)條例規(guī)定,如果要把AI用在醫(yī)學(xué)上,尤其是用在臨床上,必須要對(duì)所建立網(wǎng)絡(luò)的基本原理作出解釋,這個(gè)恰恰是人工智能、深度學(xué)習(xí)的弱點(diǎn)。
四、隱私和黑客攻擊,數(shù)據(jù)如何避免遭到黑客的攻擊
五、數(shù)據(jù)的數(shù)量和質(zhì)量
如果我們?cè)谂R床上獲得數(shù)據(jù)的時(shí)候,臨床上標(biāo)記錯(cuò)誤,這些都是深度學(xué)習(xí)在醫(yī)學(xué)上尤其是臨床上應(yīng)用需要解決的問題。
舉一個(gè)很典型的例子,這是今年4月發(fā)表在美國婦產(chǎn)科雜志上的一篇文章,它是用兩種模型,對(duì)白蛋白水平與宮頸癌預(yù)后結(jié)果的關(guān)系進(jìn)行判斷、推測。
深度學(xué)習(xí)得出來的結(jié)果和臨床共識(shí),以及我們傳統(tǒng)模型得到的結(jié)果不一樣。
人工智能認(rèn)為該蛋白的水平和宮頸癌的預(yù)后沒有直接關(guān)系。那么,按照傳統(tǒng)的思路,這應(yīng)該是一個(gè)比較重要的發(fā)現(xiàn)。
但是要讓大家接受這個(gè)研究結(jié)果,需要解釋為什么。人工智能是如何得出這個(gè)結(jié)果的。
所以這篇文章在討論的部分說到:我們研究遺憾的地方在于,深度學(xué)習(xí)不能解釋為什么出現(xiàn)這個(gè)結(jié)果。我們只能說,所訓(xùn)練的網(wǎng)絡(luò)測試下來是這樣一個(gè)結(jié)果,大家要接受這個(gè)結(jié)果,需要深度學(xué)習(xí)有更深入的解釋。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章