0
本文作者: 李雨晨 | 2019-06-12 09:32 |
從百度離職后,吳恩達重新回到斯坦福大學繼續(xù)進行學術(shù)研究,醫(yī)療是他最為看重的垂直應用方向之一,兩年的時間里,吳恩達和團隊陸續(xù)發(fā)表了多項成果:包括用CNN算法識別肺炎、公布最大醫(yī)學影像數(shù)據(jù)集 MURA等等。
雷鋒網(wǎng)了解到,近日,斯坦福大學官網(wǎng)發(fā)布了吳恩達團隊的一項最新成果:借助人工智能算法,幫助放射科醫(yī)師改進腦動脈瘤的診斷。該成果的論文發(fā)表在了《JAMA Network Open》。
未破裂動脈瘤的診斷是一項至關(guān)重要的臨床任務(wù)——腦動脈瘤是大腦血管中的隆起物,可能會滲漏或破裂,可能導致中風、腦損傷或死亡。
計算機斷層掃描血管造影(CTA)是目前用于顱內(nèi)動脈瘤的診斷、監(jiān)測和術(shù)前規(guī)劃的主要的、微創(chuàng)的成像模式。但是,即使是專業(yè)的神經(jīng)放射學家來進行診斷也需要耗費很長的時間。低評分者信度(interrater agreement)對診斷的可靠性也提出了額外的挑戰(zhàn)。
在這幾年的人工智能浪潮下,卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)在一系列視覺任務(wù)(包括醫(yī)學圖像分析)上表現(xiàn)出優(yōu)異的性能。然而,利用深度學習來增強臨床醫(yī)生工作能力的成果并不是很多。
所以,利用AI幫助臨床醫(yī)生可靠地識別CTA中具有臨床意義的動脈瘤,將會為放射科醫(yī)師、神經(jīng)外科醫(yī)生和其他臨床醫(yī)生提供一個可用和易用的診斷支持工具。
基于這些考慮,吳恩達團隊建立了一種深度學習模型,用于自動檢測CTA上的顱內(nèi)動脈瘤并分割特定區(qū)域,以幫助臨床醫(yī)生通過CTA檢查以診斷顱內(nèi)動脈瘤。
以下為論文詳細內(nèi)容,由AI掘金志學術(shù)組編譯。關(guān)注「AI掘金志」公眾號,在對話框回復關(guān)鍵詞“吳恩達”,即可獲取原文PDF。
重要性: 深度學習有可能增強臨床醫(yī)生在醫(yī)學成像解釋中的表現(xiàn),并通過自動分割縮短診斷時間。迄今為止,很少有研究探討過這一主題。
目的: 開發(fā)和應用神經(jīng)網(wǎng)絡(luò)分割模型(HeadXNet模型),該模型能夠在頭部計算機斷層血管造影(CTA)成像中生成顱內(nèi)動脈瘤的精確體素預測,以增強臨床醫(yī)生的顱內(nèi)動脈瘤診斷能力。
設(shè)計、設(shè)置和參與者:在這項診斷研究中,我們開發(fā)了一個三維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使用611例頭部CTA檢查訓練集以生成動脈瘤分割。在115個檢查的測試集上,該模型的分割結(jié)果提交給了臨床醫(yī)生。
在2018年8月13日和2018年10月4日之間,無論是否有模型增強,8名臨床醫(yī)生在使用隨機順序和14天清洗期的交叉設(shè)計中診斷出測試集上存在動脈瘤。在2003年1月3日至2017年5月31日期間的頭頸部檢查,被用于訓練、驗證和測試模型。有至少1例臨床意義重大的動脈瘤,未破裂的顱內(nèi)動脈瘤檢查為陽性。排除了出血、動脈瘤破裂、創(chuàng)傷后或傳染性假性動脈瘤、動靜脈畸形、手術(shù)夾、線圈、導管或其他外科硬件的檢查。所有其他CTA檢查都被認為是對照組。
結(jié)果:該數(shù)據(jù)包含來自662名獨立患者的818項檢查,其中328例CTA檢查(40.1%)至少包含1例顱內(nèi)動脈瘤,490例檢查(59.9%)無顱內(nèi)動脈瘤。閱讀測試集的8位臨床醫(yī)生的經(jīng)驗為2至12年。通過人工智能產(chǎn)生的分割預測來增強臨床醫(yī)生的能力,與沒有增強相比,臨床醫(yī)生在靈敏度、準確性和評分者信度方面取得了統(tǒng)計學上的顯著改善:
臨床醫(yī)生的平均敏感度增加0.059(95%CI,0.028-0.091;adjusted P = .01),平均準確度增加0.038(95%CI,0.014-0.062;adjusted P = .02),平均評估者間差異( Fleiss κ)增加0.060,從0.799增加到0.859(adjusted P = .05)。
特異性(0.016; 95%CI,-0.010-0.041;adjusted P = .16)和診斷時間(5.71秒;95%CI,7.22-18.63秒;adjusted P = .19)的平均值在統(tǒng)計學上沒有顯著變化。
結(jié)論和意義:我們建立的深度學習模型成功地檢測出CTA上臨床意義顯著的顱內(nèi)動脈瘤。這表明人工智能輔助診斷模型的集成可以通過可靠和準確的預測來增強臨床醫(yī)生的表現(xiàn),從而優(yōu)化患者護理。
方法
數(shù)據(jù)
我們回顧性研究了2003年1月3日至2017年5月31日在斯坦福大學醫(yī)學中心進行的頭部或頭頸部共9455例連續(xù)CTA檢查報告。檢查包括實質(zhì)性出血、蛛網(wǎng)膜下腔出血、創(chuàng)傷后或傳染性假性動脈瘤、動靜脈畸形、缺血性中風、非特異性或慢性血管發(fā)現(xiàn),如顱內(nèi)動脈粥樣硬化或其他血管病變,以及手術(shù)夾、線圈、導管或其他外科硬件。由具有12年經(jīng)驗的神經(jīng)放射學家排除了因創(chuàng)傷或運動退化導致的損傷的例子。檢查報告還包括非破裂性重要動脈瘤(> 3 mm)。
放射科醫(yī)生標注
測試集中所有檢查的參考標準由一位經(jīng)過認證的具有12年經(jīng)驗的神經(jīng)放射學家確定。通過審查原始放射學報告確定動脈瘤的存在,對CTA檢查進行雙重審查。另外,如果可行,通過診斷性腦血管造影進一步確認動脈瘤。神經(jīng)放射學家可以訪問所有的醫(yī)學數(shù)字成像和DICOM系列,原始報告和臨床病史,以及注釋過程中的前期和后續(xù)檢查,以確定標簽的最佳參考標準。
在每個動脈瘤檢查中,放射科醫(yī)師還確定了每個動脈瘤的位置。使用開源注釋軟件ITK-SNAP,在每個切片上手動分割所識別的動脈瘤。
模型建立
在這項研究中,我們開發(fā)了一種名為HeadXNet的三維CNN,用于從CT掃描中分割顱內(nèi)動脈瘤。CNN是一種用于處理圖像數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),而三維CNN特別適合處理圖像序列或體積。
HeadXNet是具有編碼器 - 解碼器結(jié)構(gòu)的CNN(補充中的e圖1),其中編碼器將卷映射到抽象的低分辨率編碼,然后解碼器將該編碼擴展為全分辨率分割體積。分割結(jié)果為每個體素動脈瘤的概率值,其尺寸與原圖像相同。編碼器改編自50層SE-ResNeXt網(wǎng)絡(luò),解碼器是一系列3×3轉(zhuǎn)置卷積。
與UNet類似,跳過連接在3層編碼器中使用,以將編碼過程中的輸出直接傳輸?shù)浇獯a器中。編碼器是在Kinetics-600數(shù)據(jù)集上預先訓練的,這是一系列標有人類行為的YouTube視頻;在預訓練編碼器之后,最后3個卷積塊和600-way softmax 輸出層被移除,相應位置添加了一個巨大的空間金字塔池化層和解碼器。
訓練過程
在訓練期間,我們從體積中隨機取樣16個樣本的子體積。對數(shù)據(jù)集進行預處理以找到顱骨的輪廓,并且將每個樣本重采樣到208×208像素之前,每個樣本在橫斷面中圍繞顱骨進行裁剪。然后將切片裁剪成192×192像素(在訓練期間使用隨機裁剪,在測試期間使用中心裁剪),最終輸入的尺寸大小為16×192×192;將相同的變換應用于分割標簽。訓練過程使用基于體素的二元交叉熵和Dice損失的加權(quán)組合。
在進入模型訓練之前,輸入圖像被截取為[-300,700] Hounsfield單位,數(shù)據(jù)歸一化為[-1,1]和零中心。 訓練使用3個TitanXp GPU(NVIDIA),每個GPU 上的minibatch為2。 使用隨機梯度下降優(yōu)化器優(yōu)化模型的參數(shù),動量為0.9,隨機初始化權(quán)重的peak learning rate為0.1,預訓練權(quán)重為0.01。學習率通過linear warm-up從0到10000次迭代的peak learning rate進行調(diào)整,然后進行超過30萬次的余弦退火迭代。
另外,對于預訓練編碼器的前10000次迭代,學習速率固定為0。關(guān)于正則化,對于所有可訓練參數(shù)的loss加上0.001的L2權(quán)重衰減,并且在編碼器塊中使用隨機 depth dropout。沒有使用標準dropout。
為了控制類不平衡,我們使用了3種方法。
首先,錯誤分類的正例通過編碼器和focal loss鼓勵更大的參數(shù)更新,在這之后添加輔助loss。
其次,異常訓練樣本的采樣頻率高于正常樣本,因此異常樣本占訓練迭代的30%。
最后,在訓練迭代中,當分割標簽完全由背景(正常)體素組成時,解碼器的參數(shù)不更新。
為了產(chǎn)生整個體積的分割預測,連續(xù)16張切片的子體積的分割輸出被簡單地連接起來。如果切片的數(shù)量不能被16整除,則最后一個輸入體積用0填充,相應的輸出體積被截斷回原始大小。
研究設(shè)計
我們進行了一項診斷準確性研究,比較了有和沒有模型增強的臨床醫(yī)生的表現(xiàn)指標。參與該研究的8名臨床醫(yī)生,每一名診斷測試集中的115例,一半有該模型的幫助,另一半沒有。臨床醫(yī)生對原始報告、臨床病史和隨訪成像檢查不知情。
使用交叉設(shè)計,臨床醫(yī)生隨機分為兩組。在每組中,檢查按固定隨機順序?qū)M的一半進行排序,另一半則為相反順序排序。第1組首先閱讀沒有模型增強的檢查,第2組首先閱讀模型增強的檢查。在14天的清洗期后,增強設(shè)置進行顛倒,使得組1閱讀具有模型增強的檢查,組2閱讀沒有模型增強的檢查(圖1A)。
臨床醫(yī)生標記是否存在至少1個臨床重要的動脈瘤(直徑大于3mm)。臨床醫(yī)生在診斷閱覽室單獨閱讀,全部使用相同的高清監(jiān)視器(3840×2160像素),在標準的開源DICOM查看器(Horos)上顯示CTA檢查。臨床醫(yī)生將他們的標簽輸入數(shù)據(jù)輸入軟件應用程序,該應用程序自動記錄標記先前檢查與當前檢查之間的時間差。
當使用模型增強進行閱讀時,臨床醫(yī)生以直接覆蓋在CTA檢查之上的感興趣區(qū)域(ROI)分割的形式提供模型的預測。為了確保所有臨床醫(yī)生都使用熟悉的圖像顯示界面,模型預測的ROI在標準DICOM查看軟件中顯示。
在模型預測概率大于0.5的每個體素中,醫(yī)生在軸向、矢狀和冠狀系列切片上可以看到一個半透明的紅色覆蓋層(圖1C)。在加載檢查時,醫(yī)生可以立即訪問ROI,并且可以切換ROI以顯示未改變的CTA圖像(圖1B)。
紅色覆蓋是唯一的提示,即模型是否預測到特定CTA檢查包含動脈瘤。鑒于這些模型結(jié)果,醫(yī)生可以選擇根據(jù)臨床判斷考慮或忽視。
當醫(yī)生在沒有模型增強的情況下進行診斷時,任何檢查顯示都沒有ROI。否則診斷工具對于增強和非增強讀取是相同的。
A,交叉研究設(shè)計。 臨床醫(yī)生被分成2組,以隨機順序進行有和沒有模型增強的讀片,其間有2周的清洗期。
B,無模型增強的讀片,在軸向,冠狀和矢狀視圖中使用原始CTA掃描。
C,模型增強讀片,在CTA軸向,冠狀和矢狀視圖上覆蓋模型分割結(jié)果。醫(yī)生可以選擇關(guān)閉覆蓋并查看掃描,如圖B所示。AI表示人工智能;CTA,計算機斷層掃描血管造影。
統(tǒng)計分析
在確定檢查是否包含動脈瘤的二元任務(wù)中,使用敏感性、特異性和準確性來評估具有和不具有模型增強的臨床醫(yī)生的表現(xiàn)。靈敏度表示真陽性結(jié)果的數(shù)量除以動脈瘤陽性總數(shù),特異性表示真陰性結(jié)果的數(shù)量除以總動脈瘤陰性病例,準確度表示所有測試病例的真陽性除以真陽性結(jié)果的數(shù)量。
所有臨床醫(yī)生的這些統(tǒng)計數(shù)據(jù)的微觀平均值也通過與真陽性、假陰性和假陽性結(jié)果總數(shù)相關(guān)的每個統(tǒng)計數(shù)據(jù)來計算。此外,為了將模型的分割輸出轉(zhuǎn)換為二元預測,如果模型預測至少1個體素屬于動脈瘤而其他為陰性,則預測認為是陽性的。使用95%Wilson評分置信區(qū)間來評估敏感性、特異性和準確性的估計值的變化。
為了評估臨床醫(yī)生是否通過模型增強實現(xiàn)了顯著的性能提升,我們對所有8位臨床醫(yī)生的敏感性、特異性和準確性的差異進行了單尾t檢驗。為了確定研究結(jié)果的魯棒性以及結(jié)果是否包括實習放射科醫(yī)生和神經(jīng)外科醫(yī)生,我們進行了敏感性分析:我們僅計算了對經(jīng)過認證的放射科醫(yī)師的敏感性、特異性和準確性差異的t檢驗。
對有或無模型增強的臨床醫(yī)生進行診斷的平均時間計算為連續(xù)診斷的電子表格中的平均進入時間之間的差異; 使用95% t值置信區(qū)間來評估估計值的可變性??紤]臨床讀片中斷或時間記錄錯誤,排除每個讀片中每個臨床醫(yī)生診斷的5個最長和5個最短時間。為了評估模型增加是否顯著縮短診斷時間,對所有8名臨床醫(yī)生進行和不進行模型增強的平均時間差異進行單尾t檢驗。
臨床醫(yī)生和放射科醫(yī)師子集的評估信度使用精確的Fleiss κ計算。為了評估模型增強是否增加了評估信度,對臨床醫(yī)生在測試集上的評估信度進行了單尾置換檢驗。置換過程包括隨機交換有或沒有模型增強的臨床醫(yī)生標注,以便先前已經(jīng)標記為具有增強地讀取的測試集的隨機子集現(xiàn)在被標記為在沒有增強的情況下被讀取,反之亦然;在具有置換標簽的測試集中計算精確的Fleissκ值(和差值)。
這種置換過程重復10000次,以產(chǎn)生Fleissκ差異的零分布(具有增強的臨床醫(yī)師標注的評估信度沒有高于無模型增強的情況),未經(jīng)調(diào)整的P值計算的Fleiss κ差異的比例比觀察到的Fleiss k差異更大。
為了控制familywise錯誤率,應用Benjamini-Hochberg校正來考慮多個假設(shè)檢驗;Benjamini-Hochberg-adjusted P ≤ .05表示統(tǒng)計顯著性。所有測試都是單尾的。
該數(shù)據(jù)包含來自662名獨立患者的818項檢查,其中328例CTA檢查(40.1%)至少包含1例顱內(nèi)動脈瘤,490例檢查(59.9%)無顱內(nèi)動脈瘤(圖2)。在328例動脈瘤病例中,15位特殊患者的20例包含2個或更多動脈瘤。148例動脈瘤的動脈瘤大小在3m-7mm之間,108例動脈瘤在7毫米至12毫米之間,61例動脈瘤在12毫米至24毫米之間,還有11例動脈瘤大于24mm。
動脈瘤的位置分布如下:99例位于頸內(nèi)動脈,78例位于大腦中動脈,50例為海綿狀頸內(nèi)動脈瘤,44例為基底動脈瘤,41例位于前交通動脈,18例位于后交通動脈,16例位于椎基底動脈系統(tǒng),還有12例位于大腦前動脈。
所有檢查均在GE Discovery、GE LightSpeed、GE Revolution、Siemens Definition、Siemens Sensation或者Siemens Force掃描儀上進行,切片厚度為1.0 mm或1.25 mm,使用頭部血管造影或頭頸血管造影的標準臨床方案。動脈瘤和非動脈瘤檢查之間的方案和切片厚度沒有差異。在該研究中,從檢查中提取軸向序列,并在每個包含動脈瘤的軸向切片上打上分割標簽。每次檢查的圖像數(shù)量在113到802之間(均值[方差],373 [157])。
將檢查分為611例檢查訓練集(494名患者;均值[方差]年齡,55.8[18.1]歲;372[60.9%]女性)用于訓練模型,92例檢查的驗證組(86名患者;均值[方差]年齡,61.6 [16.7]歲;59[64.1%]女性)用于模型選擇,115例檢查的測試集(82名患者;均值[方差]年齡,57.8 [18.3]年;74 [64.4%]女性)用于評估臨床醫(yī)生以及模型的表現(xiàn)(如圖2)。
我們采用分層隨機抽樣的方法,形成的驗證和測試集各包括50%動脈瘤病例和50%正常病例;剩下的檢查為訓練集,其中36.5%為動脈瘤檢查。43例患者因動脈瘤隨訪檢查而在數(shù)據(jù)集中出現(xiàn)多例檢查??紤]到這些重復的病人,檢查的分組使得不同的組之間沒有病人重疊。圖2包含每組的病理學和患者人口統(tǒng)計學特征。
從在2003年至2017年期間在斯坦福大學醫(yī)學中心進行的9455次計算機斷層掃描血管造影(CTA)檢查中挑選了818例經(jīng)過專業(yè)的放射學家驗證的病例。這些測試被分為訓練集、開發(fā)集和測試集,分別用于訓練模型、選擇最佳模型和評估所選擇的模型。
共有8名臨床醫(yī)生參加了研究,其中包括6名注冊執(zhí)業(yè)的放射科醫(yī)生、1名執(zhí)業(yè)神經(jīng)外科醫(yī)生和1名放射科實習醫(yī)師。放射科醫(yī)生的經(jīng)驗從3年到12年不等,神經(jīng)外科醫(yī)生有2年的主治經(jīng)驗,實習醫(yī)師正在斯坦福大學醫(yī)學中心接受第二年的培訓。第1組和第2組各由3名放射科醫(yī)師組成;實習醫(yī)師和神經(jīng)外科醫(yī)生都在第1組。沒有臨床醫(yī)生參與建立檢查的參考標準。
在沒有增強的情況下,臨床醫(yī)生取得的微平均靈敏度為0.831(95%CI,0.794-0.862),特異性為0.960(95%CI,0.937-0.974),準確度為0.893(95%CI,0.872-0.912)。在有增強的情況下,臨床醫(yī)生的微平均靈敏度達到0.890(95%CI,0.858-0.915),特異性為0.975(95%CI,0.957-0.986),準確度為0.932(95%CI,0.913-0.946)?;A(chǔ)模型的靈敏度為0.949(95%CI,0.861-0.983),特異性為0.661(95%CI,0.530-0.771),準確度為0.809(95%CI,0.727-0.870)。模型的性能、每個臨床醫(yī)生以及他們的微平均性能在eTable 1中給出。
有增強的情況下,臨床醫(yī)生整體在平均敏感度和平均準確度有統(tǒng)計學上顯著的增加,分別為(0.059;95%C,0.028-0.091;adjusted P = .01)和(0.038; 95%CI,0.014-0.062;adjusted P = .02)。平均特異性在統(tǒng)計學上沒有顯著變化(0.016;95%CI,-0.010-0.041;adjusted P = .16)。
表中詳細列出了臨床醫(yī)生整體的性能改進,圖3中列舉了每個臨床醫(yī)生的改進。在附錄eTable 1中顯示了加和不加模型增強的個體性能。敏感性分析證實,即使注冊執(zhí)業(yè)的放射科醫(yī)生,也有在統(tǒng)計學上有顯著的平均靈敏度(0.059; 95%CI,0.013-0.105;調(diào)整后P = .04)和準確度(0.036; 95%CI,0.001-0.072;調(diào)整后P = .05)增長。作為一個整體,注冊執(zhí)業(yè)的放射科醫(yī)生的性能改進在補充資料的eTable 2中給出。
臨床醫(yī)生沒有增強的每次檢查的微平均診斷時間是57.04秒(95%CI,54.58-59.50秒)。每個臨床醫(yī)生的時間詳見附錄eTable 3,每人的診斷時間變化顯示在eFigure 2中給出。隨著增強,平均診斷時間在統(tǒng)計學上沒有顯著的下降(5.71秒;95%CI,-7.22-18.63秒;adjusted P = .19)。模型平均需要7.58秒(95%CI,6.92-8.25秒)來處理檢查并輸出其分割圖。
混淆矩陣,即報告了每個臨床醫(yī)生的真陽性和假陽性結(jié)果以及真陰性和假陰性結(jié)果(有或沒有模型增強)的表格,在附錄eTable 4中給出。
在臨床醫(yī)生的評判一致性上,在統(tǒng)計學上顯著增加了0.060(adjusted P = .05),沒有增強的精確Fleiss κ為0.799,增強的為.859。對于注冊執(zhí)業(yè)的放射科醫(yī)師,他們的評分員信度增加了0.063,沒有增強的精確Fleiss κ為0.783,增強了的為0.847。
討論
在本研究中,我們采用交叉研究設(shè)計,研究了深度學習模型增強臨床醫(yī)生使用CTA檢測腦動脈瘤的能力。隨著模型的增強,臨床醫(yī)生的敏感性、準確性和評分員信度顯著提高。特異性和診斷時間無統(tǒng)計學差異。
鑒于錯過動脈瘤破裂風險的潛在災難性后果,醫(yī)生非常需要一種能夠可靠地檢測和增強臨床醫(yī)生表現(xiàn)的自動檢測工具。動脈瘤破裂在40%的患者中是致命的,在存活下來的患者中,有三分之二的人會導致不可逆的神經(jīng)功能障礙;因此,準確及時的檢測至關(guān)重要。
除了在診斷CTA檢查時顯著提高臨床醫(yī)生的準確性之外,還可以使用自動化動脈瘤檢測工具(例如本研究中提供的檢測工具)來確定工作流程的優(yōu)先級,以便那些更有可能是陽性的檢查能夠得到及時的專家診斷,從而可能縮短治療時間并獲得更有利的結(jié)果。
臨床醫(yī)生在動脈瘤診斷中的顯著差異已被充分記錄,并通常歸因于缺乏經(jīng)驗或亞專科神經(jīng)放射學訓練,復雜的神經(jīng)血管解剖學或識別動脈瘤的勞動密集型性質(zhì)。研究表明,基于CTA的動脈瘤檢測的評分員信度的差異很大,其中評估間可靠度指標范圍為0.37至0.856,評估水平因動脈瘤大小和個體放射科醫(yī)師經(jīng)驗而異。
除了顯著提高敏感性和準確性外,使用該模型增強臨床醫(yī)生還顯著提高了評分員信度,從0.799提高到0.859。這意味著通過模型增強,具有不同經(jīng)驗和專業(yè)水平的臨床醫(yī)生可以產(chǎn)生更準確和更一致的放射學解釋。
目前,用于改善CTA臨床醫(yī)生動脈瘤檢測的工具包括骨減法,以及顱內(nèi)脈管系統(tǒng)的三維渲染,其依賴于應用對比度閾值設(shè)置以更好地描繪腦血管系統(tǒng)并產(chǎn)生3D渲染的重建以幫助動脈瘤檢測。但是,使用這些工具對臨床醫(yī)生來說是勞動和時間密集的;在某些機構(gòu)中,此流程被外包給3D實驗室,需要額外費用。
本研究中開發(fā)的工具直接集成在標準DICOM查看器中,只需幾秒鐘即可在新檢查中生成分割圖。如果集成到標準工作流程中,可以大大降低診斷的成本和時間,可能導致更有效的治療和更有利的患者結(jié)果。
深度學習最近在各種基于臨床圖像的識別任務(wù)中取得了成功。研究表明,二維神經(jīng)網(wǎng)絡(luò)在CT頭顱檢查中檢測顱內(nèi)出血和其他急性腦部表現(xiàn),如腫塊效應或顱骨骨折方面具有很強的性能。
最近,一項研究檢查了深度學習在診斷基于磁共振血管造影檢查腦動脈瘤的潛在作用。
另一項研究表明,在解釋膝關(guān)節(jié)磁共振研究時,為臨床醫(yī)生提供深度學習模型預測,增加了檢測前交叉韌帶撕裂的特異性。
據(jù)我們所知,在本研究之前,深度學習尚未應用于CTA,這種檢測腦動脈瘤的一線成像模式。我們的研究結(jié)果表明,深度學習分割模型可以產(chǎn)生可靠和可解釋的預測,增強臨床醫(yī)生并提高他們的診斷性能。在本研究中實施和測試的模型顯著提高了臨床醫(yī)生的敏感性、準確性和使用CTA檢測腦動脈瘤方面具有不同的經(jīng)驗和專業(yè)的醫(yī)師檢查的可靠性。
當然,這項研究有局限性。首先,因為該研究僅關(guān)注非破裂動脈瘤,模型在動脈瘤破裂后動脈瘤檢測、線圈或手術(shù)夾閉后病灶復發(fā)或與動靜脈畸形相關(guān)的動脈瘤方面的表現(xiàn)尚未進行研究。
其次,由于排除了包含手術(shù)硬件或設(shè)備的影響,因此模型性能在受到這些影響時是未知的。在臨床環(huán)境中,CTA通常用于評估多種類型的血管疾病,而不僅僅用于動脈瘤檢測。因此,測試集中動脈瘤的高患病率和臨床醫(yī)生的二元任務(wù)可能會在測試中引入偏差。
此外,這項研究是針對單一的三級護理學術(shù)機構(gòu)的數(shù)據(jù)進行的,當應用于其他具有不同掃描儀和成像協(xié)議(如不同的切片厚度)的機構(gòu)的數(shù)據(jù)時,可能不能表現(xiàn)出很好的性能。
結(jié)論
本項研究建立了一種基于CTA的顱內(nèi)動脈瘤自動檢測深度學習模型。我們發(fā)現(xiàn),模型顯著提高了臨床醫(yī)生的敏感性、準確性和評估者間可靠性。未來的工作將進一步調(diào)查這個模型的表現(xiàn),并應用其他機構(gòu)和醫(yī)院的數(shù)據(jù)。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。