0
本文作者: 黃錦 | 2018-11-30 20:50 |
雷鋒網(wǎng)按:本文譯自Stanford ML Group,作者為Nicholas Bien,Pranav Rajpurkar,Robyn L. Ball,Matthew P. Lungren和Andrew Y. Ng等。文章主要介紹了深度學(xué)習(xí)模型MRNet在膝關(guān)節(jié)磁共振成像異常檢測(cè)上的應(yīng)用,研究發(fā)現(xiàn),該模型顯著降低了健康患者被誤診為前十字韌帶撕裂的概率。原文鏈接:stanfordmlgroup.github.io/projects/mrnet/。
在膝關(guān)節(jié)疾病診斷中,膝關(guān)節(jié)磁共振(MR)成像是通用的標(biāo)準(zhǔn)方法,而且,相比身體的其他任何部位,膝關(guān)節(jié)肌肉骨骼的MR檢查頻率更高,檢查結(jié)果也要求更加精確。
我們?cè)凇禤LOS》發(fā)表了一項(xiàng)新研究,該研究開(kāi)發(fā)了一種深度學(xué)習(xí)模型,用來(lái)檢測(cè)膝關(guān)節(jié)MRI檢測(cè)中的整體性異常和精確性診斷(前十字韌帶(ACL)撕裂和半月板撕裂),我們還評(píng)估了向臨床醫(yī)生提供該模型預(yù)測(cè)的臨床價(jià)值。
考慮下這個(gè)膝蓋磁共振檢查,這里有三個(gè)系列(頂行)——你能發(fā)現(xiàn)異常嗎?深度學(xué)習(xí)算法能,它夠識(shí)別ACL撕裂(在矢狀序列上看的最清楚)并使用熱圖來(lái)定位異常(底行),異常存在證據(jù)越多的地方熱圖顏色強(qiáng)度就會(huì)越大。
預(yù)測(cè)系統(tǒng)最主要組成部分是MRNet:它是一個(gè)能將三維MRI序列映射到概率的卷積神經(jīng)網(wǎng)絡(luò)(CNN)。
MRNet的輸入尺寸為s×3×256×256,其中s是MRI序列中的圖像數(shù)量,3是彩色通道數(shù)量。首先,每個(gè)二維MRI圖像切片會(huì)通過(guò)一個(gè)特征提取器,得到包含每個(gè)切片特征的s×256×7×7張量。然后利用池化將這些特征減少到s×256。再然后,我們利用最大池化通過(guò)切片獲得一個(gè)256維的向量,最后,該向量被傳遞到完全連接層并獲得預(yù)測(cè)概率。
因?yàn)镸RNet會(huì)為矢狀位T2、冠狀位T1和軸向PD序列都生成預(yù)測(cè),所以我們訓(xùn)練Logistic回歸來(lái)對(duì)3組預(yù)測(cè)進(jìn)行加權(quán),并為每次檢測(cè)都生成一個(gè)輸出。
隨后,我們測(cè)量了普通放射科醫(yī)生和外科醫(yī)生有無(wú)模型輔助下的表現(xiàn)情況。
我們選取了斯坦福大學(xué)醫(yī)學(xué)中心(3至29年從業(yè)經(jīng)驗(yàn),平均12年)的7名執(zhí)業(yè)注冊(cè)放射科醫(yī)生和2名執(zhí)業(yè)骨科醫(yī)生。
整個(gè)實(shí)驗(yàn)分為兩次,每次試驗(yàn)里9名醫(yī)生都需要觀察120張圖片,并對(duì)圖片作出診斷。不同的是,一次有模型輔助,一次沒(méi)有,每次實(shí)驗(yàn)后的間隔期至少10天。對(duì)于有模型輔助的讀片,模型預(yù)測(cè)會(huì)產(chǎn)生3個(gè)標(biāo)簽,每一個(gè)都表示陽(yáng)性診斷的預(yù)測(cè)概率,比如,有98%的概率是前十字韌帶撕裂,70%的概率是半月板撕裂,99%的是膝關(guān)節(jié)異常。
我們發(fā)現(xiàn),模型輔助顯著降低了健康患者被誤診為前十字韌帶撕裂的概率。
模型輔助導(dǎo)致ACL特異性平均增加了0.048(4.8%):每100名健康患者中,大約5名被免于進(jìn)行不必要的手術(shù)。
雖然模型輔助也顯著提高了臨床專家檢測(cè)前十字韌帶撕裂和半月板撕裂的準(zhǔn)確性,但在通過(guò)控制錯(cuò)誤發(fā)現(xiàn)率進(jìn)行多次比較和調(diào)整后,實(shí)驗(yàn)結(jié)果反而不再顯著。
就其異常檢測(cè),前十字異常撕裂檢測(cè)和半月板撕裂檢測(cè)這三種檢測(cè)而言,該模型本身的AUC為0.937(95%CI 0.895,0.980),0.965(95%CI 0.938,0.994)和0.847(95%CI 0.780,0.914)。
值得注意的是,該模型在檢測(cè)內(nèi)部驗(yàn)證集上的前十字異常撕裂時(shí)具有高度特異性,這表明如果在臨床工作流程中使用這樣的模型,則可能有效地發(fā)現(xiàn)前十字異常撕裂。
我們還將模型的表現(xiàn)與普通放射科醫(yī)師(無(wú)輔助)進(jìn)行了比較:在異常檢測(cè)方面,模型和放射科醫(yī)生的表現(xiàn)并無(wú)顯著差異,在前十字韌帶撕裂檢測(cè)方面,普通放射科醫(yī)師比模型的靈敏度更高,而在半月板撕裂檢測(cè)中模型有更高的特異性。
另外,我們?cè)趤?lái)自不同機(jī)構(gòu)的數(shù)據(jù)集上對(duì)MRNet進(jìn)行了驗(yàn)證,發(fā)現(xiàn)該模型對(duì)ACL具有較高的識(shí)別能力。
我們從從克羅地亞里耶卡臨床醫(yī)院中心獲得了917例檢查的公共數(shù)據(jù)集,它們都帶有矢狀位T1加權(quán)序列和ACL損傷標(biāo)簽。在183例檢查的外部驗(yàn)證集上,在斯坦福矢狀位T2加權(quán)序列上訓(xùn)練的MRNet在沒(méi)有額外訓(xùn)練的情況下,在ACL損傷檢測(cè)中實(shí)現(xiàn)了0.824(95%CI 0.757,0.892)的AUC;在外部數(shù)據(jù)集其余部分上訓(xùn)練的MRNet實(shí)現(xiàn)了0.911(95% CI 0.864,0.958)的AUC。
最后,我們很高興能有更多志同道合的人來(lái)一起共事并進(jìn)一步驗(yàn)證人工智能醫(yī)學(xué)成像技術(shù)。
異常自動(dòng)預(yù)測(cè)和定位可以幫助普通放射科醫(yī)生甚至是非放射科臨床醫(yī)生(如骨科醫(yī)生)為患者解釋醫(yī)學(xué)成像,而不是等著專門的放射科醫(yī)生解釋,這有助于提高解釋效率,減少錯(cuò)誤,并且有助于診斷質(zhì)量的標(biāo)準(zhǔn)化,尤其是當(dāng)專門的放射科醫(yī)生資源稀缺的時(shí)候。
我們需要更多的研究來(lái)評(píng)估該模型和其他深度學(xué)習(xí)模型在臨床環(huán)境中的最優(yōu)組合,也希望能與醫(yī)療健康服務(wù)提供者合作,一起來(lái)研究和驗(yàn)證醫(yī)學(xué)成像中的自動(dòng)人工智能模型。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。