0
本文作者: 李雨晨 | 2019-03-20 19:03 |
雷鋒網(wǎng)消息,近日,四川省人民醫(yī)院的劉曉崗主任帶領(lǐng)團(tuán)隊(duì),與哈佛醫(yī)學(xué)院貝斯以色列女執(zhí)事醫(yī)療中心的研究人員合作發(fā)表了一篇論文。這項(xiàng)研究是第一項(xiàng)使用基于深度學(xué)習(xí)的高性能CADe系統(tǒng)的前瞻性隨機(jī)對(duì)照試驗(yàn),以幫助內(nèi)鏡醫(yī)師檢測(cè)患者的結(jié)腸息肉。
實(shí)驗(yàn)中發(fā)現(xiàn),與標(biāo)準(zhǔn)結(jié)腸鏡相比,AI系統(tǒng)輔助的結(jié)腸鏡檢查,查出的ADR(腺瘤檢出率)增加了近50%。每位患者檢出的平均腺瘤數(shù)也增加了——AI檢查出了更多的較小腺瘤。
在小組的初步研究中,該算法的敏感性為94.38%,特異性為95.92%,受試者工作特征曲線(xiàn)下面積(AUC)為0.984(越接近1,說(shuō)明準(zhǔn)確性越高)。此外,通過(guò)使用多線(xiàn)程處理系統(tǒng),AI對(duì)實(shí)時(shí)視頻的處理速度能夠達(dá)到每秒至少25幀,延遲時(shí)間為76.80±5.60毫秒。對(duì)于內(nèi)鏡醫(yī)師來(lái)說(shuō),檢測(cè)延遲幾乎不明顯。
這是一件非常難的事情。因?yàn)?,從靜態(tài)影像到動(dòng)態(tài)視頻,對(duì)于AI系統(tǒng)來(lái)說(shuō)難度是指數(shù)級(jí)增加的。但是,可貴之處在于,相比于靜態(tài)的影像,動(dòng)態(tài)的視頻更符合醫(yī)生的實(shí)際工作場(chǎng)景,因此研究也更腳踏實(shí)地。
至于為什么要選擇結(jié)直腸癌作為研究的對(duì)象,這個(gè)可能跟疾病本身有關(guān)。
根據(jù)國(guó)家癌癥中心全國(guó)腫瘤登記數(shù)據(jù)報(bào)告,我國(guó)城市和農(nóng)村地區(qū)結(jié)直腸癌發(fā)病率分別位列惡性腫瘤的第2位和第5位,死亡率分別位居第4位和第5位。結(jié)直腸癌的特點(diǎn)在于,它是一種早期和晚期死亡率相差極大的癌癥,早期結(jié)直腸癌生存率能夠達(dá)到90%,幾乎只要發(fā)現(xiàn)就能痊愈;而晚期結(jié)直腸癌生存率卻只有僅僅20%。
結(jié)腸鏡檢查是篩查CRC的金標(biāo)準(zhǔn),結(jié)腸鏡檢查通過(guò)檢測(cè)和切除腺瘤性息肉,可以降低結(jié)直腸癌的發(fā)生率和死亡率。在過(guò)去的半個(gè)世紀(jì)里,成人的死亡率和CRC發(fā)病率急劇下降(分別為51%和32%),主要就是由于CRC篩查和腺瘤性息肉的切除。因此,及時(shí)發(fā)現(xiàn)與鑒別結(jié)直腸息肉,提升結(jié)直腸腫瘤早篩水平,成為對(duì)抗結(jié)直腸癌的關(guān)鍵。
此外,有證據(jù)表明,ADR(腺瘤檢出率)每增加1.0%,間隔CRC風(fēng)險(xiǎn)降低3.0%。然而,息肉有高達(dá)27%的遺漏風(fēng)險(xiǎn),醫(yī)生視野內(nèi)無(wú)法識(shí)別的息肉是一個(gè)需要解決的重要問(wèn)題。一些研究表明,在檢查中增加一位醫(yī)生可以增加息肉檢出率(PDR),但這種策略在提高ADR方面仍存在爭(zhēng)議。
因此,團(tuán)隊(duì)研究了基于深度學(xué)習(xí)的自動(dòng)息肉檢測(cè)系統(tǒng)對(duì)息肉檢測(cè)率和ADR的影響。理想情況下,實(shí)時(shí)自動(dòng)息肉檢測(cè)系統(tǒng)的性能可以接近于專(zhuān)家內(nèi)鏡醫(yī)師的能力,幫助內(nèi)鏡醫(yī)師以比人更可靠的方式檢測(cè)可能對(duì)應(yīng)于腺瘤的病變。
據(jù)雷鋒網(wǎng)了解,這次前瞻性研究被設(shè)計(jì)為隨機(jī)對(duì)照試驗(yàn),研究在四川省人民醫(yī)院進(jìn)行,共納入了1058例患者。患者被隨機(jī)分組進(jìn)行診斷性結(jié)腸鏡檢查,一組接受標(biāo)準(zhǔn)結(jié)腸鏡檢查(536例),另一組接受AI系統(tǒng)(實(shí)時(shí)自動(dòng)息肉檢測(cè)系統(tǒng))輔助的結(jié)腸鏡檢查(522例)。來(lái)自胃腸病學(xué)部門(mén)的8名醫(yī)生參與了這項(xiàng)研究,其中包括兩名高級(jí)內(nèi)鏡醫(yī)師(> 20000例結(jié)腸鏡檢查),兩名中層內(nèi)鏡醫(yī)師(3000至10000名結(jié)腸鏡檢查)和四名初級(jí)內(nèi)鏡醫(yī)師(100至500名結(jié)腸鏡檢查)。
在AI輔助的組中,結(jié)腸鏡連接到AI系統(tǒng),監(jiān)視器上會(huì)顯示用藍(lán)色空心框圈出的息肉位置,同時(shí)發(fā)出警報(bào)聲,醫(yī)生主要負(fù)責(zé)盯好監(jiān)視器,在警報(bào)聲提示檢測(cè)到息肉時(shí)對(duì)息肉進(jìn)行評(píng)估,判斷它是否是息肉,是否是腺瘤性息肉。
深度學(xué)習(xí)架構(gòu)。檢測(cè)算法是基于SegNet架構(gòu)的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)。數(shù)據(jù)流是從左到右:結(jié)腸鏡檢查圖像被順序地扭曲成二進(jìn)制圖像,其中1代表息肉像素,0代表概率圖中沒(méi)有息肉。然如輸出中所示,CADe監(jiān)視器上有一個(gè)空心跟蹤框
從結(jié)果來(lái)看兩組共檢出了767個(gè)息肉,其中有422個(gè)腺瘤,對(duì)照組和AI組的PDR分別為0.29和0.45。
在良好的腸道準(zhǔn)備情況下,AI輔助組的ADR顯示出比常規(guī)組高6%的趨勢(shì)。AI系統(tǒng)顯著增加ADR(29.1%vs20.3%,p <0.001)和每位患者的腺瘤平均數(shù)(0.53vs0.31,p <0.001)。這是由于發(fā)現(xiàn)了更多的小腺瘤(185vs102; p <0.001),而較大的腺瘤(77vs58,p = 0.075)的檢出數(shù)量雖然也有差距,但是不具有統(tǒng)計(jì)學(xué)意義。此外,增生性息肉的數(shù)量也顯著增加(114vs52,p <0.001)。
從檢查所需時(shí)間上來(lái)看,AI組所需的時(shí)間為6.89分鐘,只是比對(duì)照組的標(biāo)準(zhǔn)結(jié)腸鏡組長(zhǎng)0.5分鐘,也都沒(méi)有出現(xiàn)與腸鏡檢查相關(guān)的并發(fā)癥。
此外,經(jīng)過(guò)統(tǒng)計(jì),AI輔助組共有39個(gè)誤報(bào),每個(gè)結(jié)腸鏡檢查平均誤報(bào)0.075次,基本上影響很小。在AI輔助組中檢測(cè)到的所有息肉中,自動(dòng)息肉檢測(cè)系統(tǒng)沒(méi)有遺漏任何息肉。
從幾個(gè)維度可以看出,劉曉崗主任領(lǐng)導(dǎo)開(kāi)發(fā)的這款A(yù)I系統(tǒng),在結(jié)直腸癌的篩查領(lǐng)域表現(xiàn)已經(jīng)足夠優(yōu)秀。但是,研究團(tuán)隊(duì)也總結(jié)了這項(xiàng)研究中有待改進(jìn)的地方。
首先,系統(tǒng)的確切貢獻(xiàn)不太好評(píng)估。由于“競(jìng)爭(zhēng)精神”,被觀(guān)察的行為也可能影響實(shí)驗(yàn)組的ADR。這一機(jī)制可能解釋了AI組中潛在的混雜因素,因?yàn)閮?nèi)窺鏡醫(yī)生可能在已知的觀(guān)察環(huán)境中更專(zhuān)注。將來(lái),可以設(shè)計(jì)雙盲研究來(lái)研究該系統(tǒng)在增加的腺瘤檢出率中的確切作用。這樣的研究還可以幫助確定內(nèi)窺鏡檢查者和系統(tǒng)是否同時(shí)檢測(cè)到息肉,或者內(nèi)窺鏡檢查員一開(kāi)始是否錯(cuò)過(guò)了息肉,這是當(dāng)前研究沒(méi)有設(shè)計(jì)解決的問(wèn)題。
第二,缺乏外部有效性。研究的基線(xiàn)腺瘤和息肉檢出率不如西方國(guó)家報(bào)道的高。多種因素可能有助于這一發(fā)現(xiàn),包括中國(guó)和西方人群之間的遺傳、飲食、生活方式和習(xí)慣差異,以及兩組間結(jié)腸息肉/腺瘤發(fā)病率的差異。因此,這項(xiàng)研究的結(jié)果可能不能推廣到世界上基線(xiàn)ADR較高的地區(qū)。需要進(jìn)一步研究該系統(tǒng)在這些領(lǐng)域的適應(yīng)性和有效性。
第三,雖然假陽(yáng)性率很低,但一些假陽(yáng)性率出乎系統(tǒng)設(shè)計(jì)者的意料,這是由于檢測(cè)到藥物膠囊、局部出血部位或未消化的碎片而發(fā)生的,可能會(huì)在手術(shù)過(guò)程中造成干擾。這可以通過(guò)向當(dāng)前系統(tǒng)添加足夠的培訓(xùn)數(shù)據(jù)來(lái)糾正。
第四,這項(xiàng)研究沒(méi)有控制參與內(nèi)鏡醫(yī)師的疲勞程度,這可能是影響ADR的獨(dú)立因素。需要進(jìn)一步的研究來(lái)研究這種CADe系統(tǒng)對(duì)不同疲勞水平的有效性。
第五,由于初級(jí)內(nèi)鏡醫(yī)師對(duì)結(jié)腸鏡檢查的樣本量不足,需要進(jìn)一步研究以顯示該CADe系統(tǒng)在不同培訓(xùn)水平中的作用和有效性。
最后,該研究使用奧林巴斯結(jié)腸鏡檢查設(shè)備進(jìn)行。因此,還應(yīng)探索該系統(tǒng)對(duì)其他公司制造的設(shè)備的適應(yīng)性。
總之,這項(xiàng)研究表明,基于深度學(xué)習(xí)的AI系統(tǒng)系統(tǒng)可以讓低流行ADR區(qū)域中結(jié)腸直腸息肉和腺瘤檢測(cè)率的顯著增加。鑒于其高準(zhǔn)確性、保真度和穩(wěn)定性,當(dāng)前的AI系統(tǒng)可以更好地適用于當(dāng)前臨床實(shí)踐中以更好地檢測(cè)結(jié)腸息肉。在醫(yī)生和工程師的共同努力下,在眾多的病種篩查領(lǐng)域里,AI輔助系統(tǒng)又多了一塊“用武之地”。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。