0
本文作者: 老王 | 2020-01-12 17:51 |
近日,瑞典研究團隊發(fā)表在《柳葉刀腫瘤》雜志上前列腺癌AI輔助診斷研究論文正式公布。
科研人員發(fā)現(xiàn),AI能夠準確從活檢中檢測出前列腺癌,從而有可能加快診斷速度并降低醫(yī)療服務成本。
當前,全球各地前列腺活檢人數(shù)的增加與泌尿病理學家的短缺,為病理科帶來了巨大壓力。此外,前列腺癌的高變異性也導致其高頻出現(xiàn)過度治療和治療不足的情況。
為了緩解這些問題,瑞典研究團隊開發(fā)了一種具有臨床上可接受準確性的人工智能系統(tǒng),用于前列腺癌的檢測、定位和格里森分級(Gleason分級是一種被廣泛采用的前列腺癌組織學分級的方法)。
據(jù)文章介紹,AI系統(tǒng)可以接受訓練以檢出前列腺穿刺活檢樣本中的癌癥并對其進行分級,在部分數(shù)據(jù)集上的特定問題診斷表現(xiàn)上優(yōu)秀。
研究指出,人工智能技術的使用,可以通過減少對良性活檢的評估,并通過自動化在陽性活組織檢查核心中測量癌癥長度的任務,以及提供第二種意見,來減輕腫瘤學家的工作量。
卡羅林斯卡大學醫(yī)學流行病學系副教授Martin Eklund表示:“我們的AI工具可在某種程度上減少泌尿科病理學家的工作量,使他們能夠專注于最困難的病例?!?br/>
在2012年5月至2014年12月之間進行的基于瑞典前瞻性和人群的STHLM3診斷研究中,瑞典研究團隊從976名隨機選擇的年齡在50-69歲的參與者中數(shù)字化了6682張針核活檢切片,并從93名研究外的男性中數(shù)字化了271張切片。
隨后圖像被用來訓練用于評估前列腺活檢的深層神經(jīng)網(wǎng)絡。
通過預測來自STHLM3的246名男性1631例活檢,以及來自73名男性330例活檢的外部驗證數(shù)據(jù)集,獨立測試數(shù)據(jù)集的惡性組織存在、程度和Gleason分級,對這些網(wǎng)絡進行了評估。此外還評估了來自國際泌尿病理學會23名經(jīng)驗豐富的泌尿病理學家對87例活檢的分級表現(xiàn)。通過受試者的工作特征和腫瘤范圍預測,將預測的腫瘤長度與報告的病理學家的測量值相關聯(lián),來評估鑒別性能,并使用Cohen’s kappa對AI系統(tǒng)和泌尿病理學專家的評分一致性進行了量化。
其結果是,AI在接收器工作特性曲線下獲得了一個區(qū)域,該區(qū)域在0·997(95%CI 0·994–0·999)下可以區(qū)分獨立測試數(shù)據(jù)集上的良性(n = 910)和惡性(n = 721)活檢核心和外部驗證數(shù)據(jù)集上的0·986(0·972-0·996)(良性n = 108,惡性n = 222)。
由AI預測并由報告病理學家指定癌癥長度之間的相關性對于獨立測試數(shù)據(jù)集為0·96(95%CI 0·95-0·97),對于獨立測試數(shù)據(jù)集為0·87(0·84-0·90)。外部驗證數(shù)據(jù)集,對于Gleason等級,AI的平均成對kappa為0·62,這在專家病理學家的相應值范圍內(0·60-0·73)。
瑞典團隊介紹到,從上述數(shù)據(jù)可以看出,用AI系統(tǒng)來檢測和分級前列腺穿刺活檢樣品中的癌癥,在部分場景中其等級可與前列腺病理學專家相媲美。
臨床應用可以通過減少對良性活組織檢查的評估,以及自動化在陽性活檢核心中測量癌癥長度的任務來減少病理學工作量。具有專家級評分性能的AI系統(tǒng)可能會產生第二種輔助決策意見,有助于標準化評分,并在世界部分地區(qū)提供病理學專業(yè)知識。
該研究也是近期繼Google乳腺癌AI論文之后,學術界發(fā)表的第二個重要的醫(yī)學AI成果。
1月2日,Google Health聯(lián)合多個機構在《Nature》雜志上發(fā)表了一篇論文,介紹了一種新型的深度學習鉬靶影像系統(tǒng)。根據(jù)Google的說法,這個系統(tǒng)與之前的模型相比,該模型有效減少了乳腺癌被錯誤識別或遺漏的情況,將乳腺癌檢測的假陽性率降低了5.7%,假陰性率也降低了9.4%,并號稱擊敗了6名全日制的放射科醫(yī)生。
Google對該成果過于夸大的公關措辭,隨之引來了圖靈獎得主Yann Lecun以及中美多位知名學者在社交媒體上的炮轟。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。