0
本文作者: 李雨晨 | 2018-08-04 17:14 |
雷鋒網消息,美國國立衛(wèi)生研究院(NIH)最近發(fā)布了一個龐大的胸部X光數(shù)據庫,現(xiàn)已公開近10600張CT掃描圖像,以支持醫(yī)療人工智能算法的開發(fā)和測試。
這個大型成像數(shù)據庫被稱為DeepLesion,是由美國國立衛(wèi)生研究院的Ronald Summers及其同事創(chuàng)建的。他們對其機構里的放射科醫(yī)生的CT掃描結果進行了臨床相關的標注。
Summers是NIH影像生物標記和計算機輔助診斷實驗室的高級研究員和放射學家。
根據美國國立衛(wèi)生研究院的說法,這些標注通常很復雜,包括描述病變大小和位置的箭頭、線條、分割和文本,以便讓臨床醫(yī)生可以監(jiān)測疾病變化。標注醫(yī)學圖像需要廣泛的臨床經驗,并且會耗費大量時間。
實際上,缺乏可用于訓練AI算法的大型醫(yī)學圖像數(shù)據庫一直被認為是AI技術尋求突破的主要障礙之一。Summers及其同事的努力就是為了改變這種狀況,至少在X光方面 。去年他們發(fā)布了ChestX-ray8數(shù)據庫,庫中包含了100000張X光圖像。
DeepLesion通過提供足夠強大的CT掃描數(shù)據庫和附帶的標注來訓練深度神經網絡,從而幫助繞過這些障礙。美國國立衛(wèi)生研究院建議,有朝一日可以“使科學界能夠創(chuàng)建一個具有統(tǒng)一框架的大規(guī)模通用病變檢測器”。
雷鋒網了解到,該數(shù)據庫包括來自馬里蘭州貝塞斯達NIH臨床中心的4400多名患者的大約10600項研究。雖然目前大多數(shù)數(shù)據庫包含10至數(shù)百個單一類型的病變,但該組設計的DeepLesion可容納超過32000個病灶,涵蓋各種放射學發(fā)現(xiàn),如肺結節(jié)、淋巴結腫大和肝腫瘤。
有了多范疇的病變數(shù)據庫,DeepLesion為研究人員提供了開發(fā)人工智能算法的機會,能夠自動檢測和診斷多種病變類型。美國國立衛(wèi)生研究院指出,未來它還可能發(fā)展成為一個通用病變檢測器,可用作初始篩選工具,并將其結果發(fā)送到其他更專業(yè)的算法。此外,研究人員可能可以在同一次CT掃描中研究不同類型病變之間的關系,從而全面評估癌癥負擔。
為了開始展示這種潛力,Summers及其同事用DeepLesion數(shù)據庫來訓練一個典型的通用病變檢測器,以發(fā)現(xiàn)各種病變。他們的探測器靈敏度達到81.1%,每個圖像有5個假陽性。
據雷鋒網了解,研究人員計劃繼續(xù)向DeepLesion添加圖像,以提高檢測器的準確性,他們希望將MRI掃描包含在數(shù)據庫中,并結合未來多家醫(yī)院的數(shù)據。該研究小組認為,除了病變檢測外,該數(shù)據庫還可以幫助訓練算法對病變進行分類,并根據現(xiàn)有模式預測病變的發(fā)展。
數(shù)據庫的下載地址:https://nihcc.app.box.com/v/DeepLesion
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。