0
雷鋒網(wǎng)消息,大量、高質(zhì)量的數(shù)據(jù)集推動(dòng)了深度學(xué)習(xí)領(lǐng)域的發(fā)展。近日,斯坦福吳恩達(dá)團(tuán)隊(duì)開(kāi)源了 MURA 數(shù)據(jù)庫(kù),包含 14982 個(gè)病例的上肢肌肉骨骼X光片。每個(gè)病例包含一個(gè)或多個(gè)圖像,均由放射科醫(yī)師手動(dòng)標(biāo)記。團(tuán)隊(duì)表示,為鼓勵(lì)醫(yī)學(xué)影像診斷模型的進(jìn)步,MURA 數(shù)據(jù)庫(kù)可以免費(fèi)使用。數(shù)據(jù)集地址為https://stanfordmlgroup.github. io/projects/mura(數(shù)據(jù)集要2月才會(huì)公布)
異常檢測(cè)任務(wù),也就是通過(guò)組織器官的 X 光片來(lái)確定機(jī)體的健康狀況,對(duì)患病情況進(jìn)行直接診斷。全球超過(guò) 17 億人都有肌肉骨骼性的疾病,這也是導(dǎo)致長(zhǎng)期疼痛和殘疾最常見(jiàn)的病因。據(jù)雷鋒網(wǎng)了解,每年有 3000 萬(wàn)左右的急診病例,這個(gè)數(shù)字還在不斷上漲。
MURA 是目前最大的 X 光片數(shù)據(jù)庫(kù)之一,包含源自 14982 項(xiàng)病例的 40895 張肌肉骨骼X光片。1萬(wàn)多項(xiàng)病例里有 9067 例正常的上級(jí)肌肉骨骼和 5915 例上肢異常肌肉骨骼的 X 光片,部位包括肩部、肱骨、手肘、前臂、手腕、手掌和手指。
表一:MURA 數(shù)據(jù)庫(kù)包含 9067 例正常和 5915 例異常肌肉骨骼影像學(xué)研究,包括肩部,肱骨,手肘,前臂,手腕,手掌和手指等上肢。MURA 是最大的公共影像數(shù)據(jù)集之一。
基于 MURA,我們開(kāi)發(fā)了一個(gè)有效的異常檢測(cè)模型。將一個(gè)或多個(gè) X 光片輸入該模型來(lái)研究上肢部分。通過(guò) 169 層的卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)每個(gè) X 光片的異常概率,然后得出同一病例所有 X 光片異常概率的平均值,作為 X 光片的異常概率輸出。
圖2.該模型輸入一個(gè)或多個(gè) X 光片,通過(guò) 169 層的卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)異常的概率,然后輸出異常概率的平均值。
為了有效地評(píng)估模型并獲得放射科醫(yī)生對(duì)于模型的評(píng)價(jià),我們從 209 項(xiàng)持續(xù)跟蹤的病例中挑選了 6 個(gè)病例,收集專業(yè)放射科醫(yī)生給出的診斷結(jié)果。將模型和醫(yī)生給出的診斷結(jié)果進(jìn)行比較,發(fā)現(xiàn)模型的診斷能力達(dá)到了放射科醫(yī)生相當(dāng)?shù)乃健?strong>在診斷手指和手腕異常時(shí),模型檢測(cè)異常的能力強(qiáng)于最好的醫(yī)生。然而,在診斷膝、前臂、肱骨和肩部異常時(shí),模型的表現(xiàn)不如醫(yī)生的表現(xiàn)。
機(jī)構(gòu)審查委員會(huì)的批準(zhǔn)之后,我們通過(guò)斯坦福醫(yī)院的PACS系統(tǒng)收集了被識(shí)別的、符合HIPPA的圖像。我們收集了來(lái)自12251名患者、14982項(xiàng)研究的肌肉骨骼放射學(xué)數(shù)據(jù)集,共有40895個(gè)多視圖的影像。每一個(gè)都屬于七個(gè)標(biāo)準(zhǔn)的上肢放射學(xué)研究類型之一:肘部、手指、前臂、手、肱骨、肩膀和手腕。表1總結(jié)了正常和異常研究的分布情況。
斯坦福醫(yī)院的放射科醫(yī)生將2001年到2012年的每項(xiàng)研究手工標(biāo)記為正?;虍惓!T趯?duì)DICOM圖像進(jìn)行解釋時(shí),對(duì)至少300萬(wàn)像素的PACS醫(yī)用級(jí)顯示器進(jìn)行了解釋,其中最大亮度為400 cd/m2,最小亮度 1 cd/m2,像素尺寸為0.2,本機(jī)分辨率為1500 x 2000像素。臨床圖像在分辨率和縱橫比上有所不同。我們將數(shù)據(jù)集拆分為訓(xùn)練(11255名患者,13565個(gè)研究,37111個(gè)圖像)、驗(yàn)證(788例,1208項(xiàng)研究,3225張圖片)、測(cè)試(208個(gè)病人,209個(gè)研究,559個(gè)圖像)。數(shù)據(jù)集在任何一組患者之間沒(méi)有重疊。
為了評(píng)估模型并得到放射科醫(yī)生的可靠驗(yàn)證,我們從斯坦福大學(xué)那里收集了一些額外的標(biāo)簽,這些標(biāo)簽包括209個(gè)肌肉骨骼研究。放射科醫(yī)生在使用PACS系統(tǒng)的臨床閱覽室環(huán)境中,對(duì)每項(xiàng)研究進(jìn)行了回顧和標(biāo)記,并將其標(biāo)記為DICOM文件。放射科醫(yī)生平均有8.83年的經(jīng)驗(yàn),從2年到25年不等。放射科醫(yī)生沒(méi)有獲得任何臨床資料。標(biāo)簽被輸入到一個(gè)標(biāo)準(zhǔn)化的數(shù)據(jù)錄入系統(tǒng)中。
我們?cè)u(píng)估了放射科醫(yī)生和模型在測(cè)試集上的表現(xiàn)。研究中,我們從6名認(rèn)證的放射科醫(yī)生那里收集了額外的正常/異常的標(biāo)簽,選擇了其中三位來(lái)創(chuàng)建一個(gè)金標(biāo)準(zhǔn),利用其他三位來(lái)評(píng)估人類在這項(xiàng)任務(wù)上的表現(xiàn)。
表二總結(jié)了放射科醫(yī)生和模型在不同研究類型和總體上的表現(xiàn)。放射科醫(yī)生在腕部研究(醫(yī)生2)或肱骨研究(醫(yī)生1和3)上取得了最高的成績(jī),他們?cè)谑种秆芯可系谋憩F(xiàn)最差。該模型在腕部研究中也達(dá)到了最高的表現(xiàn)。在腕部研究中,模型表現(xiàn)與最好的放射科醫(yī)生表現(xiàn)相當(dāng)。在所有其他研究類型中,模型的表現(xiàn)明顯低于人類的表現(xiàn)。
表二:每個(gè)研究類型和總體上突出表現(xiàn)最佳(綠色)和最差(紅色)表現(xiàn)
大型數(shù)據(jù)集使得深度學(xué)習(xí)算法在圖像識(shí)別、語(yǔ)音識(shí)別和問(wèn)答等任務(wù)中實(shí)現(xiàn)或接近人類水平的性能。醫(yī)學(xué)方面的數(shù)據(jù)集也幫助科學(xué)家在糖尿病視網(wǎng)膜病變、皮膚癌、心律失常、腦出血、肺炎和髖部骨折方面成為小半個(gè)“專家”。
表三:公開(kāi)可用醫(yī)學(xué)放射影像數(shù)據(jù)集(第二大的數(shù)據(jù)集是Pediatric Bone(預(yù)測(cè)骨齡);0.E.1是關(guān)于膝關(guān)節(jié)的數(shù)據(jù)集)
表3提供了公共可用數(shù)據(jù)集的摘要。之前的數(shù)據(jù)集比MURA要小,但最近發(fā)布的ChestX-ray14除外,它是112120個(gè)正面的胸片、包含14個(gè)胸科病理標(biāo)簽。然而,標(biāo)簽并不是直接由放射科醫(yī)生提供的,而是由他們的文本報(bào)告自動(dòng)生成。
很少有公開(kāi)可用的肌肉骨骼X光數(shù)據(jù)集。斯坦福大學(xué)的醫(yī)學(xué)和成像人工智能項(xiàng)目提供了一個(gè)數(shù)據(jù)集,包含了帶有骨骼年齡(AIMI)的兒童手部X光片。據(jù)雷鋒網(wǎng)了解,數(shù)據(jù)集是由不同年齡的兒童的左手影像組成,上面標(biāo)有放射科醫(yī)生的骨齡讀數(shù)。骨關(guān)節(jié)炎方面就得看0. E.1數(shù)據(jù)集了,其中包含標(biāo)有K&L等級(jí)的骨關(guān)節(jié)炎(OAI)的膝部放射照片。上述的幾個(gè)數(shù)據(jù)集都包含不到15000個(gè)圖像。
骨骼肌x光片的異常檢測(cè)具有重要的臨床應(yīng)用價(jià)值。首先,將異常檢測(cè)模型用于工作列表的優(yōu)先級(jí)排序。在這種情況下,檢測(cè)到的異常可以在圖像解釋工作流程中前置,讓最嚴(yán)重的患者得到更快的診斷和治療:
正常的檢查可以被適當(dāng)?shù)貏澐譃楣ぷ髁斜淼妮^低優(yōu)先級(jí);
可以將更快速的結(jié)果傳達(dá)給醫(yī)患雙方,從而優(yōu)化醫(yī)療系統(tǒng)其他領(lǐng)域的配置;
放射學(xué)報(bào)告模板用于正常研究,可用于檢驗(yàn)放射科醫(yī)生,以便進(jìn)行更快速的審查和批準(zhǔn)。
此外,自動(dòng)異常定位可以幫助緩解放射科醫(yī)生的疲勞。醫(yī)療資源的分布不均加劇了這個(gè)問(wèn)題,尤其是在醫(yī)療資源集中的城市地區(qū)。雖然疲勞是所有醫(yī)護(hù)專業(yè)人員經(jīng)常面對(duì)的一個(gè)問(wèn)題,但放射科醫(yī)生非常容易受到影響,進(jìn)而可能會(huì)影響診斷的準(zhǔn)確性。有一項(xiàng)研究表明,放射科醫(yī)生在當(dāng)天工作結(jié)束時(shí),骨折檢測(cè)的效率與工作開(kāi)始時(shí)相比有顯著的下降。
一個(gè)可以進(jìn)行自動(dòng)異常定位的模型可以突出顯示模型中被識(shí)別為異常的部分,引起臨床醫(yī)生的注意。如果有效的話,這將有助于更有效地幫助醫(yī)生進(jìn)行閱片,減少錯(cuò)誤,并幫助提高標(biāo)準(zhǔn)化質(zhì)量。當(dāng)然了,該模型還需要更多的研究來(lái)進(jìn)行評(píng)估,并且思考如何與其他深度學(xué)習(xí)模型在臨床環(huán)境中進(jìn)行最優(yōu)化的整合。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。