專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì)，年內(nèi)會將該算法投入實(shí)用

本文作者：汪思穎

編輯：郭奕欣

2018-04-03 09:41

導(dǎo)語：在 Encoder-Decoder 框架下融合空洞卷積操作、self-attention 機(jī)制。

科大訊飛

+18

AI影響因子

比賽

比賽名稱：IDRiD

年份：2018

企業(yè)：科大訊飛

操作：競賽

名次：1

開發(fā)

企業(yè)：科大訊飛

操作：專訪

內(nèi)容：專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì)

更多相關(guān)

雷鋒網(wǎng) AI 研習(xí)社按，日前，由生物醫(yī)學(xué)成像領(lǐng)域頂級學(xué)術(shù)會議 ISBI（（IEEE International Symposium on Biomedical Imaging）舉辦的 IDRiD 眼底圖分析競賽成績揭曉。從排行榜上可以看到，來自中國的研究機(jī)構(gòu)表現(xiàn)相當(dāng)亮眼——科大訊飛「iFLYTEK-MIG」團(tuán)隊(duì)在病灶分割比賽的 MA（微動脈瘤）子項(xiàng)目上排名第一，平安科技「PATech」團(tuán)隊(duì)在病灶分割比賽的 EX（硬滲出）子項(xiàng)目上排名第一。

專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì)，年內(nèi)會將該算法投入實(shí)用

浙江大學(xué)、新加坡國立大學(xué)、新加坡生物信息學(xué)研究所聯(lián)合北京上工醫(yī)信公司組成的團(tuán)隊(duì)在視神經(jīng)盤與中央凹檢測比賽上得分領(lǐng)先。

專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì)，年內(nèi)會將該算法投入實(shí)用

此次眼底圖分析競賽共分為病灶分割、疾病分級、視神經(jīng)盤與中央凹檢測三個分賽道，病灶分割比賽中包括微動脈瘤（MA）、出血點(diǎn)（HE）、軟滲出（SE）、硬滲出（EX）四個子項(xiàng)目，訊飛「iFLYTEK-MIG」團(tuán)隊(duì)在病灶分割的四個指標(biāo) MA/HE/SE/EX 上的得分排名分別為 1/3/3/2，雷鋒網(wǎng) AI 研習(xí)社第一時間聯(lián)系到「iFLYTEK-MIG」團(tuán)隊(duì)，了解到這一優(yōu)秀成績背后的個中細(xì)節(jié)，同時，也獲悉訊飛在醫(yī)療圖像領(lǐng)域取得的突破與進(jìn)展。

專訪訊飛病灶分割比賽優(yōu)勝團(tuán)隊(duì)，年內(nèi)會將該算法投入實(shí)用

圖：眼底圖四種病灶示意圖（via：科大訊飛）

比賽細(xì)節(jié)

在病灶分割、疾病分級、視神經(jīng)盤與中央凹檢測這三個分賽道上，排名領(lǐng)先的科大訊飛和平安科技都只是選擇參加第一項(xiàng)賽事而忽略了后兩項(xiàng)，「iFLYTEK-MIG」團(tuán)隊(duì)對 AI 研習(xí)社解釋道，「其他幾項(xiàng)比賽對醫(yī)生的輔助意義并不是很大，不能很好地提升醫(yī)生的工作效率與準(zhǔn)確率。」

iFLYTEK-MIG 團(tuán)隊(duì)主要來自科大訊飛 AI 研究院，研究方向是人工智能在醫(yī)學(xué)影像領(lǐng)域的技術(shù)及應(yīng)用。基于專業(yè)知識和實(shí)地考察經(jīng)驗(yàn)，他們表示，病灶分割可以給醫(yī)生帶來極大的利好?！肝覀冊诒荣愔袡z測的微動脈瘤（MA）實(shí)際上是非常之小的，在一張 4000x3000 像素的圖上，MA 可能只占 10x10 個像素左右，很容易被醫(yī)生遺漏。根據(jù)我們的調(diào)研，高水平的醫(yī)生看一份眼底圖找到一個 MA 可能要耗費(fèi) 4 到 5 分鐘，目前我們的系統(tǒng)只需要幾秒鐘，而且速度還有優(yōu)化空間，可以大幅提高醫(yī)生的工作效率?！?/p>

提到參賽初衷，他們對雷鋒網(wǎng)表示，對于訊飛來說，眼底圖是之前一直沒有嘗試過的病種，也是計(jì)劃馬上要做的。在機(jī)緣巧合之下，看到 ISBI 在舉辦 IDRiD 這樣一個國際比賽，所以馬上選擇投入?yún)⒓印?/p>

在該比賽中，官方提供的數(shù)據(jù)集只有 516 張圖像，雖然主辦方表示可以使用其他外部數(shù)據(jù)，但 iFLYTEK-MIG 團(tuán)隊(duì)并沒有這樣做?！肝覀儏⒓颖荣惖哪康闹饕球?yàn)證已有算法的有效性，是否能達(dá)到比較好的效果。眼底的疾病，不論是糖尿病視網(wǎng)膜病變，還是其他一些相關(guān)疾病，都是通過對病灶進(jìn)行分割、檢測來做輔助診斷?！?/p>

他們在這個數(shù)據(jù)集上大概投入了一個月時間，基于已有的算法進(jìn)行設(shè)計(jì)改進(jìn)。比賽中，算法的有效性得到了充分證明?！肝磥恚讷@取更多數(shù)據(jù)后，醫(yī)學(xué)影像輔助診斷系統(tǒng)的準(zhǔn)確度可達(dá)到更高水平?！?/p>

而這場比賽的難點(diǎn)在哪里？訊飛表示，「與自然場景圖像不同，眼底圖像的分辨率一般在 4000*3000 像素左右，而有些小的 MA 病灶可能僅占有幾十個像素，而且不同病灶的面積往往相差很大，因此會導(dǎo)致正負(fù)樣本比例失衡、檢出特異性（specificity）較低等問題?！?/p>

針對以上難點(diǎn)，他們基于 coarse-to-fine 思想做了如下改進(jìn)：

在 Encoder-Decoder 框架下融合空洞卷積操作、self-attention 機(jī)制，設(shè)計(jì)出一種新的分割網(wǎng)絡(luò)，在不損失原始圖像信息的前提下，快速定位出可疑病灶區(qū)域并給出分割邊界。
新增了一個虛警抑制網(wǎng)絡(luò)以及矯正網(wǎng)絡(luò)，提高靈敏度和特異性。

與 LUNA 評測的區(qū)別

值得一提的是，半年前，訊飛在 LUNA 上獲得平均召回率 94.1% 的檢測效果，刷新世界紀(jì)錄。LUNA (LUng Nodule Analysis) 評測是肺結(jié)節(jié)檢測領(lǐng)域最權(quán)威的國際評測，也是醫(yī)學(xué)影像領(lǐng)域最具代表性、最受關(guān)注的評測任務(wù)之一。召回率低意味著系統(tǒng)會漏掉患者的關(guān)鍵病灶信息，對患者的健康造成很大隱患。

當(dāng)時，為了提升召回率，訊飛主要采用了如下幾種方法：

多尺度、多模型集成學(xué)習(xí)；
使用結(jié)節(jié)分割和特征圖融合的策略來改善虛警的增多和重復(fù)檢測問題；
利用 fully 3D-CNN 模型來計(jì)算特征圖，并在特征圖上進(jìn)行檢測；
提出一種有效樣本挖掘策略，能夠通過在線學(xué)習(xí)過程自動過濾可疑錯誤樣本。

而這種對肺結(jié)節(jié)檢測的方案中，有無可以遷移到這次的眼底檢測比賽中的技術(shù)？訊飛表示，LUNA 中的肺部 CT 是三維數(shù)據(jù)，那時候的方法是基于 3D-CNN。參加 LUNA 前他們已經(jīng)有了肺結(jié)節(jié)方面的輔助診斷系統(tǒng)，所以那次是直接應(yīng)用。這次的眼底圖像比賽是二維圖像，算法上會有比較大差別，具體到任務(wù)上，實(shí)現(xiàn)原理也有所不同。

他們表示：「這對訊飛來說是一個從無到有的過程?！?br/> 后續(xù)，他們在比賽中采用的算法會發(fā)表在相關(guān)領(lǐng)域頂級期刊上，促進(jìn)行業(yè)的共同進(jìn)步?！杆惴ǖ男Ч靶识急容^優(yōu)異，我們覺得對行業(yè)發(fā)展還是能起到一些激勵作用。如果只給醫(yī)生一個『黑盒子』的結(jié)果，那樣很難讓他們信服。」

實(shí)用性考慮

其實(shí)早在 2016 年底，谷歌就利用深度學(xué)習(xí)診斷糖尿病視網(wǎng)膜病變，并號稱取得了與專業(yè)醫(yī)生相媲美的成果。他們當(dāng)時使用使用 Inception-v3 網(wǎng)絡(luò)，利用 12.8 萬幅圖片組成的數(shù)據(jù)集來訓(xùn)練算法。而在 2018 年初，Google 旗下的 DeepMind 宣布訓(xùn)練出了一種 AI 醫(yī)學(xué)影像算法，號稱可以比人類醫(yī)生更加高效準(zhǔn)確地檢查出眼底疾病。他們與 NHS 和全球最好的眼科醫(yī)院之一——倫敦 Moorfields 眼科醫(yī)院，進(jìn)行了長達(dá)兩年的合作，來驗(yàn)證這項(xiàng)算法的有效性。

目前，訊飛醫(yī)學(xué)影像輔助診斷系統(tǒng)已在全國幫助近百家醫(yī)院進(jìn)行肺結(jié)節(jié)和乳腺鉬靶的影像篩查，那么他們這一眼底圖診療算法還有多久投入實(shí)用？他們表示，「在這次算法的有效性被充分驗(yàn)證之后，下一步，我們會確定合作醫(yī)院和科室，對系統(tǒng)進(jìn)行進(jìn)一步的研究?！?/p>

目前來說，國內(nèi)主要的問題是醫(yī)療影像數(shù)據(jù)缺乏統(tǒng)一標(biāo)準(zhǔn)。訊飛在臨床上做的許多試點(diǎn)工作中經(jīng)常會碰到如下難題：基于一家醫(yī)院數(shù)據(jù)學(xué)習(xí)到的系統(tǒng)遷移到另一家醫(yī)院時，系統(tǒng)的效果會有比較大的折扣?！敢?yàn)閲鴥?nèi)各醫(yī)院的影像設(shè)備技師在操作過程中，基本都是按照自己醫(yī)院的小標(biāo)準(zhǔn)去做的；不同影像設(shè)備之間也會有所差異，這些差異對于影像科醫(yī)生來說，花一些時間便可以適應(yīng)，但對于機(jī)器來說，由于它依賴數(shù)值計(jì)算，所以數(shù)值上的很大差異會對機(jī)器造成不利的影響，因此機(jī)器也需要一次再學(xué)習(xí)的適應(yīng)過程，這是很不利于系統(tǒng)推廣的?！?/p>

目前，為了切實(shí)推進(jìn)醫(yī)療影像數(shù)據(jù)的標(biāo)準(zhǔn)化，他們還在根據(jù)不同的醫(yī)院需求去一家家修改系統(tǒng)。

實(shí)用的道路是曲折的，他們補(bǔ)充道，進(jìn)一步改進(jìn)該眼底圖像診斷系統(tǒng)之后，具體應(yīng)用將在年內(nèi)落實(shí)。

競賽詳細(xì)信息：https://idrid.grand-challenge.org/home/

（完）

ISBI：ISBI 是由 IEEE 信號處理協(xié)會 (SPS) 和 IEEE 生物醫(yī)學(xué)工程協(xié)會 (EMBS) 共同發(fā)起的專門研究生物醫(yī)學(xué)成像的國際學(xué)術(shù)會議。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。