0
本文作者: 張棟 | 2018-07-04 15:22 | 專題:2018 CCF-GAIR 全球人工智能與機(jī)器人峰會 |
2018 全球人工智能與機(jī)器人峰會(CCF-GAIR)于6月29日在深圳召開。本次大會共吸引超過2500余位 AI 業(yè)界人士參會,其中包含來自全球的 140 位在人工智能領(lǐng)域享有盛譽(yù)的演講與圓桌嘉賓。
在大會第二天的 【計算機(jī)視覺專場】中,上午計算機(jī)視覺前沿與智能視頻環(huán)節(jié)的演講嘉賓有:ICCV 2011和CVPR 2022大會主席權(quán)龍教授、曠視科技首席科學(xué)家孫劍等人。
下午環(huán)節(jié)為計算機(jī)視覺與醫(yī)學(xué)影像分析,出席的嘉賓分別是包攬7大模式識別與醫(yī)學(xué)影像Fellow的田捷教授,國際頂級醫(yī)學(xué)影像分析大會MICCAI 2019 聯(lián)合主席沈定剛教授,微軟亞洲研究院副院長張益肇博士,飛利浦中國首席技術(shù)官王熙博士等。
作為計算機(jī)視覺與醫(yī)學(xué)影像分析環(huán)節(jié)的重量級嘉賓,本次大會,田捷教授向與會觀眾分享了題為“基于人工智能和醫(yī)療大數(shù)據(jù)的影像組學(xué)研究及其臨床應(yīng)用”的精彩專題報告。
田捷教授現(xiàn)任中國科學(xué)院自動化所研究員、分子影像重點實驗室主任。自2010年起,田捷教授連續(xù)獲得計算機(jī)視覺與醫(yī)學(xué)影像分析領(lǐng)域的7大Fellow:IEEE Fellow、IAMBE Fellow、SPIE Fellow、AIMBE Fellow、IAPR Fellow、OSA Fellow、ISMRM Fellow。同時也是兩項國家重點基礎(chǔ)研究發(fā)展計劃(973計劃)首席科學(xué)家。
田捷教授認(rèn)為,人工智能等技術(shù)給醫(yī)學(xué)領(lǐng)域帶來的改變是毋庸置疑的,并列舉了幾個醫(yī)學(xué)常見案例進(jìn)行輔證。
在他看來,醫(yī)療大數(shù)據(jù)里最常見的是影像數(shù)據(jù),而且影像數(shù)據(jù)格式標(biāo)準(zhǔn),容易獲取、容易使用。但是醫(yī)療大數(shù)據(jù)不僅限于影像,還包括病理、臨床治療信息等,只有這些信息融合在一起,我們才能建模,才能解決人工智能真正在醫(yī)學(xué)上的應(yīng)用。
田捷教授在研究學(xué)術(shù)的同時,也在積極探索AI技術(shù)的應(yīng)用前景。他認(rèn)為,AI技術(shù)只有跟臨床掛鉤才有價值,經(jīng)過企業(yè)家的轉(zhuǎn)化才能變成生產(chǎn)力。
現(xiàn)在我們需要更多人工智能和大數(shù)據(jù)在醫(yī)療問題上的典型應(yīng)用,來拉動產(chǎn)業(yè),拉動人工智能進(jìn)一步深度應(yīng)用。這是相輔相成的,空喊方法,不形成規(guī)?;?、典型應(yīng)用,是解決不了問題的。只有得到外科、內(nèi)科大夫承認(rèn)的技術(shù)和臨床應(yīng)用,才能更加有意義。
與此同時,他還表示,人工智能在醫(yī)學(xué)上應(yīng)用一定要“醫(yī)工交叉”,工科的人要穿上醫(yī)學(xué)的馬甲,了解醫(yī)學(xué)的問題,參加醫(yī)學(xué)的會,了解醫(yī)生的需求;作為醫(yī)生也要對工科的方法知其然,這樣才能源于臨床,高于臨床,又回歸臨床。
以下為田捷教授的現(xiàn)場演講內(nèi)容,雷鋒網(wǎng)作了不改變原意的編輯及整理:
我下面匯報的是人工智能和醫(yī)療大數(shù)據(jù)在醫(yī)學(xué)上的應(yīng)用,這是大家比較關(guān)注的熱門話題,我想從“臨床”和“商業(yè)”兩個方面來做一下簡要的歸納。
人工智能在醫(yī)學(xué)上的應(yīng)用和傳統(tǒng)中醫(yī)非常相像。我國中醫(yī)幾千年以來,通過“望聞問切”的方式積累了幾百萬人甚至幾千萬人的醫(yī)療大數(shù)據(jù),后期主要通過人腦來“加工”這些數(shù)據(jù);現(xiàn)代社會與此前不同的是,我們使用電腦加人腦,利用此前積累的經(jīng)驗以及大數(shù)據(jù)與人工智能技術(shù),實現(xiàn)了現(xiàn)在所說的智能醫(yī)療。
人工智能目前是國家戰(zhàn)略,健康中國2030也是國家戰(zhàn)略。從這兩個角度來說,通過人工智能技術(shù)和醫(yī)療大數(shù)據(jù),提高人們的健康水平是國家下一步的重點發(fā)展戰(zhàn)略;與此同時,國家也有計劃要將我們的醫(yī)療和健康占GDP的比重從3%提升到30%。
從商業(yè)角度出發(fā),人工智能在醫(yī)學(xué)上的應(yīng)用機(jī)會很多,包括通過計算能力驅(qū)動肺癌、糖網(wǎng)、乳腺癌等疾病的篩查。
今天,我想重點與大家分享的是人工智能對于臨床醫(yī)療的重要性,它能提高我們的臨床醫(yī)療水平,實現(xiàn)精準(zhǔn)醫(yī)療,具體涉及到術(shù)前、術(shù)中、術(shù)后三個方面。
從目前醫(yī)學(xué)發(fā)展背景來看,人工智能、大數(shù)據(jù)等技術(shù)在醫(yī)學(xué)上的應(yīng)用是眾勢所趨。去年北美放射醫(yī)學(xué)大會上給出描述:未來的影像中心就像飛機(jī)駕駛艙一樣,是各種各樣信息的綜合體;而未來的醫(yī)生則相當(dāng)于飛行員,要處理各種各樣的信息。這里還需重點闡述一個觀點:如今很多聲音表示,AI未來將要替代醫(yī)生。在我看來,AI不會替代醫(yī)生,只會更有效地輔助醫(yī)生。而醫(yī)生也不應(yīng)懼怕新興技術(shù),而是積極地去利用它,使用它。
當(dāng)今,我們處于信息變革的時代,醫(yī)學(xué)大數(shù)據(jù)也在不斷的增長和積累,平均每73天,醫(yī)學(xué)數(shù)據(jù)就會增長一倍。因此,基于醫(yī)療大數(shù)據(jù)的人工智能醫(yī)療必將輔助甚至改變傳統(tǒng)的臨床診療流程。
國際影像戰(zhàn)略策略研討會副主席Donoso說了一句很經(jīng)典的話,人工智能是否會完全替代影像科醫(yī)生無法下定論,但我們肯定的是,那些使用人工智能技術(shù)的影像科醫(yī)生,勢必會代替那些不使用人工智能技術(shù)的醫(yī)生。
不跟隨時代的發(fā)展,面臨的就是殘酷的淘汰,無論是北美放射年會,還是歐洲放射年會,都不斷的在突出人工智能在影像學(xué)中的異軍突起的作用。
所以,未來的影像科醫(yī)生,不僅僅要會看片子,還要從影像大數(shù)據(jù)中挖掘大量的潛在知識,學(xué)會利用人工智能技術(shù),站在科技潮流的前端,不是懼怕新興的人工智能技術(shù),而是利用它,使用它,成為新時代下的影像信息學(xué)專家。
上個月剛剛結(jié)束的美國臨床腫瘤年會ASCO2018,該年會的參與者大多為內(nèi)科大夫、腫瘤大夫,他們也提出,要將人工智能技術(shù)作為輔助新一代無創(chuàng)診療技術(shù)發(fā)展的重要工具。
Dana-Farber癌癥研究所首席研究員Geoffrey指出,無創(chuàng)的液體活檢技術(shù)可以更加便捷的實現(xiàn)肺癌的早期檢測和篩查,血液中游離DNA可以成功檢測出早期肺癌。而隨著這種無創(chuàng)檢測手段的進(jìn)步,醫(yī)學(xué)數(shù)據(jù)不斷積累,機(jī)器學(xué)習(xí)方法將有效提高檢測精度、提高測試性能。
此外,南加州大學(xué)生物科學(xué)學(xué)院院長在大會指出,在腫瘤療效評估中,結(jié)合基于液體活檢技術(shù)的基因蛋白組學(xué)和基于深度學(xué)習(xí)方法的智能影像評估可有效預(yù)測患者的預(yù)后生存。
由此可見,無論是在癌癥診斷還是治療中,人工智能技術(shù)都是輔助新一代無創(chuàng)診療技術(shù)發(fā)展的重要工具。
那么,人工智能在醫(yī)學(xué)領(lǐng)域到底如何應(yīng)用,接下來我會舉一些例子說明。
舉例之前,我們首先必須了解影像組學(xué)概念,其2012年就被提出,是由英文“組學(xué)+放射”組合出來的新詞:“radiomics”,我們當(dāng)年認(rèn)為把它翻譯成“放射組學(xué)”比較準(zhǔn)確。
當(dāng)年為什么用了放射這樣一個詞匯?它是基于CT進(jìn)行掃描的數(shù)據(jù),然后在PET和超聲上得到應(yīng)用,所以我們認(rèn)為將“radiomics”翻譯成影像組學(xué)可能更為精準(zhǔn),它不僅僅融合了醫(yī)學(xué)影像、基因、臨床大數(shù)據(jù),它也把組學(xué)的概念和組學(xué)的方法融合在一起。
它的工作流程與醫(yī)生日常讀片完全是一模一樣的方法,針對影像數(shù)據(jù),提取特征,人工智能建模,然后再進(jìn)行臨床應(yīng)用、輔助決策。這個流程也是一個標(biāo)準(zhǔn)的計算機(jī)視覺流程,也是標(biāo)準(zhǔn)的模式識別流程。
但它相比醫(yī)生的高能之處在于計算機(jī)看到了高維信息,可能看到了蛋白基因在宏觀影像上的變化,這樣的寶貴數(shù)據(jù)可以輔助醫(yī)生提升臨床診斷的正確性和準(zhǔn)確性。
需要注意的是,人工智能技術(shù)在醫(yī)學(xué)上的研究、應(yīng)用,不是寫文章、不是談概念、也不是紙上談兵、更不僅僅是做篩查,而是要將技術(shù)與臨床緊密結(jié)合,解決實際臨床問題。
下面我就從臨床和技術(shù)兩個方面談一下人工智能在醫(yī)學(xué)上的具體應(yīng)用。
首先我想談?wù)勅斯ぶ悄茉谂R床上的應(yīng)用,在座各位很多都是技術(shù)人員,對于技術(shù)方法比較了解。其實我們在了解技術(shù)本身的同時,更需要了解技術(shù)到底能夠解決什么問題,或者說目前醫(yī)學(xué)需要解決什么問題。所以我先從問題為導(dǎo)向,觀察臨床上有何需求。
在這里,我想舉一個細(xì)分例子,圍繞著臨床應(yīng)用的術(shù)前、術(shù)中、術(shù)后,來說明人工智能如何使得醫(yī)學(xué)治療更加精準(zhǔn)。
第一個例子是結(jié)直腸癌。
外科大夫在為病患做手術(shù)之前都會為患者做一個輔助化療,以控制癌癥的發(fā)展,之后再為他進(jìn)行手術(shù)。
在這個過程中,一部分病患非常不幸,經(jīng)過輔助化療之后,他們病理上完全緩解,體內(nèi)也沒有癌細(xì)胞存在,但外科大夫無法憑借他的經(jīng)驗來肯定判斷他們體內(nèi)是否還有癌細(xì)胞潛藏,所以不得不還為這些病人開刀(實際上病患身上已經(jīng)沒有癌細(xì)胞存在)。
從這來看,我們能否通過其他方式來準(zhǔn)確判別病人的實際數(shù)據(jù),讓他們在外科大夫的經(jīng)驗無法準(zhǔn)確判定、常規(guī)的影像磁共振無法精確判別時,能夠非??隙ǖ嘏卸ú∪说臄?shù)據(jù)。
通過人工智能分析,目前我們有90%的把握能把這些PCR緩解的病人挑選出來。換句話說,系統(tǒng)能夠?qū)⒔?jīng)過輔助化療以后,體內(nèi)沒有癌細(xì)胞的病人找出來。后期,這部分病人就可以免受開刀,只需密切觀察隨訪即可。
所以,它的臨床意義非常大,人工智能未來不僅僅能夠做篩查,更重要是,它能針對臨床問題來開展工作。這是我們配合北京大學(xué)腫瘤醫(yī)院放射科專家做的工作,這個結(jié)果已經(jīng)發(fā)表在臨床腫瘤研究的頂級雜志上。
第二個例子還是結(jié)直腸癌。
如果病患經(jīng)過化療之后并沒有PCR緩解(占比70%左右),那么他們是需要進(jìn)行手術(shù)的。開刀之后,醫(yī)生需要對他們做淋巴清掃,以防止癌細(xì)胞轉(zhuǎn)移。
問題是:清掃完之后顯示,70%的淋巴是假陽性。
這里需要說明的是,假陽性結(jié)果與中國醫(yī)生的開刀技術(shù)沒有直接關(guān)系,美國大夫開刀假陽性也有70%左右。而這個問題也可以用人工智能技術(shù)解決。
我們用人工智能技術(shù)處理500例臨床病理、影像數(shù)據(jù)完整的結(jié)直腸癌患者數(shù)據(jù),經(jīng)過病理、影像,提取特征以后,在實測中,能把70%的淋巴假陽性降到30%,這是醫(yī)學(xué)上非常巨大的進(jìn)步。
目前這項研究也發(fā)表在臨床腫瘤的頂級雜志JCO上。需要指出的是,其第一作者只是一個碩士二年級的小女孩,所以我們在醫(yī)學(xué)領(lǐng)域的研究并不需要多少臨床經(jīng)驗,關(guān)鍵是先要找到臨床問題,以問題為導(dǎo)向來解決它,并不是一味的低頭專耕技術(shù)。
第三個例子依舊是結(jié)直腸癌。
剛才我已經(jīng)講了術(shù)前及術(shù)中,術(shù)前有沒有病理學(xué)的緩解,術(shù)中要不要進(jìn)行淋巴清掃。我們再來看術(shù)后,結(jié)直腸癌患者做了手術(shù)之后,外科大夫還可以給他做一個放化療控制遠(yuǎn)端轉(zhuǎn)移。
這里又出現(xiàn)了一個問題,經(jīng)過手術(shù)后的結(jié)直腸癌患者遠(yuǎn)端轉(zhuǎn)移的概率只有20%,換句話說,有80%的患者花了錢,忍受了放化療的痛苦,而去做在他身上也許不可能發(fā)生或者概率非常小的遠(yuǎn)端轉(zhuǎn)移。
就此,我們能否用人工智能技術(shù)把這些概率大的人挑選出來,再去做放化療,控制他遠(yuǎn)端轉(zhuǎn)移;而概率不大的人也就沒必要做遠(yuǎn)端轉(zhuǎn)移,后期觀察即可。
目前我們正在做相關(guān)的人工智能技術(shù)落地實驗,希望這個概率可以提升更高,預(yù)測得更為精準(zhǔn)。
綜上,我舉了一個非常完整的例子,從術(shù)前、術(shù)中、術(shù)后來說明人工智能、影像組學(xué)、醫(yī)療大數(shù)據(jù)到底怎么改變我們的醫(yī)學(xué),改變我們的精準(zhǔn)診療。
剛才我所提到的都是手術(shù)方面的內(nèi)容。那么,人工智能能否解決不用開刀也能解決的問題呢?也就是說,其能否既可以輔助外科大夫,也可以輔助內(nèi)科大夫。
我們知道,即使是美國著名醫(yī)院的外科大夫得了肺癌,他也不知道該用什么樣的靶向藥,怎么預(yù)測他的生存期。
而這個工作可以用人工智能、大數(shù)據(jù)來解決,我們針對500余例晚期EGFR突變靶向治療患者多中心CT數(shù)據(jù),利用LASSO-COX構(gòu)建反映靶向治療無進(jìn)展生存期預(yù)測模型,實現(xiàn)對EGFR突變的晚期肺癌患者靶向治療無進(jìn)展生存期進(jìn)行個性化的精準(zhǔn)預(yù)測。
如果后期發(fā)現(xiàn)他無進(jìn)展,這時候我們就提醒他不要再用這個靶向藥,價格昂貴不說,效果也不大。目前這項研究發(fā)表在CCR上,也是國內(nèi)學(xué)者解決的重點醫(yī)學(xué)工作。
舉例來說,系統(tǒng)可以對病患的鼻煙癌給出判斷及生存期預(yù)測。
針對臨床指標(biāo)對晚期鼻咽癌的放療后預(yù)測精度低的現(xiàn)狀,我們對118例晚期鼻咽癌T1和DCE MR圖像做了超過3年時間的隨訪,并結(jié)合970個影像組學(xué)特征,和臨床病理信息進(jìn)行分析,在此有效預(yù)測該類患者的預(yù)后,準(zhǔn)確度超臨床指標(biāo)的10%。
再舉一個例子,我國是肝癌大國,肝纖維化、肝硬化、肝癌是肝癌患者的病變?nèi)角?/p>
所以,對于肝癌患者的治療,準(zhǔn)確判斷他們的肝纖維化非常重要。過去醫(yī)生一般用超聲診斷,但是超聲的判斷準(zhǔn)確率只有百分之六七十左右。想要準(zhǔn)確判斷還需要做一個痛苦的工作:肝穿。用一根穿刺針穿到病患肝里面用病理學(xué)組織來確定到底有沒有纖維化,從而決定用不用抗病毒的治療方法。
問題來了:能不能用人工智能技術(shù)來處理這些數(shù)據(jù),不做肝穿也能達(dá)到跟它一樣的病理學(xué)效果。
針對這個問題,我們走訪了12家醫(yī)院,采取了600多份數(shù)據(jù)樣本,用深度學(xué)習(xí)來提取它的特征,實測表明,在使用過程中,人工智能的預(yù)測結(jié)果與肝穿方法非常一致。
換句話說,它能夠代替以往的肝穿治療方式,讓病患不需忍受痛苦,用幾張圖片就能達(dá)到絕佳效果。
在后來的研究過程中,有相關(guān)醫(yī)生提出,炎癥會不會對結(jié)果產(chǎn)生影響。可以肯定地說,人工智能在對輕度炎癥困擾上沒有差別;對于重度炎癥有一些差別,但是影響不大,準(zhǔn)確率還是會遠(yuǎn)遠(yuǎn)高于人工判斷。
后來又有人提出,能否將該技術(shù)轉(zhuǎn)化為一個軟件,做商業(yè)化應(yīng)用。后期驗證過程中,我們發(fā)現(xiàn)無論是輕度肝硬化還是重度肝硬化,效果都比較魯棒,適合醫(yī)院臨床應(yīng)用。
在這里我必須強(qiáng)調(diào)一點,人工智能在醫(yī)學(xué)上的應(yīng)用最好是以問題導(dǎo)向,有了問題再找方法,再去解決。我們可以源于臨床,高于臨床,這時候我們再商業(yè)化應(yīng)用,醫(yī)生們就不會抵觸,他會主動來使用,因為可以很好地幫助他們輔助診斷。
以上是從臨床角度講了人工智能在醫(yī)學(xué)上的應(yīng)用。接下來我再從技術(shù)角度來講人工智能、模式識別、大數(shù)據(jù)在醫(yī)學(xué)上應(yīng)用的進(jìn)展。
以腫瘤治療為例來說。
首先是腫瘤分割,一般可能需要醫(yī)生先進(jìn)行勾畫,然后可以用機(jī)器學(xué)習(xí)的方法進(jìn)行半自動或者全自動的分工,這些分割都可以提取相關(guān)的影像組學(xué)的特征,使得我們用人工智能的方法來建模分析。這一塊的技術(shù)方法有很多,但是坦率說,哪種方法好,還得針對你遇到的問題。
第二方面是特征描述,影像組學(xué)、人工智能并不是比人更加聰明,只不過醫(yī)生讀片時,人眼提取的信息永遠(yuǎn)是以形狀為主的,以結(jié)構(gòu)為主的。
而從影像組學(xué)提取的特征,是強(qiáng)度、紋理、小波,最大值、標(biāo)準(zhǔn)方差、灰度矩陣這些特征,人眼是沒法看的,同時人腦也難以加工。
對于計算機(jī)來說,恰恰是它最為擅長的。
所以在特征選擇上,計算機(jī)選擇的特征和人眼識別的特征形成了互補(bǔ)關(guān)系。如果我們能用計算機(jī)提取高維特征,包括毛刺、分葉等信息,再融合年齡、性別、家族史等信息,肯定是1+N>N,我們就能實現(xiàn)人機(jī)交互、計算機(jī)和人協(xié)同工作,從而使得我們的醫(yī)學(xué)更為精準(zhǔn)。
選擇特征的時候切記要多多益善,特別是把這些高維特征提取得越多越好。還有一個非常重要的點,為什么現(xiàn)在影像組學(xué)、人工智能熱,就是這些高維特征含有基因蛋白這些微觀信息,在這些宏觀的影像上的體現(xiàn),只不過過去人眼提取不了,但現(xiàn)在計算機(jī)提取了,把這些信息來進(jìn)行系統(tǒng)加工,使得我們的預(yù)測更加精準(zhǔn)
提取特征之后,還有一項非常重要的工作是降維。共有四類主要特征降維方法:稀疏選擇、空間映射、神經(jīng)網(wǎng)絡(luò)、遞歸排除。
針對具體臨床問題,業(yè)界還采用建立計算機(jī)定量影像特征與所研究臨床研究問題標(biāo)簽之間的分類模型。主要運(yùn)用了兩類模型:
SVM模型:從影像大數(shù)據(jù)原始像素出發(fā),提取高維手工設(shè)計特征并進(jìn)行特征選擇,構(gòu)建影像特征與臨床問題的分類模型。
CNN模型:在影像大數(shù)據(jù)的原始像素的基礎(chǔ)上,該模型可自主挖掘與臨床問題相關(guān)的影像組學(xué)特征,構(gòu)建影像特征與臨床問題的分類模型。
至于建模部分,前面很多講者也講了很多模型,人工智能、深度學(xué)習(xí)有一系列的模型,無所謂哪種模型好,關(guān)鍵是針對你的問題,你是要做生存期預(yù)測,還是要做療效評估,針對我們在醫(yī)學(xué)上不同的使用的對象和問題,我們應(yīng)該選擇不同的方法。
有了方法之后,我們構(gòu)建的模型可以提高分類精度,甚至能達(dá)到主治醫(yī)生的水平,大家已經(jīng)看到了很多例子,我就不展開細(xì)說。
但是這里面還有一個非常重要的環(huán)節(jié),是我們做計算機(jī)、做工科最容易忽視的:我們往往把模型建出來,就直接把這些結(jié)果拿給醫(yī)生去看,希望醫(yī)生可以去使用。
這時候,你一定會吃閉門羹,因為醫(yī)生肯定會說這不是我需要的東西,你這些模型我看不懂,我根本沒法用。
所以后期非常重要的步驟就是:要讓他們看圖識字,要把這些數(shù)據(jù)可視化。你給醫(yī)生們一大堆模型,他會覺得很難懂,換成圖片之后,他就覺得非常好用,我們要從醫(yī)生的角度看問題,把模型可視化。
另外,計算機(jī)處理離不開數(shù)據(jù),這些數(shù)據(jù)質(zhì)量到底怎么樣,我們也要從醫(yī)生的觀點來看待它。
去年臨床腫瘤學(xué)雜志上發(fā)表了一篇文章,是以荷蘭大夫為主發(fā)表的,他在談數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)的評價,給出了16個評價標(biāo)準(zhǔn),36分是滿分,進(jìn)行數(shù)據(jù)質(zhì)量打分,而且他也會編程序,編一些簡單的程序,把它放到網(wǎng)上,你直接填表打分,最后告訴你數(shù)據(jù)質(zhì)量是怎么樣的,我覺得目前也是對醫(yī)學(xué)用人工智能判斷,用影像組學(xué)第一個比較公開的數(shù)據(jù)標(biāo)準(zhǔn),值得大家借鑒、參考。
剛才我從技術(shù)方面談了人工智能怎么針對醫(yī)療問題,用什么樣的方法解決。涉及分割、特征提取、模型構(gòu)建、模型可視化、質(zhì)量控制5個環(huán)節(jié)。
最后我想提一下人工智能在醫(yī)學(xué)影像應(yīng)用未來的發(fā)展方向,主要涉及到人工智能的方法、數(shù)據(jù)、軟件、共享平臺。
我們現(xiàn)在不缺方法,也有很多數(shù)據(jù),也有各種各樣的軟件,但是我缺乏交流共享的平臺,我們這個會議也是一個交流共享的平臺,我也建議我們相關(guān)企業(yè)在會后把相關(guān)的資源共享出來,這樣可以更好地促進(jìn)人工智能在醫(yī)學(xué)領(lǐng)域的應(yīng)用。
我先從模型講起,這幾年人工智能的模型有很多,有卷積神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)、博弈進(jìn)化模型,數(shù)據(jù)也在不斷地增多,智能程度也在不斷地提高,所以我做了一個二維的方陣來說明這個問題。
遷移學(xué)習(xí)經(jīng)過大數(shù)據(jù)訓(xùn)練,我們可以在醫(yī)學(xué)的小數(shù)據(jù)上提取到復(fù)雜的影像特征,而且這些特征還有很好的解釋性。與此同時,我們所提取的高維特征又會帶來一個挑戰(zhàn),臨床醫(yī)生表示看不懂且不知道有何意義。
此時,我們無法對于醫(yī)生的困惑做出解釋,因為這是計算機(jī)分析出的結(jié)果,我們不能說它跟肝的哪個血管對應(yīng),跟腎的哪個細(xì)胞對應(yīng)。
但是我們也可以把這些特征,用強(qiáng)特征分布的熱點圖表達(dá)出來,它有一定的可視化,對這樣的強(qiáng)特征的熱點圖,你去做穿刺或者靶向治療的時候,穿刺效果就會非常好。
與此同時,我們還可以用遷移學(xué)習(xí)的深度學(xué)習(xí)方法來提高肺癌基因突變預(yù)測的精度。
遷移學(xué)習(xí)模型是經(jīng)過128萬張圖片訓(xùn)練出來的,我們做肺癌的時候可能沒有這么多圖像,但是如果我們想要提高它的預(yù)測精度,我們用前面圖像訓(xùn)練過的模型可能也會得到比較好的效果。
另外,大家知道現(xiàn)在博弈進(jìn)化模型比較熱,它可以讓機(jī)器學(xué)習(xí)提高智能程度,這在醫(yī)學(xué)上的應(yīng)用也非常重要。
需要指出的是,我們用人工智能做組學(xué)分析,我們需要多病種、多模態(tài)、多中心、多參數(shù)的數(shù)據(jù)融合,在這一塊,還有非常重要的點是數(shù)據(jù)標(biāo)準(zhǔn),雖然我們國家這一塊現(xiàn)在已經(jīng)非常重視,做了一系列的籌備,但是目前為止還沒有出來一個影像大數(shù)據(jù)的數(shù)據(jù)標(biāo)準(zhǔn),或者數(shù)據(jù)規(guī)范化的行業(yè)標(biāo)準(zhǔn),所以依然是一個挑戰(zhàn)。
目前,我們醫(yī)院有大量的數(shù)據(jù),大量的數(shù)據(jù)不代表就是大數(shù)據(jù),我們需要經(jīng)過數(shù)據(jù)清洗,影像的數(shù)據(jù)相對來說還比較規(guī)范一些,但是病理的信息、治療的信息、預(yù)后的信息我們都需要有,才能使得人工智能做更準(zhǔn)確的預(yù)測。
所以在這里我也想說,前面我舉的那些例子,淋巴清掃的工作,原來我們是想做生存期預(yù)測的,但生存期預(yù)測我們需要兩年以上的病人隨訪,因此很多信息的提取還需要醫(yī)療從業(yè)人員去科普,需要讓患者知道,我們做臨床研究需要大量的信息才能做綜合。
幸運(yùn)的是,我們國家人口多,病人多,所以數(shù)據(jù)也是我們的天然優(yōu)勢,這幾年我們配合不同的醫(yī)院采取的數(shù)據(jù),包括兒童水果細(xì)胞瘤這樣一種眼底的腫瘤,我們都能收集相關(guān)數(shù)據(jù);肺癌、乳腺癌的數(shù)據(jù)量更大。這些數(shù)據(jù)不太牽涉到隱私,我們提取的都是高維信息,我們也不需要存原始圖象,所以從某種意義上說這些數(shù)據(jù)的隱私性是比較好解決的。
有了數(shù)據(jù),我們還需要軟件,我們可以開發(fā)各種各樣的軟件,特別是醫(yī)學(xué)圖象處理的軟件,我們實驗室有三個軟件,第一個是MITK,是醫(yī)學(xué)軟件的集成平臺,包含重建、分割可視化;還有一個是3D軟件;另外我們還有一個影像組學(xué)的軟件,全部是開源的,在我們的網(wǎng)站上可以下載。
人工智能在醫(yī)學(xué)上的應(yīng)用一定要醫(yī)工交叉,我們工科的人要穿上醫(yī)學(xué)的馬甲,了解醫(yī)學(xué)的問題,參加醫(yī)學(xué)的會,了解醫(yī)生的需求,作為醫(yī)生也要對工科的方法知其然,你也許不知其所以然,但是你要知其然,這樣我們才能源于臨床,高于臨床,又回歸臨床,不只是看一個病,不只是一個軟件。
我就匯報到這里,敬請各位批評指正,謝謝大家。(完)
觀眾提問:剛才您說了要從影像里面提取高維信息,并且說了要源于臨床,最后還要回歸臨床,這些高維信息是由誰來提?是醫(yī)生來提,還是我們工科的人來提?我還聽說您那里面有的有400個高維信息,我看到有的文章好像更多,這些信息是怎么提出來的?
田捷教授:這個問題提得非常好,也非常關(guān)鍵。如果用計算機(jī)去做,還是停留在結(jié)構(gòu)特征上,我們能彌補(bǔ)一些醫(yī)生的錯誤,但是不能輔助診斷。
剛才舉例子講的這些高維信息,它到底有沒有用,醫(yī)生也不知道,我們也不知道,但是用計算機(jī)、深度學(xué)習(xí)把它提取之后,我們只能嘗試,有些問題可能能很好地解決,有些問題現(xiàn)在還解決不了,我們只是提取這幾百個甚至上千個特征,跟那些特征、病理信息融合在一起,我們再去篩選,把關(guān)鍵的信息提取出來,這是降維,最后再建模,然后取得一個好的結(jié)果。
跟醫(yī)生在交互的過程中,這些特征是人眼看不了的,醫(yī)生也搞不清楚,我們拿這些特征去投稿的時候,大部分醫(yī)生是看不懂的,我們投到醫(yī)療雜志上,他會問你這到底有什么效果,我們說不清楚,所以我們把那些東西變來變?nèi)?,終于變成熱力圖的模式,最后說明這可能是腫瘤的中心地帶,它能反映這樣的問題,他能看懂了,知道這是有問題的,然后就接受了我們的論文。
我們這些特征不僅僅說明它有用,還要想辦法跟醫(yī)生溝通,把這些特征變成可視化的,讓醫(yī)生能接受,說明它的臨床意義。這也是一個痛苦的交互過程。
觀眾提問:剛才我看到您的遷移學(xué)習(xí)的工作,把上百萬張自然圖像遷移到肝臟的醫(yī)學(xué)圖像上,但是我看到有文章說遷移學(xué)習(xí)必須要有醫(yī)學(xué)的意義,如果您這樣做的話,讓自然圖象遷移到醫(yī)學(xué)圖像上,它的臨床意義在哪兒?醫(yī)生會接受這樣做嗎?
田捷教授:醫(yī)生能不能接受,關(guān)鍵看臨床效果,關(guān)鍵看你能不能針對臨床解決問題。
我沒有去計算機(jī)視覺的會議,我現(xiàn)在反而是跑到美國臨床腫瘤學(xué)會、美國腫瘤學(xué)會的會議上,你要到臨床醫(yī)生那里,讓他們“折磨”你,找出他們能接受的臨床效果和臨床意義,這時候你的模型才真正起作用,我們老在計算機(jī)視覺會議上談我的方法和參數(shù)好,我覺得意義不大,當(dāng)然能寫文章,只是把紙變成錢。
所以我說我們技術(shù)人員要穿上醫(yī)生的馬甲,到醫(yī)學(xué)的會議上交流。我是工科生,但近些年我沒有發(fā)表一篇計算機(jī)方面的文章,都是醫(yī)學(xué)的文章。這一點我非常自豪,我能在醫(yī)學(xué)的雜志上發(fā)文章,就非常具有臨床意義,因為審稿人都是醫(yī)生,說明我已經(jīng)穿上醫(yī)生的馬甲了。
我認(rèn)為,這是所有想在醫(yī)學(xué)領(lǐng)域深耕的工科生都需要做出的轉(zhuǎn)變,必須站在醫(yī)生的角度去思考問題,讓他們來當(dāng)裁判,讓他們來鑒別。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章