0
近兩年的AI醫(yī)工交叉方法論,工,以數(shù)據(jù)驅(qū)動為根本,忽略領(lǐng)域知識的作用;醫(yī),則扮演數(shù)據(jù)標(biāo)注工人的角色,醫(yī)生的醫(yī)學(xué)領(lǐng)域知識難以發(fā)揮作用。但由于醫(yī)學(xué)的獨(dú)特性,我們需要重新審視兩者的角色和關(guān)系,醫(yī)生應(yīng)該參與到算法開發(fā)的過程中,醫(yī)生的醫(yī)學(xué)知識和臨床經(jīng)驗(yàn)應(yīng)該融入到算法設(shè)計(jì)中。
——李純明
李純明是個(gè)“粗線條”的人,每次在自己發(fā)起并一手籌辦的圖像計(jì)算與數(shù)字醫(yī)學(xué)國際研討會(ISICDM)上,或是因?yàn)樘?,開幕式發(fā)言他幾乎不做準(zhǔn)備,頗為隨性,時(shí)而前言不搭后語,他自己以及臺下的觀眾從不覺得這有什么不當(dāng)。
如參會者所說,這才是真實(shí)的李純明。
李純明也是個(gè)完美主義者,每當(dāng)參加完ISICDM大會之后,不由感慨他對大會內(nèi)容質(zhì)量的把控之嚴(yán)格,主題設(shè)置之細(xì)致。
這也是真實(shí)的李純明。
原本10分鐘的采訪,由于他的各種“發(fā)散”,最終進(jìn)行了2個(gè)多小時(shí),直至凌晨1點(diǎn)。采訪過程中,他多次強(qiáng)調(diào)一個(gè)問題:一個(gè)學(xué)術(shù)會議,無論是組織方邀請嘉賓,還是觀眾聽報(bào)告,不要單純沖著講者的知名度和職位,而應(yīng)該關(guān)注會議的學(xué)術(shù)內(nèi)容。對于ISICDM這樣一個(gè)理工醫(yī)大融合的會議,更要加強(qiáng)跨學(xué)科的交流,以促進(jìn)不同專業(yè)人士的學(xué)術(shù)交流與合作,激發(fā)產(chǎn)學(xué)研醫(yī)協(xié)同創(chuàng)新與技術(shù)落地。
“我組織會議過程中,會針對會議的主題跟一些嘉賓預(yù)先交流一下他們報(bào)告題目和內(nèi)容的安排,對嘉賓我會建議他盡可能把一個(gè)工作的 ‘ 是什么,怎么做,為什么 ’解釋清楚,讓聽眾知其然還要知其所以然,就是一個(gè)好報(bào)告。而不是像記流水賬似的把自己和團(tuán)隊(duì)的做過的研究項(xiàng)目一一匯報(bào)?!?/p>
電子科技大學(xué)李純明教授
ISICDM大會發(fā)起人兼大會程序主席李純明長期專注于圖像分割和三維重建及相關(guān)問題的研究,其在圖像分割和水平集方法的研究中作出了有國際影響力的重要貢獻(xiàn)。
自2005年以來,李純明教授以第一作者的身份發(fā)表了一系列關(guān)于圖像分割與水平集方法的原創(chuàng)性研究論文,在國際學(xué)術(shù)界產(chǎn)生較大的影響,被世界各國學(xué)者頻繁引用,其中一篇水平集方法的論文(2005年發(fā)表在CVPR)單篇他引次數(shù)超過2500次。
李純明2008年發(fā)表在IEEE TIP(圖像處理領(lǐng)域的頂級期刊)的論文,在經(jīng)過五年的時(shí)間考驗(yàn)之后,于2013年榮獲IEEE信號處理學(xué)會最佳論文獎(jiǎng)(注:該獎(jiǎng)每年從過去五年的IEEE信號與圖像相關(guān)的多個(gè)著名期刊中,經(jīng)權(quán)威專家評選出不超過六篇最佳論文,李純明教授的這篇論文是2013年獲得最佳論文獎(jiǎng)的唯一一篇圖像處理方面的文章)。時(shí)隔兩年之后,李純明因?yàn)?010年發(fā)表的另一篇IEEE TIP論文的重要貢獻(xiàn)而獲得了2015年IEEE信號處理學(xué)會最佳論文獎(jiǎng)。值得一提的是,李純明是國際上唯一一位以第一作者身份兩次獲得這個(gè)重要的國際學(xué)術(shù)獎(jiǎng)項(xiàng)的學(xué)者。這兩篇論文都已成為水平集方法和圖像分割領(lǐng)域的經(jīng)典文獻(xiàn),國內(nèi)外很多學(xué)者在這兩個(gè)工作的基礎(chǔ)上做了深入的研究和應(yīng)用。在發(fā)表10年之內(nèi),這兩篇獲獎(jiǎng)?wù)撐牡膯纹螖?shù)都超過了1500多次。
此外,李純明以第一作者身份還發(fā)表了一系列同時(shí)分割與校正磁共振圖像灰度不均勻性的算法論文,在國際上率先開展了對超高場強(qiáng)(如7T)磁共振成像的圖像分割與灰度不均勻性校正的研究,巧妙地把磁共振圖像的成像模型結(jié)合在圖像分割與灰度不均勻性校正算法中,有效地解決了超高場強(qiáng)磁共振圖像灰度不均勻性校正的難題。其中發(fā)表于2011年的一篇IEEE TIP論文,在發(fā)表之后不到八年,單篇引用率已經(jīng)超過980次。
一直很低調(diào)的李純明教授,每次談到現(xiàn)在火熱的AI研究時(shí),他便打趣到,很多人把他當(dāng)做人工智能的學(xué)者,但實(shí)際上他并不會把自己定位為AI學(xué)者。
“現(xiàn)在人工智能的概念被濫用了,我們做的圖像處理與分析算法,因?yàn)槟軐?shí)現(xiàn)某些自動化的功能,很容易被外行當(dāng)作成人工智能。因此,我也算是廣義的人工智能專家了?!?/p>
李純明談到,他現(xiàn)在并沒有專門研究當(dāng)前熱門的深度學(xué)習(xí),而是更喜歡應(yīng)用變分法、偏微分方程和矩陣計(jì)算等數(shù)學(xué)理論和方法解決圖像處理和計(jì)算機(jī)視覺問題。
其實(shí)早在上一波神經(jīng)網(wǎng)絡(luò)火熱的年代,當(dāng)時(shí)的李純明便已專門研究過神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論問題。
“我的本科和碩士都是基礎(chǔ)數(shù)學(xué)專業(yè),后來轉(zhuǎn)到應(yīng)用數(shù)學(xué)領(lǐng)域研究的第一個(gè)課題:研究神經(jīng)網(wǎng)絡(luò)中的函數(shù)逼近問題,比如激活函數(shù)滿足什么充分必要條件才能保證對應(yīng)的神經(jīng)網(wǎng)絡(luò)在某個(gè)函數(shù)空間中可以無限逼近其中任一給定的函數(shù),還研究了用神經(jīng)網(wǎng)絡(luò)逼近抽象無窮維空間(如希爾伯特空間)上的非線性泛函或算子。當(dāng)時(shí)我覺得那樣的研究有點(diǎn)理論脫離實(shí)際,加上后來因?yàn)槲页鰢x電子工程博士而中斷了神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)基礎(chǔ)研究,后來選擇了更感興趣的基于變分法和偏微分方程的圖像處理作為我的博士論文課題?!?/p>
而談到最新一代神經(jīng)網(wǎng)絡(luò)大背景下的AI話題時(shí),李純明指出“深度學(xué)習(xí)是基于神經(jīng)網(wǎng)絡(luò)的萬有逼近能力。應(yīng)用泛函分析、測度論和傅里葉分析的理論可以證明,只要激活函數(shù)不是一個(gè)多項(xiàng)式,神經(jīng)網(wǎng)絡(luò)就可以任意精度逼近任何一個(gè)連續(xù)的輸入輸出系統(tǒng)(即數(shù)學(xué)上的連續(xù)映射)。”
“深度學(xué)習(xí)有一個(gè)吸引人的地方:原則上,它在不同的應(yīng)用中都可以用同樣的訓(xùn)練算法框架,只需要替換訓(xùn)練數(shù)據(jù)和相應(yīng)的標(biāo)注進(jìn)行訓(xùn)練,就能訓(xùn)練出一個(gè)具有某種輸入輸出關(guān)系的多層神經(jīng)網(wǎng)絡(luò)。然后在應(yīng)用的時(shí)候,輸入一個(gè)數(shù)據(jù),系統(tǒng)就輸出一個(gè)結(jié)果,應(yīng)用的過程可以做到全自動。但這種看起來一勞永逸的框架,在實(shí)際應(yīng)用中還有一些局限性?!?/p>
李純明解釋道,這是因?yàn)獒t(yī)學(xué)圖像數(shù)據(jù)是復(fù)雜多變的,不同廠家的成像設(shè)備,不同的成像參數(shù)選擇,和成像設(shè)備的更新?lián)Q代等因素都會導(dǎo)致圖像性質(zhì)(如信噪比、分辨率和偽影等等)的變化,以及不同病人與病情的差異也會導(dǎo)致圖像特征的變化。
訓(xùn)練數(shù)據(jù)如果不夠“大而全”,一旦遇到一個(gè)跟訓(xùn)練數(shù)據(jù)有一定差異的數(shù)據(jù),有時(shí)只是加了一點(diǎn)噪音,神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果可能就會出很大的錯(cuò)誤。但訓(xùn)練數(shù)據(jù)要多“大”多“全”?也沒有一個(gè)客觀的量化標(biāo)準(zhǔn)。
深度學(xué)習(xí)需要用醫(yī)生手工標(biāo)注的數(shù)據(jù),還要求訓(xùn)練數(shù)據(jù)和手工標(biāo)注符合一定的標(biāo)準(zhǔn)。但數(shù)據(jù)的標(biāo)準(zhǔn)化也沒有一個(gè)通用的法則可以遵循。深度學(xué)習(xí)的調(diào)參也沒有規(guī)律可循,調(diào)參的難題至今沒得到實(shí)質(zhì)性的解決。這些都可能會給深度學(xué)習(xí)的應(yīng)用帶來不確定性,在不同數(shù)據(jù)集上的性能可能會很不一樣,魯棒性較差。
在醫(yī)療領(lǐng)域的應(yīng)用上,深度學(xué)習(xí)的不可解釋性也是個(gè)很大的問題,醫(yī)生和病人都很難接受這種不可解釋的診斷結(jié)果和治療方案。李純明認(rèn)為,深度學(xué)習(xí)在醫(yī)療領(lǐng)域離真正的落地還有相當(dāng)大的距離,還需在理論和技術(shù)上有所突破。學(xué)術(shù)界研究深度學(xué)習(xí)不應(yīng)太工程化,應(yīng)該多研究一些基礎(chǔ)性的理論問題,提出更有原創(chuàng)性的算法。
談到近年來的深度學(xué)習(xí)熱,李純明認(rèn)為學(xué)術(shù)界不應(yīng)該一窩蜂的跟風(fēng)做深度學(xué)習(xí)。
學(xué)術(shù)研究還是應(yīng)該多元化,要做到百花齊放,百花爭鳴,這樣才更能有創(chuàng)新,也有更大的機(jī)會產(chǎn)生有實(shí)用價(jià)值的技術(shù)。數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)只是數(shù)據(jù)處理的工具之一,而且有它的局限性。
在有些應(yīng)用上,傳統(tǒng)的方法也能解決問題,而且可能解決得更好,應(yīng)用起來更簡單,為什么不用它呢?李純明經(jīng)常說“做研究應(yīng)該以解決問題為目的,也就是做問題驅(qū)動的研究,而不是方法驅(qū)動或熱點(diǎn)驅(qū)動?!比欢罱鼛啄陮W(xué)術(shù)界跟風(fēng)的趨勢還是很明顯的,現(xiàn)在CVPR等計(jì)算機(jī)視覺的頂級會議的投稿量大增,也是因?yàn)楦L(fēng)做深度學(xué)習(xí)的學(xué)生太多了,加上門檻低,還有開源的代碼可以用,所以CVPR等頂會的論文大多都是深度學(xué)習(xí)的。
確實(shí),近三年眾多CVPR審稿人紛紛向雷鋒網(wǎng)表示,他們看到了CVPR、ICCV、ECCV等頂會上的諸多論文,有很多不同的網(wǎng)絡(luò)設(shè)計(jì)想法和切入角度,這些扎實(shí)的工作推動了現(xiàn)有體系、架構(gòu)的一步前進(jìn),但是,卻普遍缺乏實(shí)質(zhì)性的進(jìn)展,深度學(xué)習(xí)的幾個(gè)主要局限性仍然還沒被突破。
醫(yī)學(xué),最重要的問題之一便是可解釋性。而當(dāng)前工科會議的論文,基于不可解釋的深度學(xué)習(xí)研究成果幾乎成為主流。
上述問題的本質(zhì)是,由于科研人員做的研究總體偏工程,較為缺乏原創(chuàng)性和突破性的基礎(chǔ)研究,導(dǎo)致工程技術(shù)開發(fā)正在進(jìn)入瓶頸期。
“我認(rèn)為,從眼前來講,不應(yīng)該一窩蜂都用數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)。一些醫(yī)學(xué)圖像算法的開發(fā)也應(yīng)該針對不同的應(yīng)用,去設(shè)計(jì)不同的算法,開發(fā)者盡可能在算法中融入領(lǐng)域知識,設(shè)計(jì)出針對特定應(yīng)用的個(gè)性化的方法,而不是對每個(gè)病種都在TensorFlow或Pytorch等開源框架上用不同的數(shù)據(jù)進(jìn)行訓(xùn)練和調(diào)參。而在深度學(xué)習(xí)這種數(shù)據(jù)驅(qū)動的學(xué)習(xí)過程中沒有利用領(lǐng)域知識的機(jī)制, 因此技術(shù)的開發(fā)也就不需要開發(fā)者與醫(yī)生的交流。醫(yī)生在技術(shù)開發(fā)的過程中只起到了對訓(xùn)練數(shù)據(jù)手工標(biāo)注的作用,也就是說醫(yī)生被當(dāng)作人工智能背后的‘標(biāo)注工人’來用了?!?/p>
“數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)不可能包治百病,并且其不可解釋性在醫(yī)學(xué)應(yīng)用上很難讓醫(yī)生和患者放心使用。從長期來講,數(shù)據(jù)為王的醫(yī)學(xué)影像AI研究方法,在未來遇到的問題將會越來越多。而創(chuàng)造出可解釋的、更加精準(zhǔn)的、不過度依賴數(shù)據(jù)的方法,應(yīng)該是醫(yī)工交叉中,工的目標(biāo)。”
今年ISICDM大會上,MICCAI學(xué)會創(chuàng)始主席James Duncan、原TPAMI副主編Baba Vemuri、羅切斯特教授羅杰波等人均提到了研究“Fundamental problem”的重要性,并指出當(dāng)前多數(shù)學(xué)者更多停留在簡單的工程問題,缺乏在基礎(chǔ)研究上的突破性進(jìn)展,企業(yè)界的技術(shù)開發(fā)也因此遭遇瓶頸。
與此同時(shí),現(xiàn)在的深度學(xué)習(xí)其實(shí)是一個(gè)有問題的框架,多用大數(shù)據(jù)和很多標(biāo)注數(shù)據(jù)來訓(xùn)練,這在過去幾年很成功,但不代表是正確的方向。當(dāng)前計(jì)算機(jī)視覺的系統(tǒng)是一個(gè)(特征為)Training System的訓(xùn)練,而不是一個(gè)Learning System,現(xiàn)階段需要從Training System變成Learning System,讓機(jī)器主動,并結(jié)合數(shù)據(jù)的結(jié)構(gòu)、時(shí)間空間結(jié)構(gòu)去學(xué)習(xí),而不是被動地用人工訓(xùn)練來標(biāo)注它。
目前行業(yè)走的是粗放型發(fā)展路線,是靠堆積數(shù)據(jù)和計(jì)算資源來換取高性能,這是資源而不是效率的競賽。在大家把醫(yī)學(xué)影像分析聚焦于Data Set的大環(huán)境下,雖然在工業(yè)界已有一定的成果,但李純明堅(jiān)信,原創(chuàng)性技術(shù)和基礎(chǔ)研究,更值得工科人去關(guān)注和投入。
而兩屆ISICDM大會的議程設(shè)計(jì)也是逆潮流而上,設(shè)置了數(shù)學(xué)以及基礎(chǔ)理論的分論壇和系統(tǒng)性的系列講座,意在讓更多工科學(xué)者打好理論基礎(chǔ),并站在新的視角,以更高的觀點(diǎn)去看待和解決問題。
此外,李純明也談到,舉辦大會邀請嘉賓,他更希望講者分享的理論研究方法,不但走在最前沿,同時(shí)也經(jīng)歷過時(shí)間的驗(yàn)證。
秉承這一理念的李純明,已經(jīng)把ISICDM打造為具有理工醫(yī)跨學(xué)科特色的醫(yī)學(xué)影像大會。
醫(yī)學(xué)AI是門交叉學(xué)科,技術(shù)與產(chǎn)品的創(chuàng)新,離不開醫(yī)生的引導(dǎo)。
李純明通過舉辦兩屆ISICDM大會,意識到了自己過去的認(rèn)知錯(cuò)誤。
“過去很多人覺得醫(yī)生比較保守,不愿意接受人工智能,這是一種誤解。近兩年醫(yī)生非常想和理工科的專家合作,只是沒有找到合適的點(diǎn)?!?/p>
李純明回憶道,今年在幾次大會中聽廣東省人民醫(yī)院梁長虹主任、北京大學(xué)第一醫(yī)院王霄英主任等知名醫(yī)生的報(bào)告時(shí),才發(fā)現(xiàn)原來很多醫(yī)生有自己的智能工程研發(fā)團(tuán)隊(duì),而且醫(yī)生對AI的認(rèn)知也越來越成熟。
因此,在第二屆ISICDM大會上,為了讓醫(yī)生與工科人更全面地交流探討,李純明也特地安排了“醫(yī)工交叉科普講座”、“醫(yī)生談臨床需求與挑戰(zhàn)”、“醫(yī)工交流會”、“醫(yī)學(xué)影像數(shù)據(jù)分析軟件培訓(xùn)”等分論壇。全場600多名參會人員,其中來自全國各地的醫(yī)院主任醫(yī)師超過百位,即便是重量級醫(yī)生專家,也是全程聽完三天的大會報(bào)告和圓桌探討。
“王霄英主任在今年ISICDM大會上談到一個(gè)觀點(diǎn)讓我印象非常深刻,她認(rèn)為,很多醫(yī)學(xué)影像軟件,沒必要都用人工智能,有時(shí)候我們醫(yī)生只是需要圖像處理能夠自動化,就會對我們醫(yī)生很有幫助。她說傳統(tǒng)的圖像處理工具對醫(yī)生還是很有用,但目前在臨床上還沒被充分利用。這句話讓我知道,我們要做的第一步并不是把技術(shù)打磨的多智能,而是把醫(yī)生需求摸索清楚?!?/p>
李純明認(rèn)為,工科人員做醫(yī)學(xué)圖像研究,也應(yīng)從臨床的角度考慮問題,研究的目的應(yīng)該是解決臨床問題,或者為臨床應(yīng)用提供理論指導(dǎo),不能只是和醫(yī)生合作搞科研發(fā)論文,而不解決問題。在ISICDM大會上,多位報(bào)告專家也完全附議李純明的觀點(diǎn)。
訊飛醫(yī)療CEO陶曉東從工科角度出發(fā),談到了這個(gè)問題,他認(rèn)為醫(yī)療行業(yè),技術(shù)不僅要為影像科、病理科服務(wù),還要為臨床服務(wù)。服務(wù)于臨床是最高目標(biāo)。
在這個(gè)過程中,醫(yī)生的指導(dǎo)非常重要,需要用正確的工具解決正確的問題,即先準(zhǔn)確地定義問題,然后尋找合適的解決手段。
“一個(gè)問題如果能用九十年代的技術(shù)解決,就不要想著用2000年的技術(shù);如果能通過人和機(jī)器一起解決,就不要想著做全自動的方案??傊?,不要總想著用最新的技術(shù),關(guān)鍵是要能解決實(shí)際問題。回歸到醫(yī)療行業(yè),我們的首要目的是要解決臨床問題?!碧諘詵|談到。陶曉東的說法就是李純明一直堅(jiān)持的做問題驅(qū)動的研究的觀點(diǎn)。
同樣,第一屆ISICDM大會主席田捷曾在接受雷鋒網(wǎng)采訪時(shí)說到,醫(yī)生能不能接受某項(xiàng)智能技術(shù),關(guān)鍵看臨床效果,看能不能針對臨床解決問題。
田捷談到,雖然他是工科人,但近幾年卻沒有發(fā)表過計(jì)算機(jī)方面的文章,而是發(fā)醫(yī)學(xué)文章。此外,他也幾乎沒有參加計(jì)算機(jī)視覺會議,反而經(jīng)常出席美國臨床腫瘤學(xué)會、美國腫瘤學(xué)會等這類會議。
他強(qiáng)調(diào)到,技術(shù)人員要穿上醫(yī)生的馬甲,到醫(yī)學(xué)的會議上交流。
“過去工科人經(jīng)常在計(jì)算機(jī)視覺會議上談自己在醫(yī)學(xué)圖像分析上的方法和參數(shù)有多好,我覺得意義不大。你要到臨床醫(yī)生那里,讓他們‘折磨你’,找出醫(yī)生能接受的臨床效果和臨床意義,這時(shí)候你的模型才真正起作用?!?/p>
“現(xiàn)在我能在醫(yī)學(xué)雜志上發(fā)表文章,由于審稿人都是醫(yī)生,這說明我的研究具有一定的臨床意義,同時(shí)也證明我已經(jīng)穿上了醫(yī)生的馬甲?!?/p>
這也是田捷、李純明等眾多ISICDM專家重新審視完“醫(yī)”后的新認(rèn)知:技術(shù)人員需逐漸改變工科思維,站在醫(yī)生的角度去思考問題,多跟醫(yī)生交流,學(xué)習(xí)醫(yī)生的專業(yè)知識,并把知識融入算法中,同時(shí)讓他們來當(dāng)裁判,用醫(yī)生的標(biāo)準(zhǔn)給你的成果做評價(jià)。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章