0
本文作者: 李雨晨 | 2022-01-12 10:08 | 專題:GAIR 2021 |
近日,第六屆全球人工智能與機器人大會(GAIR 2021)在深圳正式啟幕,140余位產(chǎn)學(xué)領(lǐng)袖、30位Fellow聚首,從AI技術(shù)、產(chǎn)品、行業(yè)、人文、組織等維度切入,以理性分析與感性洞察為軸,共同攀登人工智能與數(shù)字化的浪潮之巔。
在醫(yī)療科技高峰論壇上,中山大學(xué)中山眼科中心的袁進教授從算法、數(shù)據(jù)、算力等角度,對目前的AI行業(yè)進行了剖析。他指出,算法或許是目前的短板所在。“不少團隊使用的是第三方提供的算法模型。真正自己去做自研平臺、訓(xùn)練算法的比例只有1.6%。用公開的方法不是不好,而是公開算法不一定滿足自己特定化的需求,這也是為什么在算法上進行創(chuàng)新的原因?!?/p>
為了能夠促進行業(yè)的規(guī)范化發(fā)展與落地應(yīng)用,2018年,袁進教授牽頭組建了全國第一個智能眼科學(xué)組。他表示,以前,我們講的都是眼科人工智能?,F(xiàn)在,要將其調(diào)整為智能眼科,以人工智能、5G、可穿戴設(shè)備、高清成像、新一代機器人等新時代的技術(shù),融合到臨床上應(yīng)用,打造真正的智能眼科。
以下是袁進教授的演講內(nèi)容,雷峰網(wǎng)(公眾號:雷峰網(wǎng))做了不改變原意的編輯和整理
袁進:各位同道,大家下午好!非常高興受到雷峰網(wǎng)的邀請,來參加這樣一個跨專業(yè)、跨學(xué)科的交流,認(rèn)識了新朋友,也見到很多老朋友。我會從專業(yè)知識的角度,來分享一下眼科人工智能的發(fā)展與挑戰(zhàn)。
世界衛(wèi)生組織曾寫到,影響人類生存質(zhì)量的三大疾病——腫瘤、心血管和眼科疾病。我的演講中有幾個關(guān)鍵詞,一個是眼科,一個是AI(人工智能)。
AI不是一個新概念,上世紀(jì)60年代就已經(jīng)誕生。為什么熬到現(xiàn)在才強勢地C位出道?
根源在于2010年算法的突破,以及與實體場景的結(jié)合能力大大增強,帶來了AI的井噴式發(fā)展。從本質(zhì)上來說,AI主要是模仿人類思考問題和解決問題的能力。
在AI領(lǐng)域,中國是為數(shù)不多、能夠與國際同行并跑或者領(lǐng)跑的學(xué)科領(lǐng)域。其他領(lǐng)域都在強調(diào)解決卡脖子問題。但是,在AI領(lǐng)域,我們已經(jīng)是國際上非常重要的一個陣營,來自中國AI領(lǐng)域的論文數(shù)量和質(zhì)量都很高。在這其中,眼科貢獻了非常多。為什么是眼科,而不是心血管、骨科等其它的????
這里面有兩個原因。
第一,眼睛是一個天然的光學(xué)器官,是以影像為主導(dǎo)的學(xué)科。所有的眼科診療都需要影像來介導(dǎo)。所以,眼科有大量豐富的影像資料,這就為AI系統(tǒng)的研發(fā)提供了必要的原材料。
第二,它有強烈的內(nèi)在需求。中國有14億人口,但是所有注冊在案的眼科醫(yī)生只有3.3萬人,而且眼科醫(yī)生還集中在一些大中型醫(yī)院。
所以,每次說到醫(yī)療扶貧、優(yōu)質(zhì)醫(yī)療資源下沉,眼科總是被第一個拎出來,希望下沉到基層。這本身就是一個偽命題,什么叫優(yōu)質(zhì)的醫(yī)療資源?優(yōu)質(zhì)就是少,少還要讓它“撒胡椒面”,顯然是不可能的。
但這樣一個命題,隨著AI的出現(xiàn)有可能在將來得到解決。眼科人工智能的開發(fā),是醫(yī)學(xué)人工智能的縮影。我們碰到的問題,別人都碰到過,我們沒有碰到的問題,別人可能也還會碰到。
一個好的人工智能系統(tǒng),要有三個要素:算力、算法、數(shù)據(jù)。
算力倒不重要,主要是靠錢投入,購買一些計算性能好的GPU工作站搭起來,甚至借助中山大學(xué)的天河二號都能解決算力的問題。
但是,最重要的是數(shù)據(jù),數(shù)據(jù)來源是哪里?
第一是和醫(yī)院合作,得到脫敏數(shù)據(jù),但是從醫(yī)院拿數(shù)據(jù),醫(yī)院會考慮回報是什么,是科研文章還是產(chǎn)品共享?這會產(chǎn)生很多合作形式的問題。
第二是免費、公開數(shù)據(jù)集?,F(xiàn)在有很多公開數(shù)據(jù)集,但是質(zhì)量良莠不齊。其次,我們使用過Kaggle數(shù)據(jù)庫,這是全球最大的免費眼底圖像數(shù)據(jù)集。我們發(fā)現(xiàn),它的錯誤率有15%到20%,這樣的數(shù)據(jù)庫訓(xùn)練出來的系統(tǒng)能到什么層次?
第三,用真金白銀買,很多AI企業(yè)燒錢燒得很快,這也不是一個好的方式。
即便拿到了數(shù)據(jù),還會有第二個問題——數(shù)據(jù)的清洗和標(biāo)注。業(yè)內(nèi)曾開玩笑說,人工智能,先有人工再有智能。要一群醫(yī)生給數(shù)據(jù)打標(biāo)簽,費時費力,質(zhì)量還可能良莠不齊。如何解決這個問題?
首先,要學(xué)會數(shù)據(jù)的清晰和分類。數(shù)據(jù)一定要人工標(biāo)注嗎?能否有智能的算法對數(shù)據(jù)進行歸類,進行初步的特征提取,醫(yī)生就不需要下場做“運動員”,而是做“裁判員”。
其次,要有公益心,開發(fā)出的AI產(chǎn)品愿不愿意貢獻出來。國家也在強調(diào),要建立規(guī)范的、經(jīng)過嚴(yán)格論證標(biāo)記的第三方數(shù)據(jù)庫,用于產(chǎn)品的開發(fā)、驗證。
所以,中山眼科中心自己花錢做了很多事,把自己做的金標(biāo)眼底數(shù)據(jù)集面向全球進行公開免費的發(fā)布,命名為iChallenge。
目前,全球已經(jīng)有2000多個團隊利用這個公開數(shù)據(jù)集,開發(fā)了很多在臨床上應(yīng)用的人工智能算法系統(tǒng)。
同時,不僅僅是青光眼,我們團隊還跟南方科技大學(xué)合作,做了從眼表、角膜這樣一些病變損害特征的數(shù)據(jù)集,包括眼底的特征參數(shù),都進行了公開和共享。
我們希望能夠有更多的團隊,利用這些金標(biāo)的數(shù)據(jù)集去開發(fā)高質(zhì)量的人工智能診斷系統(tǒng),盡快進入醫(yī)療臨床,改變現(xiàn)有的醫(yī)療模式。
同時,我們現(xiàn)在做的這些分割系統(tǒng)和算法也開始進入臨床轉(zhuǎn)化,因為僅僅是出于科研目的是遠遠不夠的。總書記講過,要把科技成果寫在祖國的大地上,所以我們現(xiàn)在也在推行這些算法、系統(tǒng)的轉(zhuǎn)化和應(yīng)用。
這是我們團隊開發(fā)的診斷眼科疾病——干眼的基于圖像分割的算法系統(tǒng),完成了成果轉(zhuǎn)化。不僅是在中國,經(jīng)過我們的授權(quán)后,國外也裝入了這套系統(tǒng),這也是國內(nèi)為數(shù)不多被國外主流裝備所采納和應(yīng)用的案例。
解決了數(shù)據(jù)問題后,第二個問題就是算法。
在算法層面,我們國家可能存在一定的短板。因為真正沉下心來做原創(chuàng)算法的團隊和機構(gòu)不多。不少團隊使用的是第三方提供的算法模型。真正自己去做自研平臺、訓(xùn)練算法的比例只有1.6%。
用公開的方法不是不好,而是公開算法不一定滿足自己特定化的需求,這也是為什么在算法上進行創(chuàng)新的原因。
谷歌的Deepmind團隊和英國的Moorfields眼科研究所開發(fā)出一個新算法,采取了并聯(lián)的方式,去解決醫(yī)療應(yīng)用上的黑箱問題。算法同時將疾病的分類和特征提取分開訓(xùn)練,最后進行結(jié)果的匹配。
還有近年來比較流行的遷移學(xué)習(xí)。開發(fā)出一個好的算法后,基于同類的影像特征,我們沒有必要再把原來的路走一遍,可以通過遷移學(xué)習(xí)來完成新算法模型的開發(fā)。
這個例子就是他們原來做了肺部CT的短發(fā),然后應(yīng)用到眼科OCT,包括利用不同的熱圖的標(biāo)記去展示算法讀圖的功能。
當(dāng)然,人工智能算法也存在同質(zhì)化的現(xiàn)象——開發(fā)一個模型只能解決一個病。
對于醫(yī)生而言,可以一個人看數(shù)十種病,不然看一個病換一個醫(yī)生,醫(yī)生在病人面前就跟走馬燈一樣。
所以,我么希望AI算法從單模態(tài)、單任務(wù)轉(zhuǎn)變?yōu)閱文B(tài)的多任務(wù)。同樣一張眼底圖像,不僅僅是能診斷糖網(wǎng),也能診斷青光眼、高度近視等不同眼底疾病。
這種想法在今年實現(xiàn)了突破:利用眼底圖像訓(xùn)練后,AI可以對39種眼科疾病,包括全身性高血壓的疾病進行診斷和預(yù)測。在這個過程中,要求算法的可視化和可解釋性,這樣才能使更多的臨床醫(yī)接受。
要做到這一點,就要使用不同的分類器去解決不同的特征。
另外一點,眼睛是心靈的窗戶,可以反映心腦血管、代謝性疾病、糖尿病等早期的癥狀。我們團隊做了一項工作:基于眼科的微血管的特征提取、智能參數(shù)的分析,去服務(wù)于代謝疾?。I病和糖尿病等)的早期診斷。
除了單模態(tài)的多任務(wù),進一步要實現(xiàn)的多模態(tài)、多任務(wù)。
在臨床上,醫(yī)生診斷一個疾病往往不會只依靠一種設(shè)備,仍然存在著漏診或者誤診的風(fēng)險。所以,把不同的診斷設(shè)備進行整合,形成多模態(tài)的人工智能診斷系統(tǒng),將是未來趨勢。
我們團隊將眼底照相和OCT兩種不同的診斷數(shù)據(jù)融合后,去診斷青光眼,進一步提升了診斷的效能。目前,實現(xiàn)了雙模態(tài)、雙任務(wù),但是要真正實現(xiàn)多模態(tài)多任務(wù),還要解決設(shè)備在空間和時間上的融合和交叉問題,否則影像特征難以準(zhǔn)確匹配。
現(xiàn)在,我們把眼科的幾個重要診斷設(shè)備,如OCT、裂隙燈、眼底照相數(shù)據(jù)集成,正在進行系統(tǒng)開發(fā),硬件也即將進入開發(fā)階段。
雖然多模態(tài)進入臨床還要一段時間,但是雙模態(tài)這種搭載智能診斷系統(tǒng)的裝備已經(jīng)進入到臨床,這是把眼底照相和OCT兩個不同的模態(tài)影像進行融合,在臨床上對眼科疾病進行診斷。
將來,算法會如何發(fā)展?
我們看到一個有意思的研究:用人工智能的方法,去計算一個拋出物體在空間的運動軌跡和落地點。
傳統(tǒng)算法的工作量會非常大。但是,從物理學(xué)的先驗知識角度來看,如果沒有外界干擾,遵循簡單的拋物線原理,就能完成算法系統(tǒng)的開發(fā)。
因此,我們要拋棄單純由醫(yī)生貼標(biāo)簽的過程,把文本、邏輯等先驗知識結(jié)合起來,進行新一代人工智能算法系統(tǒng)的開發(fā)。
同時,系統(tǒng)本身還要進行自我進化,也就是遺傳算法。被公眾所熟知的人工智能標(biāo)志事件是,AlphaGo打敗了人類最頂尖的棋手。后來,Alpha Zero不用學(xué)棋譜,只學(xué)里面的邏輯概念、判定勝負(fù)的原則,它自己進行邏輯的歸納,就能完成算法的提升。最后,它又打敗了AlphaGo。
未來,算法要體現(xiàn)自我提升的能力,才不會局限于人類自身的邏輯思維,也就是“超智能”、“超腦”的概念。
走到這里,人工智能系統(tǒng)只是走完了開發(fā)階段,很多系統(tǒng)會倒在最后一公里——真實世界研究。換句話說,你的模型、算法框架可以做的很好,但是到了臨床上,能否依然保持高水準(zhǔn)。
如果達不到,一定會被市場拋棄和淘汰。
如何去做真實世界研究?要有規(guī)范。這個規(guī)范沒有答案,也沒有參照物。既然沒有,我們就要自己做。
首先,我們要有一個團體。2018年,我牽頭組建了全國第一個智能眼科學(xué)組。
這是一個跨學(xué)科的組織,包括97個眼科機構(gòu)、全國排名前20的眼科機構(gòu)、研究機構(gòu),中科院圖像所、中科院計算所、頭部AI企業(yè)、BAT都加入了這個組織。依托這個組織,我們制定了全球第一個針對眼底照相的人工智能篩查、臨床應(yīng)用指南,為人工智能診斷系統(tǒng)的真實世界研究提供了一個范本。
這份指南是中英文同時發(fā)布,英文版在發(fā)布不到三個月的時間里,被國際頂刊轉(zhuǎn)發(fā)超過7萬次。指南也和智能醫(yī)學(xué)專委會,包括眼科學(xué)會和醫(yī)師學(xué)會等三大學(xué)會共同見證,推廣在臨床的使用。
基于指南的要求,兩個醫(yī)療AI公司硅基智能、鷹瞳科技在2020年陸續(xù)得到NMPA的三類器械批準(zhǔn),這兩個團隊都是來自我們的眼科中心,硅基就是和我們這個團隊合作。
除了指南,我們也在進行行業(yè)規(guī)范化發(fā)展。
2019年,我們舉辦了第一個眼科的人工智能專刊,向眼科醫(yī)生推廣人工智能的理論問題。去年,我們也主辦了第一個智能裝備的???,介紹智能裝備研發(fā)的最新動態(tài)。
今年,我們又受《人工智能》編輯部的委托,舉辦了智能醫(yī)療的???,進一步展示人工智能未來發(fā)展的前景。同時,我們完成了人工智能在眼底彩照標(biāo)注領(lǐng)域的第一個團體標(biāo)準(zhǔn),使大家以后在系統(tǒng)的開發(fā)上更加有規(guī)章可循。
人工智能在醫(yī)療領(lǐng)域是全鏈條、全生態(tài)的覆蓋。
以前,我們講的都是眼科人工智能。現(xiàn)在,把這個詞進行了微調(diào)——智能眼科,是以人工智能、5G、可穿戴設(shè)備、高清成像、新一代機器人等新時代的技術(shù),融合到臨床上應(yīng)用,打造真正的智能眼科,而不僅僅局限于眼科人工智能這樣的概念。
目前,我們正在與深睿醫(yī)療合作,由我牽頭推進的一個全天候、多場景、交互式的視覺功能導(dǎo)航系統(tǒng),將工智能的場景識別,包括智能汽車導(dǎo)航的識別方法,對新的元器件進行整合,打造一個對低視力和盲人的智能視力輔助系統(tǒng),從而改變他們的生活狀態(tài),提升生存質(zhì)量。
最后,中國眼科人工智能的發(fā)展任重而道遠。
國家已經(jīng)提出了明確的目標(biāo),2025年成為人工智能強國,2030年要成為世界主要的人工智能創(chuàng)新中心,要實現(xiàn)這樣一個看起來已經(jīng)非常近的重大目標(biāo),需要醫(yī)療專家、理工科技術(shù)專家、企業(yè)共同攜手。所以,我們的理念是“齊攜手、共努力、期未來”。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章