1
雷鋒網(wǎng)按:本文作者微軟亞洲研究院副院長 張益肇。
你能想象每一天就有三架載滿乘客的大型飛機墜落全員身亡的事故么?這聽起來十分可怕,但全球每年被瘧疾奪走生命的人數(shù)高達(dá)60萬~80萬,就等同于這樣的墜機事故發(fā)生的概率。雖然在發(fā)達(dá)地區(qū),瘧疾幾乎已經(jīng)被消滅,但在某些欠發(fā)達(dá)地區(qū)瘧疾卻仍然是災(zāi)難,而在處理瘧疾的挑戰(zhàn)中,缺少足夠的專業(yè)病理醫(yī)師就是其中面臨的一大挑戰(zhàn),該問題進(jìn)而導(dǎo)致患者難以得到及時的診斷和治療。
目前,微軟正在研發(fā)的技術(shù)則可以幫助判斷出病人是否感染了瘧疾,感染的是瘧疾中的哪一種類,以及可能是從哪些渠道感染的,相比傳統(tǒng)方式下需要大量人力看樣本、做分析,該技術(shù)讓醫(yī)生的效率大為提升。即便是在醫(yī)療人員匱乏的地區(qū),也可以不再那么捉襟見肘了。
所以計算機與醫(yī)療的結(jié)合,遠(yuǎn)不止智能手環(huán)、血糖儀或是Xbox、HoloLens等可能會與醫(yī)療產(chǎn)生關(guān)聯(lián)的智能硬件,其覆蓋范圍非常廣泛,從前端設(shè)備到后端系統(tǒng),再到隱藏在最后端的各類算法,每個分支都可以是一個獨立的學(xué)科。事實上在微軟內(nèi)部,已經(jīng)有接近100個與醫(yī)療相關(guān)的項目,他們中既包括十分具有前瞻性的,也有已經(jīng)步入實際應(yīng)用層面的。
在我看來,如今計算機在醫(yī)療領(lǐng)域的進(jìn)展其實都是基于同一個基礎(chǔ),即“數(shù)據(jù)改變醫(yī)療”為核心展開的。不管是中醫(yī)還是西醫(yī)本質(zhì)上都是實踐科學(xué),醫(yī)生通過無數(shù)次的實踐總結(jié)、統(tǒng)計出規(guī)律,最終達(dá)到醫(yī)病救人的效果。當(dāng)人類收集、處理和分析數(shù)據(jù)的能力隨著云計算、大數(shù)據(jù)、機器學(xué)習(xí)、物聯(lián)網(wǎng)等技術(shù)的發(fā)展而日漸增強時,人們利用大數(shù)據(jù)像醫(yī)生一樣去分析或輔助分析病情的能力自然也會與日俱增。
癌癥一直是人類最需要迫切解決的醫(yī)學(xué)難題之一,由于同一類癌癥的每位患者表現(xiàn)也各不相同,因此可以說每位患者的癌癥都是一種獨立的疾病,即便是醫(yī)生擁有豐富的經(jīng)驗也很難做出100%準(zhǔn)確的分析和判斷,更別說相對個性化的精準(zhǔn)醫(yī)療了。因此微軟亞洲研究院一直將數(shù)字醫(yī)學(xué)影像識別作為主攻方向之一,希望通過計算機視覺領(lǐng)域的最新技術(shù)加速推動精準(zhǔn)醫(yī)療。
從2014年起,微軟亞洲研究院的團隊開始鉆研腦腫瘤病理切片的識別和判斷,通過細(xì)胞的形態(tài)、大小、結(jié)構(gòu)等,去輔助分析和判斷病人所處的癌癥階段。而近兩年在該領(lǐng)域我們基于“神經(jīng)網(wǎng)絡(luò)+深度學(xué)習(xí)”的模式取得了兩大突破:
首先,實現(xiàn)了對大尺寸病理切片的圖片處理。通常圖片的尺寸也就是224*224像素,但腦腫瘤病理切片的尺寸卻達(dá)到了20萬*20萬、甚至40萬*40萬像素。對于大尺寸病理切片影像的識別系統(tǒng),我們沒有沿用業(yè)內(nèi)常用的數(shù)字醫(yī)學(xué)圖像數(shù)據(jù)庫,反而在ImageNet這個計算機領(lǐng)域最為成熟的圖片數(shù)據(jù)庫的基礎(chǔ)之上利用盡可能多的圖片,通過自己搭建的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法不斷進(jìn)行大量訓(xùn)練而成,最終實現(xiàn)了對大尺寸病理切片的圖片處理。
對大尺寸病理切片圖片通過神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)算法進(jìn)行處理的流程
其次,在解決了細(xì)胞層面的圖像識別之后,又實現(xiàn)了對病變腺體的識別。所謂腺體,可以簡單理解為多細(xì)胞的集合體,它更接近于“器官“的概念。相對于細(xì)胞病變,腺體病變的復(fù)雜性和可能的組合都呈指數(shù)級增長,但對腺體狀態(tài)的準(zhǔn)確識別,則可以大大提高對癌癥分析的準(zhǔn)確程度,意義更加深遠(yuǎn)。
對病變腺體的識別,主要是基于醫(yī)學(xué)角度三個可以衡量癌細(xì)胞擴散程度和預(yù)后能力的指標(biāo):細(xì)胞的分化能力,腺體的狀況和有絲分裂水平。我們針對這三個角度,通過多渠道(Multi-Channel)的數(shù)據(jù)采集和分析,希望在未來幫助醫(yī)生實現(xiàn)對病人術(shù)后、康復(fù)水平乃至復(fù)發(fā)的可能性做出預(yù)估和判斷。
腺體圖像經(jīng)過計算機處理后被抽象成不同的結(jié)構(gòu),以便于計算機進(jìn)一步識別與判斷
以往醫(yī)生都是憑借”肉眼”和經(jīng)驗去觀察病理切片影像并判斷病情,如今人工智能中的兩大核心技術(shù):神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)則讓計算機系統(tǒng)能夠自動學(xué)習(xí)惡性腫瘤細(xì)胞與正常細(xì)胞間的差異以及癌癥病情的分析和判斷標(biāo)準(zhǔn),同時能夠在掃描病理切片之后,給出判斷結(jié)果,供醫(yī)生參考。計算機強大的運算能力彌補了部分醫(yī)生由于經(jīng)驗不足引起的誤判,或是對罕見病及疑難雜癥的思慮不周。而且計算機還能發(fā)現(xiàn)人眼不易察覺的小細(xì)節(jié),并總結(jié)出一些出乎醫(yī)生意料之外的規(guī)律,從而不斷完善醫(yī)生和計算機系統(tǒng)的知識體系。因此,正是人工智能技術(shù)讓精準(zhǔn)醫(yī)療能夠繼續(xù)向前推進(jìn)。
不同種類的惡性腫瘤切片經(jīng)過算法處理后進(jìn)行分類
目前,微軟亞洲研究院對二維醫(yī)學(xué)影像識別結(jié)果的準(zhǔn)確性已經(jīng)處于國際領(lǐng)先水平。除了腦腫瘤以外,該研究結(jié)果也可以擴展至其他疾病的二維醫(yī)學(xué)影像的識別和判斷,例如我們正在研究的腸癌等。此外,我們還在研究肝腫瘤患者的CT三維影像,雖然三維影像與二維影像的識別技術(shù)有本質(zhì)區(qū)別,但基于微軟亞洲研究院在人工智能領(lǐng)域多年來的深入積累,相信我們在三維CT影像識別上的突破也指日可待。
除了醫(yī)學(xué)影像識別,我們在醫(yī)療文字處理方面也做了不少研究。
在與國外同行交流時我們發(fā)現(xiàn),原來全世界的醫(yī)生所寫的病歷都是最難懂的書法,由于時間有限,醫(yī)生們不得不在寫病歷的時候龍飛鳳舞。在病歷電子化之后,雖然書寫的問題得以解決,但病歷上記載的各種描述性語言——有的簡潔,有的啰嗦,有的甚至不完整——對于醫(yī)生后續(xù)進(jìn)行病情查閱、檢視或?qū)W習(xí)參考來說都非常不便。
因此我們團隊通過語音和自然語言理解技術(shù),讓醫(yī)生可以口述病歷,隨后計算機將語音轉(zhuǎn)換成文字再進(jìn)行結(jié)構(gòu)化處理,從而形成一個囊括了所有關(guān)鍵詞的樹狀圖,清晰、簡潔地總結(jié)所有有用信息,讓患者或其他醫(yī)生對所有病理歷程一目了然,如有何病史,用過什么藥物,排除了哪些疾病可能,待排查的疾病有哪些等等。
基于這樣的電子病歷,醫(yī)生的更換將不再會影響不同醫(yī)生對于患者完整病情的掌握;年輕醫(yī)生還可以通過學(xué)習(xí)各種病歷快速成長;結(jié)構(gòu)化的電子病歷甚至能夠自動總結(jié)出被醫(yī)生忽略的細(xì)節(jié)和推斷,獲得對病情了解的新線索;當(dāng)然,大大減輕醫(yī)生寫病歷的工作量更是無需多言。
可以看到,無論是圖像識別還是自然語言理解,計算機領(lǐng)域的很多技術(shù)都可以與醫(yī)療應(yīng)用密切結(jié)合。而隨著計算能力的日益強大、人工智能技術(shù)的穩(wěn)步發(fā)展,未來計算機將能夠?qū)Ω鄰?fù)雜、高級的信號進(jìn)行處理,人類的醫(yī)療水平也必將邁入新的時代。
但是,醫(yī)生永遠(yuǎn)不會被替代。在醫(yī)療這個專業(yè)科學(xué)與藝術(shù)相融合的領(lǐng)域,人工智能技術(shù)將成為醫(yī)生的“左膀右臂“,幫助醫(yī)生更便捷的獲取信息并輔助醫(yī)生做出更加正確的診斷,而醫(yī)生除了積累豐富的專業(yè)知識,還需要更多地發(fā)揮高情商的能力與病患溝通交流。最終,計算機的人工智能和醫(yī)生的人類智能將互相結(jié)合,成為一個既有精準(zhǔn)的專業(yè)判斷又有情感交流的“超級醫(yī)生”。讓我們共同期待人工智能所引領(lǐng)的醫(yī)療發(fā)展新時代!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。