0
本文作者: 李雨晨 | 2020-04-22 11:24 |
近期,雷鋒網(wǎng)醫(yī)健AI掘金志邀請(qǐng)阿里巴巴達(dá)摩院醫(yī)療AI負(fù)責(zé)人遲穎,做客雷鋒網(wǎng)公開(kāi)課,以“醫(yī)療AI技術(shù)的探索和疫情期間的實(shí)踐”為題,詳細(xì)介紹了阿里達(dá)摩院在醫(yī)療健康A(chǔ)I上的探索與最新成果。
后續(xù)將有更多課程上線,添加微信公眾號(hào) 醫(yī)健AI掘金志 在公眾號(hào)聊天框回復(fù)“聽(tīng)課”,進(jìn)群可收看本節(jié)課程視頻回放
2017年10月11日,阿里巴巴達(dá)摩院正式成立,定位于基礎(chǔ)科學(xué)和創(chuàng)新技術(shù)研究。目前分布在全球8個(gè)城市,有1000+研究員。達(dá)摩院的人工智能中心是阿里云智能負(fù)責(zé)云上人工智能基礎(chǔ)技術(shù)研發(fā)及產(chǎn)品落地應(yīng)用的團(tuán)隊(duì),主要在城市大腦、工業(yè)視覺(jué)、設(shè)計(jì)智能、醫(yī)療健康等領(lǐng)域提供AI技術(shù)支撐。
在講座中,遲穎系統(tǒng)地介紹了疫情期間,達(dá)摩院在新冠肺炎CT影像診斷、全基因組測(cè)序分析、疫情預(yù)測(cè)、醫(yī)療行業(yè)機(jī)器人翻譯系統(tǒng)、基于知識(shí)圖譜的智能問(wèn)答等一系列技術(shù)與落地成果。
以CT影像診斷為例,目前,達(dá)摩院的相關(guān)產(chǎn)品已經(jīng)為500多家的醫(yī)院服務(wù),同時(shí)還在向海外各國(guó)開(kāi)放。最快兩秒、最長(zhǎng)20秒就可以處理一個(gè)病例,每天最多分析一萬(wàn)三千例樣本。
而在全基因組分析方面,達(dá)摩院的數(shù)據(jù)分析能力,可以將此前2~3天的全基因組分析全流程提速5倍,并且每個(gè)樣本數(shù)據(jù)分析的時(shí)間從6個(gè)多小時(shí)縮短到幾分鐘。
遲穎表示,我們很希望盡快把醫(yī)療相關(guān)知識(shí)融入日常研究,用科技去服務(wù)我們的客戶,和合作伙伴進(jìn)行更好的合作,改善人們的生活、醫(yī)療健康狀況。
以下為遲穎演講全文內(nèi)容,醫(yī)健AI掘金志做了不改變?cè)獾木庉?/strong>
2017年10月11日,達(dá)摩院正式成立,定位于基礎(chǔ)科學(xué)和創(chuàng)新技術(shù)研究。目前分布在全球8個(gè)城市,有1000+研究員。人工智能中心的醫(yī)療健康板塊,我們會(huì)在影像診斷、基因分析、智能問(wèn)診、醫(yī)療搜索、公共衛(wèi)生等方面,為醫(yī)生、病人以及相關(guān)機(jī)構(gòu)提供輔助診斷和決策的AI技術(shù)支撐。
我們首先講一下,醫(yī)療健康A(chǔ)I能做什么?
經(jīng)過(guò)統(tǒng)計(jì),健康的因素主要分為:保健服務(wù)10%,基因因素20%,環(huán)境因素20%,健康行為50%;健康花費(fèi)方面,醫(yī)療服務(wù)占了88%,5%的病人消耗掉了60%的醫(yī)療資源,其他的健康監(jiān)控行為僅占4%。
一般我們什么時(shí)候會(huì)得到最好的醫(yī)療服務(wù)?是將要離世時(shí)在ICU病房里。
ICU病房里的傳感器非常多。飛機(jī)和車(chē)都有傳感器,每一天飛機(jī)有2T的數(shù)據(jù)產(chǎn)生;而車(chē)以特斯拉為例,每一個(gè)小時(shí)傳40T的數(shù)據(jù)到云端;健康人群包括亞健康人群,收集到的數(shù)字是零。
實(shí)際上人的血管、心肌和骨骼是沒(méi)有神經(jīng)感知的。所以當(dāng)這些部位的疾病出現(xiàn)時(shí),我們?cè)趺慈ケM早預(yù)防和干預(yù)?
這里是達(dá)摩院醫(yī)療健康智能的一個(gè)簡(jiǎn)單介紹。
我們的任務(wù)是希望讓AI輔助醫(yī)療保健,使醫(yī)療分析和健康管理變得高效、普惠、低成本。
我們主要分四個(gè)部分:視覺(jué)引擎、知識(shí)引擎、搜索引擎和基因引擎。
剛剛講到傳感器很重要,所以我們也很希望可以通過(guò)聽(tīng)覺(jué)、視覺(jué)、感知和文本,去保證身體的健康體征可以被監(jiān)測(cè)到,比如心臟,血糖血壓,睡眠或步態(tài)等常見(jiàn)的特征。
智能健康管理實(shí)例
對(duì)于一些老年人或者亞健康人群,有一些檢查是我們現(xiàn)在正在進(jìn)行中的,如智能健康管理。
我們?cè)?019年剛剛舉辦了一場(chǎng)心電圖的天池大賽。心電圖的智能預(yù)警,心律失常事件可以得到準(zhǔn)確的預(yù)測(cè),對(duì)重要心律失常事件比如停搏、心動(dòng)過(guò)速、房室顫,ST段變化等進(jìn)行預(yù)警。
心血管AI輔助診斷是基于心臟CT數(shù)據(jù)分析,針對(duì)這些影像做心電門(mén)控心臟CT鈣化積分運(yùn)算、冠狀動(dòng)脈CTA影像分析等等。
膝腰疾病的識(shí)別主要基于影像(CT、核磁共振等),提供相關(guān)的疾病智能分析功能,比如腰椎退行性疾病等監(jiān)測(cè)。
糖尿病慢性病的管理,包括健康指標(biāo)收集,風(fēng)險(xiǎn)模型評(píng)估,干預(yù)建議方案,健康再評(píng)估,通過(guò)康養(yǎng)社區(qū)智能硬件設(shè)備收集相關(guān)信息。
高血壓/高血脂,雙高是老年人常見(jiàn)的疾病,也是比較危險(xiǎn)的疾病。我們進(jìn)行雙高區(qū)域分類(lèi),希望早期篩查、發(fā)現(xiàn)、干預(yù),進(jìn)行多元數(shù)據(jù)的融合,包括利用基因數(shù)據(jù)進(jìn)行疾病發(fā)病率預(yù)測(cè)。
老年人步態(tài)分析,包括刻板步態(tài)、曲線步態(tài)、減痛步態(tài)以及短腿步態(tài)等。基于這些步態(tài)可以分析是否患病,比如帕金森、阿爾茲海默癥、膝髖關(guān)節(jié)骨性關(guān)節(jié)炎、小腦功能障礙等等。
醫(yī)療小組影響力
首先,我們?cè)谝恍┍荣愔腥〉昧诉€不錯(cuò)的成績(jī)。
2017年7月份的Luna16肺結(jié)節(jié)篩查比賽拿了冠軍;BB Task NLP 關(guān)系提取大賽是一項(xiàng)第一、一項(xiàng)第二;MICCAI的LiTS肝臟和肝結(jié)節(jié)比賽,三項(xiàng)世界第一;Image到文本的轉(zhuǎn)換比賽叫ImageCLEF med captioning,獲得第2名;2019的骨科脊柱分割世界大賽第2名;MICCAI PAIP的肝臟病理分割第4名。
我們還舉辦了很多的天池大賽,最早的有一場(chǎng)肺結(jié)節(jié),然后有高血壓和高血糖結(jié)果預(yù)測(cè)的比賽。
去年一年就有三場(chǎng)比賽,主要是肺部綜合、心電圖和病理,每場(chǎng)比賽都吸引了全球2000多支參賽隊(duì)伍。
在投論文方面
1、基因方向,去年10月份,在心臟發(fā)育和疾病方向上發(fā)了一篇nature子刊nature communication。
2、19年7月份,心臟冠脈中心線自動(dòng)提取算法被MICCCAI 2019提前收錄。心臟弱監(jiān)督的分割已經(jīng)投稿了明年的MICCAI。
3、冠脈分支命名是被CVPR 2020收錄。CVPR雖然不是醫(yī)療領(lǐng)域的會(huì)議,并且每年醫(yī)療方面的文章只有20篇左右,能入選很不容易。但它是影像處理的頂會(huì)。早在CVPR 2017的時(shí)候我們就有一些文章,像貝葉斯監(jiān)督哈希算法等等。
4、IEEE ISBI上我們一直都有論文,比如肝臟血管分割核心技術(shù)已經(jīng)被ISBI 2020會(huì)議收錄。去年是3D肺結(jié)節(jié)檢測(cè)及分割,以及肺部區(qū)域分割的新方法等。
冠脈CTA影像智能診斷
最初,達(dá)摩院主要是聚焦在心臟和骨科兩個(gè)方向上。先介紹一下冠脈CTA影像智能診斷。
功能在這里簡(jiǎn)單羅列一下,主要是CTA冠脈樹(shù)智能重建、冠脈分支自動(dòng)命名、智能狹窄檢查及斑塊類(lèi)型分析、智能鈣化積分計(jì)算功能、左心室心肌厚度評(píng)估功能、結(jié)構(gòu)化報(bào)告和膠片打印。
右下角是我們對(duì)心臟冠脈標(biāo)注的一個(gè)全自動(dòng)工具,可以幫助醫(yī)生迅速地把狹窄和斑塊標(biāo)注出來(lái)。這里面是整個(gè)血管的中心線提取,整個(gè)過(guò)程都是全自動(dòng)的,可以節(jié)省醫(yī)生大量的時(shí)間。
下面我們看一下冠脈CTA里面的一些亮點(diǎn),主要是高精準(zhǔn)的冠狀動(dòng)脈識(shí)別和分析。
我們可以看到視頻里不同的顏色,已經(jīng)把不同的冠脈分支表現(xiàn)出來(lái)了。
左圖中所示,其他方法能檢測(cè)到的冠脈主干和分支比較粗的地方,而我們的方法可以精細(xì)到主干末梢和很細(xì)的分支,如圖中紅色部分。這是我們的特色之一。
將這部分重建之后,就可以進(jìn)行分支命名。我們使用的是圖網(wǎng)絡(luò)的方法。
圖網(wǎng)絡(luò)是深度學(xué)習(xí)里面比較新的方法,從結(jié)果分析里可以看到,這個(gè)方法的準(zhǔn)確率比普通方法有大幅提高。
我們?cè)倏匆幌掳邏K和狹窄識(shí)別。
我們看到一個(gè)血管分支,這里面,輕度狹窄大概30%左右、重度狹窄90%左右。普通的算法過(guò)于平滑,我們的算法比較細(xì)顆粒度。這里可以看和金標(biāo)準(zhǔn)相比,我們的算法更加接近了。
我們自動(dòng)獲取中心線的算法如上圖。使用的是心臟打了造影的CT影像,在影像上我們用判別式的3D CNN來(lái)輔助冠脈追蹤來(lái)獲取中心線。
傳統(tǒng)的方法一般是分割和追蹤,但是有一些問(wèn)題。
首先,分割的方法效率比較低,因?yàn)橐粋€(gè)很大的心臟區(qū)域的volume里面只是去檢測(cè)幾根非常細(xì)的血管,這個(gè)檢索的過(guò)程中效率是非常低的。
傳統(tǒng)的追蹤也有它的問(wèn)題,就是沒(méi)有辦法去區(qū)分靜脈,基于先驗(yàn)知識(shí)的追蹤停止標(biāo)準(zhǔn)也是不魯棒的。
比如遇到一個(gè)很長(zhǎng)的斑塊,追蹤就會(huì)過(guò)早的停止,比如說(shuō)圖中血管上就有很長(zhǎng)的斑塊在里面,遇到這種情況時(shí),只是基于先驗(yàn)知識(shí)的追蹤就很不魯棒了。
不管是分割還是傳統(tǒng)的追蹤方法都需要精準(zhǔn)的標(biāo)注,從時(shí)間成本上來(lái)說(shuō)是非常昂貴的,尤其是細(xì)小的動(dòng)脈分支。
那么我們的方法有什么改進(jìn)呢,首先我們是有一些精準(zhǔn)標(biāo)注的的訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)我們可以用來(lái)訓(xùn)練追蹤器Tracker來(lái)尋找中心線。同時(shí)追蹤器不僅是把方向給出來(lái),而且還會(huì)給出血管的半徑。我們不僅有這一塊,還有判別器Discriminator。
那它的作用是什么呢?
首先它會(huì)識(shí)別靜脈;第二,用來(lái)訓(xùn)練學(xué)習(xí)的停止標(biāo)準(zhǔn),可以更魯棒和更靈活;第三,因?yàn)槲覀儾粌H有精準(zhǔn)的標(biāo)注,還有大量的粗略標(biāo)注。
這在實(shí)際工作中是非常常見(jiàn)的,因?yàn)獒t(yī)生都特別的忙。我們可以用一些粗略的方法去得到一些不太精準(zhǔn)的標(biāo)注。這種情況下用Discriminator一起去訓(xùn)練這個(gè)模型,就把精準(zhǔn)標(biāo)注和粗略標(biāo)注的圖用來(lái)一起訓(xùn)練模型。
Discriminate判別的這一部分,可以明顯降低標(biāo)注成本,同時(shí)保證精準(zhǔn)的結(jié)果。
左上角的這個(gè)圖實(shí)際上就是一個(gè)血管的中心點(diǎn),它周?chē)锌赡艿姆较蚨荚谶@個(gè)單位圓上表示出來(lái)了。
這個(gè)圖基于血管的方向,每次移動(dòng)一個(gè)半徑的距離。我們的Tracker就是追蹤方向以及半徑的,把結(jié)果輸出來(lái)以后,他就可以往前挪一步,一直到血管末梢停止的地方。
右上角這個(gè)圖我們剛才都看過(guò)了,是拉直的血管。右下角的圖是loss曲線,包括方向和半徑,用判別部分的迭代,可以同時(shí)降低Tracker輸出的結(jié)果。
這個(gè)方向和半徑的輸出錯(cuò)誤率,從這兩個(gè)圖上可以看到隨迭代次數(shù)有明顯的降低。
心臟發(fā)育過(guò)程中的增強(qiáng)子定位是我們發(fā)表在nature子刊上的文章內(nèi)容。
我們首先從重要的蛋白,以及基因的這些修飾可以看到候選增強(qiáng)子的位置,然后用這些做好標(biāo)記的增強(qiáng)子的位置去進(jìn)行訓(xùn)練,訓(xùn)練出模型之后就可以預(yù)測(cè)增強(qiáng)子的位置。
心臟發(fā)育過(guò)程中會(huì)有各種問(wèn)題,有可能是遺傳的,或是早期變異病變,都可以從訓(xùn)練的模型里面得到總結(jié),然后對(duì)新的樣本問(wèn)題進(jìn)行預(yù)測(cè)、推斷。
基因
基因方面我們還有其他的應(yīng)用,比如妊娠糖尿病。
一般在第24周的時(shí)候會(huì)看出孕婦有糖尿病還是沒(méi)有,但是我們?cè)诘?周的時(shí)候,就可以根據(jù)基因進(jìn)行預(yù)警、干預(yù)。在正確干預(yù)且患者有很好依從性的條件下,80%到90%的高風(fēng)險(xiǎn)人群就不會(huì)得糖尿病。這是基因方面的一個(gè)應(yīng)用。
骨科
骨科方面,一個(gè)是脊柱結(jié)構(gòu)的椎體和椎間盤(pán)的精準(zhǔn)分割。
左邊是CT圖,中間、右邊是核磁。根據(jù)分割出來(lái)的結(jié)果,我們可以細(xì)顆粒度區(qū)分退行性病變。
右邊這張圖里展現(xiàn)了椎體和椎間盤(pán)的病變,錐體主要是退行性的病變,椎間盤(pán)有膨出、疝出、突出、脫出、游離等各種不一樣的異常情況。
我們?cè)谶@方面的研究比較全,還在進(jìn)行椎管狹窄的研究,我們?cè)谟?jì)劃舉辦相關(guān)比賽。
髖關(guān)節(jié)手術(shù)測(cè)量方面,這里是術(shù)前規(guī)劃,所展示的是一個(gè)X光片。當(dāng)這個(gè)X光片呈現(xiàn)出來(lái)的時(shí)候,我們的算法可以進(jìn)行全自動(dòng)的特征點(diǎn)位置、關(guān)鍵角度和長(zhǎng)度的測(cè)量。
一方面可以節(jié)省醫(yī)生大量的時(shí)間,因?yàn)檫@個(gè)手術(shù)之前需要做各種各樣的計(jì)算;
另外一方面也使得耗材廠商的庫(kù)存量可以降低。經(jīng)過(guò)自動(dòng)計(jì)算以后,耗材的型號(hào)基本上也都出來(lái)了,以前是必須拿著各種型號(hào)的耗材到手術(shù)室,讓醫(yī)生來(lái)挑、在術(shù)中比對(duì)。
因此,這個(gè)方法也可以縮短術(shù)中的時(shí)間。
肺部
從最開(kāi)始的LUNA 16比賽,我們就開(kāi)始積累經(jīng)驗(yàn)。為什么要講這個(gè)呢?是因?yàn)檫@次疫情期間,我們首先做了基于CT影像的肺炎檢測(cè)。
這是2017年LUNA比賽冠軍的事情,之后我們辦了第一屆天池醫(yī)療大賽,就是肺結(jié)節(jié)篩查。當(dāng)時(shí)是2887支參賽隊(duì)伍、3900多位選手、20個(gè)國(guó)家和地區(qū)參賽。
我們的目的是推動(dòng)這個(gè)行業(yè)的算法提升。我們提供了高質(zhì)量的CT樣本,在這個(gè)過(guò)程中建立了一些長(zhǎng)遠(yuǎn)的合作關(guān)系,發(fā)掘了一些醫(yī)療影像團(tuán)隊(duì)。2019年,我們又辦了一場(chǎng)肺綜合的比賽,也是2000多支隊(duì)伍參賽。
我們看一下落地場(chǎng)景,肺結(jié)節(jié)和肺綜合都是在美年大健康落地,現(xiàn)在累計(jì)調(diào)用量已經(jīng)有1300萬(wàn)次左右。每次掃描最慢的耗時(shí)是15秒,最快一兩秒即可,性能accuracy(準(zhǔn)確率)是98.55%左右,recall(召回率)是99.52%左右。
肺部綜合疾病,為什么我們要做這件事呢?
一般來(lái)講,單病種在早期篩查中的用處是相對(duì)有限的。比如我們做了肺結(jié)節(jié),但是醫(yī)生用我們的算法看完肺結(jié)節(jié)之后,還要看肺部有沒(méi)有什么其他疾病。如果可以一次性看到多種病變,對(duì)醫(yī)生的意義更大
我們第一批切入的疾病就是肺密度增高影、索條、肺大泡、動(dòng)脈硬化、淋巴結(jié)鈣化,以及最開(kāi)始的肺結(jié)節(jié)。
關(guān)于肺綜合我們?cè)贗SBI上發(fā)表了兩篇論文。
項(xiàng)目流程主要是包括輸入、預(yù)處理、分割、檢測(cè)、描述。輸入包括參數(shù)、CT數(shù)據(jù);預(yù)處理包括肺窗提取、圖像轉(zhuǎn)換;分割包括肺區(qū)分割、縱隔分割;檢測(cè)主要是病灶檢測(cè);最后描述包括病灶類(lèi)型、病灶尺寸等等。
這里是一個(gè)自動(dòng)實(shí)現(xiàn)肺葉分割的方法。我們首先用肺分割的方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,從這個(gè)圖上我們可以看到把肺部完整的分割出來(lái)。
輸入的圖是256*256*128尺寸,分割出來(lái)的結(jié)果就是右側(cè)這個(gè)樣子。然后我們是用坐標(biāo)卷積層,什么叫坐標(biāo)卷積層?就是我們?cè)谶@個(gè)地方把坐標(biāo)x軸、y軸、z軸三個(gè)坐標(biāo)的信息引入作為一個(gè)有彈性的限制條件,加在其他卷積層的后面連起來(lái),保證分割出來(lái)的肺葉是很準(zhǔn)確的。
還有一個(gè)方法是Volume R-CNN,這是一個(gè)檢測(cè)CT影像目標(biāo)和實(shí)例分割統(tǒng)一的神經(jīng)網(wǎng)絡(luò)框架。它是一個(gè)端到端的網(wǎng)絡(luò)框架,可以同時(shí)高效地進(jìn)行目標(biāo)檢測(cè)和實(shí)例分割。
我仔細(xì)解釋一下。首先看RPN這個(gè)網(wǎng)絡(luò)有一個(gè)loss function,它和方框檢測(cè)以及實(shí)例分割的mask結(jié)果這三塊是這個(gè)訓(xùn)練的目標(biāo)。ROIs 和CT影像是輸入,曲線的意思是反向迭代的時(shí)候不做梯度計(jì)算。
RoiAlign是很關(guān)鍵的一步,鏈接了4個(gè)模塊,我們從箭頭就可以看到鏈接的這4個(gè)模塊,并且直接從CT影像的特征地圖上萃取ROIs的特征,直接萃取特征就可以加速整個(gè)過(guò)程。
接下來(lái)展現(xiàn)的是我們這次新冠肺炎的CT影像分析。我們是基于以前的方法,但是又做了很多的改進(jìn)。
我們使用到以前肝分割和肝病灶分割的世界冠軍算法,也是我們這次算法的基礎(chǔ)。
可以看到,我們的輸出結(jié)果是有分割的,一個(gè)不同的顏色展示的分割mask,肺部區(qū)域分割,肺葉的分割。我們會(huì)輸出新冠肺炎、普通肺炎還有其他病灶的概率。
我們?cè)趪?guó)內(nèi)已經(jīng)在為500多家左右的醫(yī)院服務(wù),包括火神山醫(yī)院,同時(shí)還在向海外各國(guó)開(kāi)放。
目前已經(jīng)在接觸的國(guó)家有近45個(gè),日本、印度、印尼等已經(jīng)部署好,進(jìn)入例行臨床。歐洲、亞洲、和南美的一些其他國(guó)家也已經(jīng)開(kāi)始部署、試點(diǎn)。
這里簡(jiǎn)單說(shuō)一下我們的計(jì)算速度,最快兩秒,最長(zhǎng)20秒處理一個(gè)病例,讀片速度基本上是醫(yī)生的60倍??傉{(diào)用量超過(guò)45萬(wàn),每天最多分析一萬(wàn)三千例樣本。
海外的部署,主要是通過(guò)阿里云全球數(shù)據(jù)中心進(jìn)行公有云和私有云的部署。
阿里云有12個(gè)在海外的點(diǎn),包括新加坡、澳大利亞、日本東京,還有美國(guó)東西部各一個(gè)點(diǎn),印尼雅加達(dá)、德國(guó)法蘭克福、英國(guó)倫敦、印度、迪拜以及中國(guó)香港。
全基因組測(cè)序分析
全基因組測(cè)序分析也是我們疫情期間推出的一個(gè)主要產(chǎn)品。
現(xiàn)在國(guó)家的標(biāo)準(zhǔn)從試行第5版開(kāi)始就有規(guī)定,呼吸道標(biāo)本或血液樣本的病毒基因測(cè)序已經(jīng)可以作為確診的標(biāo)準(zhǔn),只需要我們和已知的新冠病毒高度同源就可以。
我們說(shuō)一下PCR的問(wèn)題,就是漏檢存在假陰性,有的時(shí)候還比較高,我聽(tīng)到業(yè)界認(rèn)定的某一些產(chǎn)品假陰性可高達(dá)40%。
我們的基因測(cè)序是對(duì)整個(gè)基因鏈條95%以上的基因進(jìn)行分析,準(zhǔn)確率可以達(dá)到99%以上。并且我們進(jìn)行病毒變異情況的統(tǒng)計(jì)分析,可以分析進(jìn)化來(lái)源和時(shí)間,這個(gè)在變異地圖上可以比較清晰地看到。
我們看一下整個(gè)流程,三個(gè)設(shè)備是流程里的主要步驟。
一個(gè)是第三方合作伙伴提供的自動(dòng)化實(shí)驗(yàn)建庫(kù)儀,一個(gè)是基因測(cè)序儀,還有我們自己的基因分析一體機(jī),或者云端服務(wù)。
我們一次檢測(cè)可以檢查20人以上,主要使用場(chǎng)景在浙江省疾控中心,和武漢金銀潭醫(yī)院等。從疫情最開(kāi)始的2月1號(hào)就得到疾控中心的認(rèn)可,我們已經(jīng)把這些設(shè)備都搬到了疾控中心。
其他場(chǎng)景還有臨床檢驗(yàn)中心、海關(guān)等這些需要管理疫情的機(jī)構(gòu)。還有一些已有實(shí)驗(yàn)和測(cè)試能力的實(shí)驗(yàn)室,這些地方都可以部署。
核心價(jià)值主要是:快速精準(zhǔn)檢測(cè),提高地方疫情處理能力;核心算法優(yōu)化,全面監(jiān)控疫情發(fā)展和變化;軟硬一體模塊化,簡(jiǎn)化操作和配置,及時(shí)部署和使用。
關(guān)于第二點(diǎn),我們會(huì)根據(jù)基因的情況進(jìn)行蛋白結(jié)構(gòu)的預(yù)測(cè),二維預(yù)測(cè)還有三維結(jié)構(gòu)預(yù)測(cè)都有助于病毒疫苗的制備,和老藥新用等藥物研發(fā)提供基礎(chǔ)。
在主要功能的用戶界面展示中可以看到,有測(cè)序數(shù)據(jù)分析、進(jìn)化分析、蛋白結(jié)構(gòu)分析。
通過(guò)序列分析和序列拼接,我們可以分析與病毒序列的同源性;診斷這一塊,進(jìn)化分析是進(jìn)行進(jìn)化樹(shù)的構(gòu)建,智能分析病毒傳播或演化的擬時(shí)間圖譜;蛋白的分析,與老藥新用、疫苗制備這些有很大關(guān)系。
性能介紹剛剛基本上都有講過(guò)了,我就highlight一下病源篩查的鑒定時(shí)間?,F(xiàn)在大部分做全基因組分析的公司基本上都要用2~3天的時(shí)間,才可以有結(jié)果。
我們的這個(gè)方案實(shí)驗(yàn)建庫(kù)只需要三個(gè)小時(shí);基因分析跟大家都一樣,建議用戶用自己原有的測(cè)序儀;我們的數(shù)據(jù)分析把以前將近6個(gè)小時(shí)的計(jì)算縮短到幾分鐘。實(shí)驗(yàn)建庫(kù)是我們的合作伙伴做了很大的改進(jìn),我們一起把2~3天的一個(gè)工作量縮短到14個(gè)半小時(shí)。
這里總結(jié)一下,剛剛我們講的14個(gè)半小時(shí)、20個(gè)病人同時(shí)并行處理,每個(gè)病人實(shí)際上只需要40分鐘左右,所以和現(xiàn)在市面上的PCR方法比較,平均時(shí)間還是短的。
我們現(xiàn)在也向海外開(kāi)放服務(wù),已經(jīng)收到明確需要部署全基因組分析的,有10個(gè)以上的國(guó)家和地區(qū)。
并且,這個(gè)方法已經(jīng)在武漢的金銀潭醫(yī)院部署,通過(guò)宏基因的方法檢測(cè)病毒源,幫助降低患者死亡率。并且已經(jīng)開(kāi)始了和國(guó)家疾控中心的合作。
疫情預(yù)測(cè)
疫情分析也是疫情期間很重要的一個(gè)產(chǎn)品,我們已經(jīng)收到了客戶-國(guó)務(wù)院辦公廳的感謝信,但是因?yàn)轭A(yù)測(cè)的內(nèi)容太多,時(shí)間關(guān)系,我只是簡(jiǎn)單介紹一下方法。
展示的這幾個(gè)圖,首先是把我們的模型和現(xiàn)有的一些數(shù)據(jù)去做對(duì)比、擬合,然后對(duì)未來(lái)進(jìn)行預(yù)測(cè),例如計(jì)算國(guó)外輸入的病例影響。
右邊的圖是根據(jù)某個(gè)決策,可能在不同的日期,來(lái)進(jìn)行一些推斷,比如死亡率、重癥率的一些推斷。不同的顏色表示的是這些政策不同的執(zhí)行時(shí)間,這是一個(gè)模板。
我們有一個(gè)DataV的工具,就是Data Visualization,用來(lái)做綜合信息大屏,是我們阿里平臺(tái)上的一個(gè)很炫的特色。
左下角的這個(gè)圖就是用DataV做出來(lái)的,它有地圖可以顯示,比如說(shuō)各個(gè)省份的R值。然后可以顯示某個(gè)城市全面開(kāi)放、逐步開(kāi)放,或者是全面管制的情況,用曲線來(lái)描述。
左側(cè)的R值針對(duì)不同的行業(yè),包括學(xué)校、交通,還包括一些娛樂(lè)場(chǎng)所,比如電影院等等。
剛剛說(shuō)的行業(yè)包括各種職業(yè),比如人口密集型的不能在家辦公的生產(chǎn)企業(yè),或者是IT公司,大家都可以在家辦公,這些都有很大的差別。
右側(cè)可以看到國(guó)家之間的交通有管制,各個(gè)國(guó)家之間的關(guān)聯(lián),會(huì)受到病毒輸入的影響不一樣,所以這個(gè)值有不同。
同時(shí)還可以看到各自國(guó)家的醫(yī)療水平,能夠感覺(jué)得到疫情在那里會(huì)不會(huì)爆發(fā)。因?yàn)檫@個(gè)圖做的比較早(2月10日左右),所以這里就給大家進(jìn)行一個(gè)簡(jiǎn)單的介紹。
我們也對(duì)海外國(guó)家開(kāi)放,現(xiàn)在收到很多的詢問(wèn),有些在進(jìn)行緊密的跟進(jìn),有一些數(shù)據(jù)已經(jīng)給過(guò)來(lái),我們會(huì)用一定的時(shí)間再出報(bào)告。
這個(gè)項(xiàng)目,我們也對(duì)海外國(guó)家開(kāi)放了?,F(xiàn)在收到很多的詢問(wèn),有十幾個(gè)國(guó)家有明確的需求,在搜集數(shù)據(jù)給我們出報(bào)告。
我們做的事情主要就是輔助用戶決策,進(jìn)行感染控制,醫(yī)療物資調(diào)配,出入境和旅游管控等等。并且根據(jù)政策上的改變,或者是社會(huì)的主要事件對(duì)預(yù)測(cè)進(jìn)行更新。
基本上疫情預(yù)測(cè)是2天出報(bào)告,會(huì)預(yù)測(cè)兩個(gè)月的時(shí)間,這兩個(gè)月的時(shí)間可以保證我們看到在當(dāng)前的各種條件、政策下,拐點(diǎn)是什么時(shí)候,以及各種各樣的特征。
醫(yī)療的專(zhuān)業(yè)翻譯
我們?cè)谝咔槠陂g還有一個(gè)工具——醫(yī)療的專(zhuān)業(yè)翻譯。這個(gè)工具最早是和我們的一個(gè)藥企合作伙伴,合作推出的。BLEU很高,大于48,當(dāng)時(shí)行業(yè)比較好的只有40。醫(yī)學(xué)術(shù)語(yǔ)翻譯準(zhǔn)確率大于94%,人工評(píng)價(jià)可理解度也超過(guò)94%。
我們還有一個(gè)特色是完善的文件解析生成能力,適應(yīng)用戶不同文件格式輸入,可以有效降低用戶在大量翻譯需求上的開(kāi)支。
這次疫情中,我們把它用在哪里了呢?是在馬老師的位于Ding Talk(也就是釘釘)上的全球醫(yī)生交流中心。
我們可以看到,主要是根據(jù)視頻的音頻去進(jìn)行聲音的捕捉以及翻譯,然后形成雙語(yǔ)字幕。左邊就是在我們前幾天發(fā)布的平臺(tái)網(wǎng)頁(yè)上,王建安院長(zhǎng)的一個(gè)很棒的視頻。我們現(xiàn)在已經(jīng)翻譯了四十個(gè)這樣的視頻,還有很多在等待翻譯。
知識(shí)圖譜
在左邊我們可以看到阿里員云公眾號(hào)上上線的智能問(wèn)答,這是疫情剛剛爆發(fā)時(shí)推出的一個(gè)簡(jiǎn)單問(wèn)答,是為了讓大家迅速了解病情,從而控制恐懼的情緒。
右上角是我們的產(chǎn)品天貓精靈,通過(guò)天貓精靈返回或者獲取聲音。這個(gè)對(duì)于老年人和亞健康人群都很有幫助,很多關(guān)于健康的問(wèn)題可以直接問(wèn)天貓精靈。
我們?cè)谑謾C(jī)端也有這種很直觀的服務(wù),比如可以詢問(wèn)一些跟老年慢性病相關(guān)的問(wèn)題。
搜索引擎
搜索引擎是可以用在各種各樣的產(chǎn)品上的,那我為什么把這個(gè)著重介紹一下呢?
我們都知道在淘寶平臺(tái)有拍立淘,是根據(jù)照片尋找類(lèi)似商品,這個(gè)能力已經(jīng)做到很好了。
醫(yī)療行業(yè),也是把拍立淘的技術(shù)作為影像檢測(cè)的基礎(chǔ),同時(shí)我們還加入了文本。
在這個(gè)地方我們可以看到圖像里面有一些病灶,但是多個(gè)的情況下可以選一個(gè),或者是選多個(gè)都可以.然后在窗口可以輸入關(guān)鍵字,或者是輸入整篇報(bào)告,然后進(jìn)行搜索。
搜索的目的是希望可以幫到醫(yī)生,當(dāng)他在看當(dāng)前病歷時(shí),可以立刻知道數(shù)據(jù)庫(kù)里有沒(méi)有類(lèi)似病例。右邊實(shí)展示了各種各樣的相似病例,然后進(jìn)行排序。在這邊點(diǎn)擊任何一個(gè)進(jìn)去,可以看到前后每一幀的情況,并且可以復(fù)制下面的報(bào)告,具體看它是如何相似,哪個(gè)角度相似;可以把報(bào)告拷過(guò)來(lái)進(jìn)行修改,大大節(jié)省醫(yī)生的時(shí)間和精力。
另一方面,我們對(duì)C端用戶端有一個(gè)參考。它可以搜索一些治病的過(guò)程,例如,需要經(jīng)歷哪些流程、怎么收費(fèi)情況,讓病人對(duì)自己關(guān)心的問(wèn)題有一個(gè)參考。
最后,是對(duì)未來(lái)的展望,我們可以簡(jiǎn)單提一下一些未來(lái)可做的前沿應(yīng)用示例。
比如VR遠(yuǎn)程救助,5G遠(yuǎn)程手術(shù),無(wú)醫(yī)生病房/機(jī)器人醫(yī)生,5G遠(yuǎn)程多學(xué)科會(huì)診,醫(yī)院上云、未來(lái)藥物管理、醫(yī)療IOT、無(wú)人機(jī)和急救車(chē)智能管理、以及未來(lái)醫(yī)保。
從業(yè)務(wù)和服務(wù)的角度,我們會(huì)努力服務(wù)好醫(yī)院、區(qū)域協(xié)同、政府監(jiān)管、基層公衛(wèi)、亞健康和健康人群/C端用戶、國(guó)內(nèi)國(guó)際藥企、醫(yī)保和商保、器械廠商和手術(shù)耗材廠商。
我們很希望可以盡快把醫(yī)療的相關(guān)知識(shí)更多的、更深入的學(xué)習(xí)進(jìn)來(lái),用科技去服務(wù)我們的客戶,和合作伙伴進(jìn)行更好的合作,改善人們的生活、醫(yī)療健康狀況。
我們希望會(huì)是醫(yī)學(xué)領(lǐng)域的學(xué)霸,然后為客戶的理想和自己的夢(mèng)想去沖!雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。