3
想象一下:在未來(lái)的某一天,如果 AI 診療成為了現(xiàn)實(shí),你就能直接在醫(yī)院用電腦看病了。通過(guò)化驗(yàn)的數(shù)據(jù),系統(tǒng)很快就給了你一個(gè)診斷結(jié)果,讓你乖乖去開(kāi)藥吃藥,甚至決定要不要手術(shù)……雖然這個(gè)過(guò)程聽(tīng)上去很便捷也很美好,但要抵達(dá) AI 診療的烏托邦,實(shí)際上并沒(méi)有那么簡(jiǎn)單,且不論它的磚瓦尚在建設(shè)當(dāng)中,要走向?yàn)跬邪畹穆吠?,同樣沒(méi)有想象中的容易。
停留在實(shí)驗(yàn)室里的 AI 診療
AI 診療的用戶(hù)群體并不只局限于輔助醫(yī)生,按照服務(wù)群體的不同,可以分為四個(gè)層面:
回復(fù)患者咨詢(xún);
輔助導(dǎo)診人員、藥店人員、醫(yī)療在線(xiàn)客服;
基層醫(yī)生及全科醫(yī)生的臨床輔助決策;
面向醫(yī)生的患者康復(fù)跟蹤。
而以上功能要和 AI 診療扯上關(guān)系,醫(yī)療創(chuàng)業(yè)公司如果沒(méi)有大量的數(shù)據(jù),要做成一個(gè)成熟的產(chǎn)品簡(jiǎn)直無(wú)從談起。
創(chuàng)業(yè)公司在數(shù)據(jù)匱乏的情況下,目前的主要方式是和醫(yī)院或數(shù)據(jù)中心合作,獲取相關(guān)的數(shù)據(jù)。而這些數(shù)據(jù)主要的用途尚不是用于醫(yī)院實(shí)戰(zhàn)診斷,而僅僅是前期的積累工作——通過(guò)海量臨床數(shù)據(jù)來(lái)優(yōu)化算法。
人工智能診斷新星 Enlitic 的創(chuàng)始人 Jeremy Howard 曾一度表示,缺乏數(shù)據(jù)是制約它們發(fā)展的主要原因。而它在去年獲得 Capitol Health 領(lǐng)投的 1000 萬(wàn)美元融資,通過(guò)后者提供的放射科數(shù)據(jù)完善診斷算法。通過(guò)海量醫(yī)療數(shù)據(jù)的挖掘,實(shí)現(xiàn)對(duì)醫(yī)學(xué)影像的實(shí)時(shí)準(zhǔn)確診斷,提供患病概率預(yù)測(cè),并輔助醫(yī)生決策。
而目前最為成功的 AI 診療系統(tǒng)非 IBM 的Watson 莫屬了。根據(jù)東京系統(tǒng)與軟件開(kāi)發(fā)研究所 Watson Health Cloud 的軟件工程師林雪婷此前向雷鋒網(wǎng)的介紹,系統(tǒng)需要有可以進(jìn)行合作的研究中心,以獲取準(zhǔn)確的數(shù)據(jù)來(lái)源。 Watson獲取數(shù)據(jù)的做法主要是和美國(guó)第二大連鎖藥店 CVS 合作,獲取用戶(hù)的行為信息、臨床數(shù)據(jù)、購(gòu)藥數(shù)據(jù)及保險(xiǎn)信息等,或是和各地的實(shí)驗(yàn)室及研究中心合作。
然而,目前的研究工作主要還是局限在實(shí)驗(yàn)室中。即便有著 Watson 診斷白血病的成功案例,它距離臨床實(shí)驗(yàn)還有一定距離。
數(shù)據(jù)的有效性
AI診療最大的硬傷在于為醫(yī)療研究所收集的數(shù)據(jù),與真實(shí)問(wèn)診還有距離。
一個(gè)原因在于數(shù)據(jù)規(guī)模小。目前大部分科技公司的做法是,通過(guò)向醫(yī)院機(jī)構(gòu)獲取數(shù)據(jù),而予以定制化解決方案作為交換,但這些臨床數(shù)據(jù)只能算是“小打小鬧”。
雷鋒網(wǎng)簡(jiǎn)單為大家算筆帳:僅僅在英國(guó),每天就有接近200人無(wú)法看到明天的英國(guó)雨景(順手一黑)。而到2020年,全球因AMD(一種因糖尿病繼發(fā)的視網(wǎng)膜病變)而失明的人將達(dá)到2億人。
但是,就算是谷歌DeepMind和英國(guó)百年老醫(yī)院 Moorfields這樣的強(qiáng)強(qiáng)聯(lián)手,到目前的訓(xùn)練數(shù)據(jù)也只能達(dá)到 100 多萬(wàn)張匿名掃描圖。這樣一對(duì)比,獨(dú)立醫(yī)院所能提供的數(shù)據(jù)和全球患者相比簡(jiǎn)直是滄海一粟。而與此同時(shí),對(duì)于疾病的數(shù)據(jù)獲取就會(huì)受到地域甚至是病種的局限,這就讓數(shù)據(jù)的有效性打了個(gè)折扣。
另一個(gè)問(wèn)題在于數(shù)據(jù)的質(zhì)量有待提高。電子化程度不夠,數(shù)據(jù)采集方式良莠不齊、缺乏標(biāo)準(zhǔn)體系及結(jié)構(gòu)化程度低的數(shù)據(jù)來(lái)源,更讓臨床試驗(yàn)帶來(lái)了困難。
醫(yī)療數(shù)據(jù)不像金融數(shù)據(jù)一樣,顆粒度和專(zhuān)業(yè)度已經(jīng)比較成熟,目前醫(yī)院的 HIS及 EMR 的程度還遠(yuǎn)遠(yuǎn)不夠?!皵?shù)據(jù)的質(zhì)量是有效分析的基礎(chǔ),目前數(shù)據(jù)清洗工作占據(jù)了太多工作量,終究還是質(zhì)量的問(wèn)題?!睒?shù)蘭醫(yī)院 CEO 鄭杰如是說(shuō)。他認(rèn)為,使用醫(yī)院信息系統(tǒng)的多為平均年齡較大的醫(yī)生,對(duì)接納最新信息系統(tǒng)的排斥度較高,且沒(méi)有進(jìn)行數(shù)據(jù)分析的迫切動(dòng)力,因此“也就很難建立優(yōu)秀的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)質(zhì)量” 。
雷鋒網(wǎng)詢(xún)問(wèn)了幾位一二線(xiàn)醫(yī)院的醫(yī)生,他們表示目前醫(yī)院并沒(méi)有引入相關(guān)的人工智能診斷設(shè)施,因?yàn)闇?zhǔn)確率并不樂(lè)觀,尚處于觀望狀態(tài),但不排除“在法規(guī)允許的情況下,將人工智能診斷做為輔助診斷?!?/p>
康夫子 CEO 張超對(duì)雷鋒網(wǎng)表示,“目前市面上的診斷(做了很多年的專(zhuān)家系統(tǒng)),主要還是基于癥狀,少數(shù)能加入化驗(yàn)數(shù)據(jù),但實(shí)際上,病史、用藥、誘因等等都需要逐步學(xué)習(xí)?!被?yàn)的數(shù)據(jù),更多的是做為一個(gè)當(dāng)下的參考,而醫(yī)生的“望聞問(wèn)切”,則是對(duì)癥狀、誘因、病史、用藥史等多個(gè)維度的綜合考量。而數(shù)據(jù)的質(zhì)量不佳,必然會(huì)阻礙人工智能的學(xué)習(xí)。
除卻數(shù)量和質(zhì)量外,法律的缺失也給數(shù)據(jù)的有效性打了個(gè)問(wèn)號(hào)。
且不論這些到手的數(shù)據(jù)質(zhì)量的信息化水平如何,更不要說(shuō)此前,DeepMind 因?yàn)楹?NHS 達(dá)成了每年160萬(wàn)的數(shù)據(jù)交換而引致輿論攻擊了。而蘋(píng)果在最新的規(guī)范中同樣不允許開(kāi)發(fā)者將數(shù)據(jù)存儲(chǔ)在 iCloud 上,也是科技公司為了規(guī)避泄漏數(shù)據(jù)伴隨而來(lái)的風(fēng)險(xiǎn)所做的規(guī)范。
截至現(xiàn)在,國(guó)內(nèi)外都沒(méi)有相應(yīng)的 AI 診療相關(guān)法規(guī),對(duì)于相關(guān)的責(zé)任主體及就診流程,也缺乏一個(gè)明確的規(guī)范。目前國(guó)外第三方只能根據(jù) HIPPA 協(xié)議使用個(gè)人數(shù)據(jù)的統(tǒng)計(jì)信息,這個(gè)頒布于 1996 年的醫(yī)療保險(xiǎn)攜帶和責(zé)任法案旨在保護(hù)患者隱私和健康有關(guān)的電子數(shù)據(jù),并且讓數(shù)據(jù)的交換過(guò)程盡可能標(biāo)準(zhǔn)化。
HIPAA 的安全原則所定義的技術(shù)保障并不要求使用某一項(xiàng)具體的技術(shù),而是一個(gè)可調(diào)整的框架,要求機(jī)構(gòu)為了保護(hù)數(shù)據(jù)安全,盡可能多地采用適宜的技術(shù),而這些安全方案需要實(shí)現(xiàn)“檢查控制、信息完整、數(shù)據(jù)傳輸?shù)取?多種要求。
醫(yī)學(xué)數(shù)據(jù)出于隱私的顧慮,通常不可能大范圍地進(jìn)行分享,而囿于人們對(duì)病痛的天然排斥,對(duì)于患病的化驗(yàn)數(shù)據(jù)自然更是不愿意向他人“分享”的,各家醫(yī)院的“信息孤島”問(wèn)題又加劇了這一現(xiàn)狀。
小結(jié)
簡(jiǎn)單說(shuō)來(lái), AI 診療未能快速發(fā)展的主要原因,在于數(shù)據(jù)的數(shù)量和質(zhì)量在目前階段尚不足以支持真實(shí)問(wèn)診環(huán)節(jié)。診療是一個(gè)非常個(gè)性化及私人化的活動(dòng),要讓就診數(shù)據(jù)得到大規(guī)模的開(kāi)放和運(yùn)用,除了在基于語(yǔ)義的自然語(yǔ)言處理上進(jìn)行大數(shù)據(jù)分析外,也需要法律的支持和保護(hù)。
這樣,醫(yī)療大數(shù)據(jù)才能在有效性上真正服務(wù)于人工智能的探索,為 AI 診療提供幫助和支持,說(shuō)不定在不遠(yuǎn)的未來(lái),我們就能抵達(dá)烏托邦,享受到電腦看病的便利了。
推薦閱讀:
Watson首次確診罕見(jiàn)白血病,10分鐘診斷難點(diǎn)何在?
繼攻克圍棋后,Deepmind想“看透”人類(lèi)的眼睛
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。