3
想象一下:在未來的某一天,如果 AI 診療成為了現(xiàn)實,你就能直接在醫(yī)院用電腦看病了。通過化驗的數(shù)據(jù),系統(tǒng)很快就給了你一個診斷結(jié)果,讓你乖乖去開藥吃藥,甚至決定要不要手術(shù)……雖然這個過程聽上去很便捷也很美好,但要抵達 AI 診療的烏托邦,實際上并沒有那么簡單,且不論它的磚瓦尚在建設(shè)當中,要走向烏托邦的路途,同樣沒有想象中的容易。
停留在實驗室里的 AI 診療
AI 診療的用戶群體并不只局限于輔助醫(yī)生,按照服務(wù)群體的不同,可以分為四個層面:
回復(fù)患者咨詢;
輔助導(dǎo)診人員、藥店人員、醫(yī)療在線客服;
基層醫(yī)生及全科醫(yī)生的臨床輔助決策;
面向醫(yī)生的患者康復(fù)跟蹤。
而以上功能要和 AI 診療扯上關(guān)系,醫(yī)療創(chuàng)業(yè)公司如果沒有大量的數(shù)據(jù),要做成一個成熟的產(chǎn)品簡直無從談起。
創(chuàng)業(yè)公司在數(shù)據(jù)匱乏的情況下,目前的主要方式是和醫(yī)院或數(shù)據(jù)中心合作,獲取相關(guān)的數(shù)據(jù)。而這些數(shù)據(jù)主要的用途尚不是用于醫(yī)院實戰(zhàn)診斷,而僅僅是前期的積累工作——通過海量臨床數(shù)據(jù)來優(yōu)化算法。
人工智能診斷新星 Enlitic 的創(chuàng)始人 Jeremy Howard 曾一度表示,缺乏數(shù)據(jù)是制約它們發(fā)展的主要原因。而它在去年獲得 Capitol Health 領(lǐng)投的 1000 萬美元融資,通過后者提供的放射科數(shù)據(jù)完善診斷算法。通過海量醫(yī)療數(shù)據(jù)的挖掘,實現(xiàn)對醫(yī)學影像的實時準確診斷,提供患病概率預(yù)測,并輔助醫(yī)生決策。
而目前最為成功的 AI 診療系統(tǒng)非 IBM 的Watson 莫屬了。根據(jù)東京系統(tǒng)與軟件開發(fā)研究所 Watson Health Cloud 的軟件工程師林雪婷此前向雷鋒網(wǎng)的介紹,系統(tǒng)需要有可以進行合作的研究中心,以獲取準確的數(shù)據(jù)來源。 Watson獲取數(shù)據(jù)的做法主要是和美國第二大連鎖藥店 CVS 合作,獲取用戶的行為信息、臨床數(shù)據(jù)、購藥數(shù)據(jù)及保險信息等,或是和各地的實驗室及研究中心合作。
然而,目前的研究工作主要還是局限在實驗室中。即便有著 Watson 診斷白血病的成功案例,它距離臨床實驗還有一定距離。
數(shù)據(jù)的有效性
AI診療最大的硬傷在于為醫(yī)療研究所收集的數(shù)據(jù),與真實問診還有距離。
一個原因在于數(shù)據(jù)規(guī)模小。目前大部分科技公司的做法是,通過向醫(yī)院機構(gòu)獲取數(shù)據(jù),而予以定制化解決方案作為交換,但這些臨床數(shù)據(jù)只能算是“小打小鬧”。
雷鋒網(wǎng)簡單為大家算筆帳:僅僅在英國,每天就有接近200人無法看到明天的英國雨景(順手一黑)。而到2020年,全球因AMD(一種因糖尿病繼發(fā)的視網(wǎng)膜病變)而失明的人將達到2億人。
但是,就算是谷歌DeepMind和英國百年老醫(yī)院 Moorfields這樣的強強聯(lián)手,到目前的訓(xùn)練數(shù)據(jù)也只能達到 100 多萬張匿名掃描圖。這樣一對比,獨立醫(yī)院所能提供的數(shù)據(jù)和全球患者相比簡直是滄海一粟。而與此同時,對于疾病的數(shù)據(jù)獲取就會受到地域甚至是病種的局限,這就讓數(shù)據(jù)的有效性打了個折扣。
另一個問題在于數(shù)據(jù)的質(zhì)量有待提高。電子化程度不夠,數(shù)據(jù)采集方式良莠不齊、缺乏標準體系及結(jié)構(gòu)化程度低的數(shù)據(jù)來源,更讓臨床試驗帶來了困難。
醫(yī)療數(shù)據(jù)不像金融數(shù)據(jù)一樣,顆粒度和專業(yè)度已經(jīng)比較成熟,目前醫(yī)院的 HIS及 EMR 的程度還遠遠不夠?!皵?shù)據(jù)的質(zhì)量是有效分析的基礎(chǔ),目前數(shù)據(jù)清洗工作占據(jù)了太多工作量,終究還是質(zhì)量的問題?!睒涮m醫(yī)院 CEO 鄭杰如是說。他認為,使用醫(yī)院信息系統(tǒng)的多為平均年齡較大的醫(yī)生,對接納最新信息系統(tǒng)的排斥度較高,且沒有進行數(shù)據(jù)分析的迫切動力,因此“也就很難建立優(yōu)秀的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)質(zhì)量” 。
雷鋒網(wǎng)詢問了幾位一二線醫(yī)院的醫(yī)生,他們表示目前醫(yī)院并沒有引入相關(guān)的人工智能診斷設(shè)施,因為準確率并不樂觀,尚處于觀望狀態(tài),但不排除“在法規(guī)允許的情況下,將人工智能診斷做為輔助診斷?!?/p>
康夫子 CEO 張超對雷鋒網(wǎng)表示,“目前市面上的診斷(做了很多年的專家系統(tǒng)),主要還是基于癥狀,少數(shù)能加入化驗數(shù)據(jù),但實際上,病史、用藥、誘因等等都需要逐步學習?!被灥臄?shù)據(jù),更多的是做為一個當下的參考,而醫(yī)生的“望聞問切”,則是對癥狀、誘因、病史、用藥史等多個維度的綜合考量。而數(shù)據(jù)的質(zhì)量不佳,必然會阻礙人工智能的學習。
除卻數(shù)量和質(zhì)量外,法律的缺失也給數(shù)據(jù)的有效性打了個問號。
且不論這些到手的數(shù)據(jù)質(zhì)量的信息化水平如何,更不要說此前,DeepMind 因為和 NHS 達成了每年160萬的數(shù)據(jù)交換而引致輿論攻擊了。而蘋果在最新的規(guī)范中同樣不允許開發(fā)者將數(shù)據(jù)存儲在 iCloud 上,也是科技公司為了規(guī)避泄漏數(shù)據(jù)伴隨而來的風險所做的規(guī)范。
截至現(xiàn)在,國內(nèi)外都沒有相應(yīng)的 AI 診療相關(guān)法規(guī),對于相關(guān)的責任主體及就診流程,也缺乏一個明確的規(guī)范。目前國外第三方只能根據(jù) HIPPA 協(xié)議使用個人數(shù)據(jù)的統(tǒng)計信息,這個頒布于 1996 年的醫(yī)療保險攜帶和責任法案旨在保護患者隱私和健康有關(guān)的電子數(shù)據(jù),并且讓數(shù)據(jù)的交換過程盡可能標準化。
HIPAA 的安全原則所定義的技術(shù)保障并不要求使用某一項具體的技術(shù),而是一個可調(diào)整的框架,要求機構(gòu)為了保護數(shù)據(jù)安全,盡可能多地采用適宜的技術(shù),而這些安全方案需要實現(xiàn)“檢查控制、信息完整、數(shù)據(jù)傳輸?shù)取?多種要求。
醫(yī)學數(shù)據(jù)出于隱私的顧慮,通常不可能大范圍地進行分享,而囿于人們對病痛的天然排斥,對于患病的化驗數(shù)據(jù)自然更是不愿意向他人“分享”的,各家醫(yī)院的“信息孤島”問題又加劇了這一現(xiàn)狀。
小結(jié)
簡單說來, AI 診療未能快速發(fā)展的主要原因,在于數(shù)據(jù)的數(shù)量和質(zhì)量在目前階段尚不足以支持真實問診環(huán)節(jié)。診療是一個非常個性化及私人化的活動,要讓就診數(shù)據(jù)得到大規(guī)模的開放和運用,除了在基于語義的自然語言處理上進行大數(shù)據(jù)分析外,也需要法律的支持和保護。
這樣,醫(yī)療大數(shù)據(jù)才能在有效性上真正服務(wù)于人工智能的探索,為 AI 診療提供幫助和支持,說不定在不遠的未來,我們就能抵達烏托邦,享受到電腦看病的便利了。
推薦閱讀:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。