1
本文作者: 張馳 | 2016-12-08 17:06 |
圖片來自asianscientist
12月7日下午,江湖傳言不輕易出面且連股東也請不動的碳云智能首席科學(xué)家李英睿,出現(xiàn)在了松禾資本的年會,并在演講中講了碳云在做的事以及精準(zhǔn)醫(yī)學(xué)。
李英睿是碳云智能聯(lián)合創(chuàng)始人兼首席科學(xué)家,曾任華大科技CEO和華大基因首席科學(xué)家。2016年,他入選福布斯30位30歲以下亞洲人物榜生命科學(xué)榜。
本文由雷鋒網(wǎng)根據(jù)他的演講內(nèi)容整理而來。
公眾對精準(zhǔn)醫(yī)學(xué)的熟悉,得益于美國總統(tǒng)奧巴馬的推廣。雷鋒網(wǎng)曾報道,2015年1月底,奧巴馬在2015年國情咨文演講中宣布精準(zhǔn)醫(yī)療計劃(Precision Medicine Initiative),它致力于治愈癌癥和糖尿病等疾病,讓所有人獲得健康個性化信息。此后,這些詞紅遍了太平洋東西兩岸。
不過李英睿認(rèn)為,從數(shù)據(jù)分析的角度看,只要走的是循證醫(yī)學(xué)的路徑,就可以被認(rèn)為是精準(zhǔn)醫(yī)學(xué),因為循證醫(yī)學(xué)從醫(yī)意識就是“準(zhǔn)確”,最開始就是基于數(shù)據(jù)的決策。我們現(xiàn)在提出精準(zhǔn),是因為可以從病人處得到更多的可測量特征。
隨著技術(shù)的進(jìn)步,我們對人類的測量越來越多。通常的醫(yī)學(xué)關(guān)注醫(yī)學(xué)影像,還有身體的各種體征,以及醫(yī)生對病人的觀測。而現(xiàn)在的數(shù)據(jù)時代,我們能夠掌握的比原來要多很多,有移動互聯(lián)網(wǎng)數(shù)據(jù),社交數(shù)據(jù),還有各種動態(tài)分子信息和蛋白質(zhì)、代謝等信息,以及身體各個部位的信息。
現(xiàn)在已經(jīng)有可能形成關(guān)于人全局的數(shù)據(jù)化生命,從靜態(tài)到動態(tài)數(shù)據(jù),再到我們自己的行為和社交數(shù)據(jù)等,這就是所謂數(shù)字化生命。
那這些數(shù)據(jù)會給醫(yī)學(xué)或者健康帶來什么呢?
李英睿認(rèn)為,過去我們是對現(xiàn)象的描述,醫(yī)療中做的決策是基于某種局部數(shù)據(jù)。我們通常去的是分診,分診是??疲ㄟ^局部數(shù)據(jù)來考慮問題。另外還有做決策,絕大部分是多因子線性決策,還是對癥下藥為主。過往也更多偏向于診斷和治療,即患者的狀態(tài)出現(xiàn)了問題,那要對你進(jìn)行判斷、診斷,然后進(jìn)行治療。
但是現(xiàn)在與未來的傾向不是會是這樣。我們現(xiàn)在觀察到的很多東西不是去研究基因的問題,而是基因組的問題,我們不再是研究蛋白的問題,而是蛋白組的問題。很多決策是非線性的決策,而且是以個體為中心的邏輯組織。通過這種的辦法,有可能去涵蓋預(yù)防、預(yù)警和預(yù)后的情況,這是很大的變化。
新近可測量的全局?jǐn)?shù)據(jù),包括基因組、皮膚、口腔、腸道、生殖道元基因組,還有血、尿、唾液代謝組和蛋白質(zhì)組,以及可穿戴設(shè)備及電子病歷等。這些趨勢都是在最近5-10年出現(xiàn)的,它帶來的好處是,目前業(yè)已實現(xiàn)孕前攜帶者篩查,胚胎單細(xì)胞分析,產(chǎn)前基因組檢測,進(jìn)行性遺傳缺陷早診,益生菌和益生元干預(yù)等。
實現(xiàn)精準(zhǔn)醫(yī)學(xué),還面臨諸多困難,李英睿指出主要包括以下幾個。
生物數(shù)據(jù)本身發(fā)展比較快,超摩爾定律發(fā)展的全局?jǐn)?shù)據(jù)、頻繁采樣、實時計算,對計算、存儲和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的要求比較高,這本身就是很難的事情。
另外,大規(guī)模全局的系統(tǒng)比對,要求高度的數(shù)據(jù)共享和知識互聯(lián)。而數(shù)據(jù)共享不完全是數(shù)據(jù)問題,還是格局問題,本身是垂直行業(yè)要去思考的問題。在目前為止,絕大部分醫(yī)療行業(yè)所謂的大數(shù)據(jù),只是數(shù)據(jù)的樣本大。
個體數(shù)據(jù)的多樣性和豐富度需要實現(xiàn)數(shù)據(jù)可視化,知識表述和協(xié)同決策網(wǎng)絡(luò)。而對機(jī)器學(xué)習(xí)技術(shù)的誤解亟待澄清,并構(gòu)建人類與人工智能的協(xié)作框架,人工智能不是用來取代人類,而是協(xié)助人類的。
多層次非線性系統(tǒng)復(fù)雜度呈指數(shù)級上升,但可解釋度下降。深度學(xué)習(xí)就像一個黑匣子,這個問題仍舊存在。
而且,時至今日各種新型數(shù)據(jù)的用法,依然是傳統(tǒng)的局部數(shù)據(jù)使用。另外就是,精準(zhǔn)醫(yī)學(xué)中的生物信息學(xué)仍然處理的是分類問題,并沒有涉及真正意義的復(fù)雜網(wǎng)絡(luò)推理和預(yù)測問題。
由于這些問題的存在,目前數(shù)據(jù)在科研上的運用做得很快,但是在臨床上還有很多問題需要去解決。搞大數(shù)據(jù)實際上是搞不過搞數(shù)據(jù)入口的,掌握了數(shù)據(jù)入口,才是真正掌握了大數(shù)據(jù)的要素。
精準(zhǔn)醫(yī)學(xué)之外,李英睿認(rèn)為,醫(yī)學(xué)只是健康的一部分,而真正的健康不僅在于改善我們的醫(yī)學(xué)能力,更在于我們進(jìn)行健康管理的意識和能力。他表示,美國的路徑已經(jīng)表示,開發(fā)再多的藥,對壽命的提升還是非常有限的。未來的藥物能夠適用的人越來越少,但成本越來越高,永遠(yuǎn)不會把費用控制下來。
所以,健康管理的真正表現(xiàn),是全面智能管理。今天所謂的醫(yī)療部分其實只是精準(zhǔn)的診療,但要管理的還有遺傳風(fēng)險,要關(guān)注一個人的生活方式及其存在的環(huán)境。只有清楚的知道一個人遺傳的變化,知道其健康生活的方式,知道其生活的環(huán)境,再加上醫(yī)療的保障,這個時候才能實現(xiàn)全面的健康管理。
個體化生命管理主要體現(xiàn)在下面幾個主要的問題:
第一個是要預(yù)測生命狀態(tài)的未來演變趨勢;
第二個是預(yù)測干預(yù)措施及其組合方案,對生命狀態(tài)未來演變趨勢的影響;
第三個是給定生命狀態(tài)的未來目標(biāo),求極大化該目標(biāo)事先概率的可行干預(yù)方案。
他指出,生命管理不止于醫(yī)學(xué)。隨著年齡的增長,我們某天去醫(yī)院做體檢的時候,是突然有了疾病的狀態(tài)。但是疾病一定不是一天之內(nèi)發(fā)生的,而是以前積累的。但今天的邏輯是,你之前都是好的,只是突然有一天你來檢驗做預(yù)測的時候就得病了,這不是特別的合理。
我們今天要關(guān)注的問題是,在大數(shù)據(jù)的情況下,當(dāng)生命在往疾病狀態(tài)變化的時候,我們可不可以預(yù)測到這種趨勢,知道這種趨勢的時候,又可不可以提前進(jìn)行干預(yù),可不可以讓生命往更健康的趨勢去管理。這就是真正的生命管理要做到的事,而今天我們討論的精準(zhǔn)醫(yī)療,是在已經(jīng)達(dá)到醫(yī)療狀況的時候,怎么對生命進(jìn)行挽救。
這個里面又有不少技術(shù)問題,生命管理又有很多生物信息方面的難點,主要包括:
需觀測和分析的數(shù)據(jù)維度異質(zhì);
數(shù)據(jù)源多而分散,數(shù)據(jù)流碎片化;
數(shù)據(jù)特征難以預(yù)期;
知識發(fā)現(xiàn)方向開放而難以預(yù)期;
時間、空間的變量進(jìn)一步復(fù)雜了問題;
以及大規(guī)模實時在線計算。
有怎么樣的方法能夠解決這樣的問題呢?李英睿指出,面對這個問題,可以思考這樣的問題:為什么人類在面對新的問題的時候都可以找到解決方法,人類是基于什么想法來考慮問題的?
人類能夠在看到一個結(jié)果的時候,可以判斷這樣一個數(shù)據(jù)的特征應(yīng)該用什么樣的算法來看,通過比較邏輯的方向,在這些數(shù)據(jù)里面去找到新的規(guī)律,去解釋、分類和識別。
從存儲到計算到展現(xiàn),碳云智能不是去回答具體的問題,能做的事情是建立一個接近于智能的計算框架,當(dāng)它碰到這些問題的時候,能夠發(fā)現(xiàn)問題然后解決問題。
具體而言,碳云智能的方法是,一方面把多種異構(gòu)的數(shù)據(jù)進(jìn)行元數(shù)據(jù)的處理,對于元數(shù)據(jù)框架,不管是什么樣的數(shù)據(jù)一定要抽過來,做一個基本調(diào)整,把它變成可計算的元數(shù)據(jù)再進(jìn)行計算。第二就是算法接口化分層化。
演講的最后,李英睿還認(rèn)為,在數(shù)字化生命管理中,真正的挑戰(zhàn)并不來自于科技的不足,而是來自于人類普遍不尊重和愛惜自己的生命。這個才是他覺得健康方面真正的挑戰(zhàn),技術(shù)問題反而是簡單的問題。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。