0
本文作者: 張馳 | 2017-06-20 17:17 | 專題:GAIR 2017 |
雷鋒網(wǎng)按:由中國計算機(jī)學(xué)會(CCF)主辦、雷鋒網(wǎng)與香港中文大學(xué)(深圳)全程承辦的AI盛會——「全球人工智能與機(jī)器人峰會」(CCF-GAIR),將于7.7-7.9日在深圳召開。CCF-GAIR為國內(nèi)外學(xué)術(shù)、業(yè)界專家提供一個廣闊交流的平臺,既在宏觀上把握全球人工智能趨勢脈搏,也深入探討人工智能在每一個垂直領(lǐng)域的應(yīng)用實踐細(xì)節(jié)。
延續(xù)上一次大會的頂級嘉賓陣容,本次 CCF-GAIR 2017 將會迎來更多人工智能和機(jī)器人行業(yè)重磅專家。在未來的一段日子里,雷鋒網(wǎng)將陸續(xù)放出嘉賓介紹。今天要介紹的是未來醫(yī)療專場的大會嘉賓——哈爾濱工業(yè)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院教授關(guān)毅。
關(guān)教授的主要研究領(lǐng)域包括:智能化信息檢索、健康信息學(xué)、網(wǎng)絡(luò)挖掘、自然語言處理及認(rèn)知語言學(xué)。他主持、參與并完成了多項國家自然科學(xué)基金、國家863、國際合作等項目,在國內(nèi)外期刊和會議上發(fā)表學(xué)術(shù)論文60余篇。
在2013年,關(guān)教授和團(tuán)隊與北京一家醫(yī)保公司合作,在中文電子病歷的病因?qū)嶓w與實體關(guān)系抽取方面做了的不少工作。自此往后,他逐漸感覺到,醫(yī)療健康肯定是自然語言處理的下一個熱點(diǎn),而且“是自然語言處理唯一可能做出人人都有需求的軟件的一個領(lǐng)域”,所以選擇將它作為團(tuán)隊的主攻方向。選擇這一領(lǐng)域的另一個原因,則是關(guān)教授妻子的一家人都是醫(yī)生。
隨著國內(nèi)醫(yī)療信息化的普及,中文電子病歷的規(guī)模也與日俱增。它是有高可信度的醫(yī)療大數(shù)據(jù),也是有臨床決策支持的重要診療證據(jù),從其中獲取的醫(yī)療知識有很高的價值。
關(guān)教授及團(tuán)隊在醫(yī)療方面的研究用一句話概括就是:互聯(lián)網(wǎng)時代面向醫(yī)療健康的自然語言處理技術(shù),從醫(yī)療大數(shù)據(jù)、中文電子病歷中挖掘知識,然后進(jìn)行預(yù)測和推理相關(guān)的研究。而他們的核心研究成果之一,是醫(yī)療知識網(wǎng)絡(luò)(Medical Knowledge Network,MKN),或者用更為外界熟悉的詞來說,就是醫(yī)療大腦。
所謂醫(yī)療大腦,就是計算機(jī)對醫(yī)生疾病推斷過程的模擬,雷鋒網(wǎng)在往期硬創(chuàng)公開課中也對這一概述有過詳細(xì)介紹。它是個比較籠統(tǒng)的稱呼,各家的定義及作用也不盡相同。簡單來說,它是一種知識庫以及基于此的邏輯推理和計算。它可以泛指醫(yī)療從業(yè)人員智慧的總和,可以獨(dú)立提供用藥輔助、分診導(dǎo)診、健康咨詢,也可以高質(zhì)量地輔助醫(yī)療從業(yè)人員完成某項工作。
關(guān)教授告訴雷鋒網(wǎng),在做智能診療研究時,首先要選擇基準(zhǔn)模型,能將邏輯規(guī)則和概率能結(jié)合起來進(jìn)行快速推理。經(jīng)過調(diào)研,他們找到了馬爾科夫邏輯網(wǎng)(Markov logic network),一種可以進(jìn)行不確定推理的概率邏輯。
雖然這一模型比較合適,但它也有其缺點(diǎn)。關(guān)教授表示,它只能針對二值變量,不能表示數(shù)值型的值,而數(shù)值型的體征數(shù)據(jù)在醫(yī)療領(lǐng)域中大量存在,這讓模型不能完全適用。為此他們做了理論創(chuàng)新,采用物理學(xué)中的能量函數(shù)表示勢函數(shù),使馬爾科夫模型能表示數(shù)量型的知識。這個改進(jìn)版的模型,就是最終的醫(yī)療知識網(wǎng)絡(luò)。
回顧MKN開發(fā)的過程,關(guān)教授提到,將技術(shù)應(yīng)用于醫(yī)療領(lǐng)域的難度比自己設(shè)想的要難得多。“我最大的體會是,要和醫(yī)療部門的專業(yè)人士緊密合作才能有所收獲。我之所以進(jìn)展順利,也是因為確實有這個條件,方做出了有價值的工作?!?br/>
現(xiàn)在的機(jī)器學(xué)習(xí)方法以監(jiān)督學(xué)習(xí)為主,這就需要大量人工標(biāo)注的語料,而其中又必須有專業(yè)醫(yī)生參與,把他們的知識固化成資源,供計算機(jī)模型來用。
如今,智能診斷這個方向越來越熱。在工業(yè)界,如百度、IBM、阿里這樣的大公司,以及康夫子等初創(chuàng)公司,均在打造屬于自己的醫(yī)療大腦。
關(guān)教授認(rèn)為,對于智能診斷來說現(xiàn)在知識的量化(指數(shù)量)還遠(yuǎn)遠(yuǎn)不夠,而且從電子病歷提取了很多經(jīng)驗知識,還要與常識相結(jié)合。
“這本身是一個多知識源融合的問題,就像人需要廣泛涉獵醫(yī)療知識一樣,機(jī)器也是如此。知識的積累在量上要達(dá)到一定規(guī)模,才能產(chǎn)生預(yù)期的智能效果?,F(xiàn)在大家都是在爬坡的階段,不會是一蹴而就,而是相對比較漫長的過程?!?/p>
而其中面臨的挑戰(zhàn),除了時間,還有技術(shù)上的。關(guān)教授告訴雷鋒網(wǎng),知識的抽取、知識的表示、醫(yī)療知識的推理、新知識的學(xué)習(xí),這些都是目前學(xué)術(shù)研究的熱點(diǎn),也是他們正在攻克的領(lǐng)域。其它需要探索的方向還有,基于最大間隔的知識權(quán)重訓(xùn)練方法,知識的自動擴(kuò)展,以及在線學(xué)習(xí)的新方法等等。
對于另一個熱門技術(shù)——深度學(xué)習(xí),能不能用它進(jìn)行推理,也是學(xué)術(shù)和醫(yī)療應(yīng)用中在研究的領(lǐng)域。
“深度學(xué)習(xí)能不能進(jìn)行推理還有很多不確定。能不能通過知識的向量化,用張量表示知識,用遞歸神經(jīng)網(wǎng)絡(luò)來表示知識,并在這一基礎(chǔ)上進(jìn)行深度學(xué)習(xí)相關(guān)的推理?”
關(guān)教授告訴雷鋒網(wǎng),深度學(xué)習(xí)在特定疾病的診療上有突破,但他們的努力方面是試圖構(gòu)造一個醫(yī)療專業(yè)大腦,這方面他們做了很多工作。
以上有關(guān)人工智能如何服務(wù)醫(yī)療知識的挖掘與應(yīng)用的內(nèi)容,關(guān)教授會在CCF-GAIR的演講中有所涉及,他會從自己的研究出發(fā),為我們揭示如何開發(fā)一個真正的醫(yī)療大腦。如果你想近距離了解關(guān)教授的研究成果,歡迎購票參會。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章