0
本文作者: 三川 | 2017-07-09 18:53 | 專題:GAIR 2017 |
7 月 7 日,由中國計(jì)算機(jī)協(xié)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦的第二屆 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì),在深圳如期開幕。在大會(huì)第三天的醫(yī)療人工智能專場(chǎng),哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院教授關(guān)毅,帶來了開場(chǎng)報(bào)告:《怎樣構(gòu)造醫(yī)生的大腦》。
關(guān)老師從事自然語言處理(NLP)研究逾 20 多年,自認(rèn)是符號(hào)主義的粉絲。目前帶領(lǐng)一支約 30 人的團(tuán)隊(duì),從事互聯(lián)網(wǎng)時(shí)代面向醫(yī)療健康的 NLP 技術(shù)研發(fā)。關(guān)老師做過輸入法、智能化信息檢索,現(xiàn)在全面轉(zhuǎn)向醫(yī)療健康信息學(xué)。他認(rèn)為,NLP 下一個(gè)最重要的應(yīng)用領(lǐng)域會(huì)是醫(yī)療健康,因?yàn)椤爸挥性卺t(yī)療健康領(lǐng)域,才能做出人人都需要的軟件”。
本場(chǎng)報(bào)告的副標(biāo)題是“用認(rèn)知科學(xué)洞見上帝的新機(jī)”,關(guān)老師對(duì)此如此解釋:
”‘上帝’,它是指我們生活的物質(zhì)世界,我們看不見的精神世界的假想的創(chuàng)造者。它創(chuàng)造人類精神世界的時(shí)候,一定有些重復(fù)使用的簡(jiǎn)單原則。如果我們能洞見這些原則,我們就可以像他那樣,把人類的大腦保存在我們的硬盤里,讓人類的大腦像軟件一樣運(yùn)行在我們的服務(wù)器上?!?/p>
講座一開頭,關(guān)老師提出了頗有勸誡意味的“三段論”:
應(yīng)把創(chuàng)新建立在扎實(shí)的理論基礎(chǔ)上;
理論基礎(chǔ)是認(rèn)知科學(xué);
應(yīng)從認(rèn)知科學(xué)的新發(fā)現(xiàn)、新理論中尋求創(chuàng)新的源泉。
尤剛教授
“這張圖顯示的是我的岳父,是皮膚科專家尤剛教授,我很喜歡和他聊天,剛開始別有用心,后來我確實(shí)喜歡和他聊天,因?yàn)樗R(shí)淵博。再后來,我覺得我的后半生所能做的所有事情中最有意義的一件事就是把老人的大腦保存在我的硬盤里。”
過去的工作
制定了中文電子病例語言處理加工規(guī)范和語料庫,中文電子病例實(shí)體與實(shí)體關(guān)系加工規(guī)范和語料庫,心血管疾病風(fēng)險(xiǎn)因子加工規(guī)范和語料庫,開發(fā)了相關(guān)標(biāo)準(zhǔn)工具。
即將開展的工作
把中文病例實(shí)體與實(shí)體關(guān)系標(biāo)注語料庫由 992 份擴(kuò)充到五千份。在上面開展信息抽取的工作,從中文電子病例中抽取出醫(yī)療實(shí)體與實(shí)體關(guān)系,包括疾病、癥狀、檢查、診療等類別的實(shí)體,以及它們之間多種語義關(guān)系。另外還要抽取心血管疾病風(fēng)險(xiǎn)因子。
馬爾科夫邏輯
所有工作都是基于有監(jiān)督機(jī)器學(xué)習(xí)的方法。我們要尋找一種謂詞邏輯和概率結(jié)合起來快速推理的模型,這些模型要具備這三個(gè)基本條件:1.剛才我說的特點(diǎn)。2.堅(jiān)實(shí)的理論基礎(chǔ)。3.要有對(duì)新知識(shí)的學(xué)習(xí)能力,因?yàn)槲覀円獦?gòu)造有終身學(xué)習(xí)能力的機(jī)器人。在現(xiàn)有的種種模型中,我們選擇了馬爾科夫邏輯作為我們的基礎(chǔ)課題。
針對(duì)馬爾科夫邏輯網(wǎng),它存在一個(gè)不足——無法表示數(shù)量型知識(shí),我們做出一定理論改進(jìn),使它能夠表示體征中大量存在的數(shù)量型知識(shí),從而將馬爾科夫邏輯網(wǎng)改進(jìn)為醫(yī)療知識(shí)網(wǎng)絡(luò)的新模型。
醫(yī)療知識(shí)獲取方面,我們需要獲取更加復(fù)雜的知識(shí),將二元實(shí)體關(guān)系抽取擴(kuò)充到多對(duì)多的實(shí)體關(guān)系抽取
醫(yī)療知識(shí)表示方面,我們現(xiàn)有的知識(shí)表示方法存在兩點(diǎn)不足:1. 知識(shí)表示的能力有限,僅僅是一階謂詞邏輯;2. 不夠抽象化,無法直接參與數(shù)值運(yùn)算。對(duì)此,我們打算引入知識(shí)之間的關(guān)聯(lián)性,開展基于張量的知識(shí)向量化以及基于遞歸神經(jīng)網(wǎng)絡(luò)的知識(shí)向量化兩方面的探索。
醫(yī)療知識(shí)推理方面,探索復(fù)雜知識(shí)在概念模型基礎(chǔ)上的推理,前者更多凸現(xiàn)知識(shí)關(guān)聯(lián)性的知識(shí)。深度神經(jīng)網(wǎng)絡(luò)通常被人們認(rèn)為是分類模型,我們要探討它是否幫助我們完成推理任務(wù)。
醫(yī)療知識(shí)學(xué)習(xí)是在現(xiàn)有的知識(shí)網(wǎng)絡(luò)的基礎(chǔ)上,生成新知識(shí),并且判定新生成知識(shí)的可信度這兩個(gè)子任務(wù)。
“認(rèn)知科學(xué)領(lǐng)域一定也存在像牛頓定律那樣簡(jiǎn)單的基礎(chǔ)性模型,我們要把人工智能、自然語言處理的探索建立在認(rèn)知科學(xué)的新發(fā)現(xiàn)、新原理的基礎(chǔ)上。”雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章