0
一個機器醫(yī)生的診斷,你敢信嗎?
蘇州系統醫(yī)學研究所副研究員鄧立宗的研究目標,就是讓人們能夠放心地信任醫(yī)學人工智能。在他的理想場景里,醫(yī)學人工智能最后都能轉化為實際生活中可被大眾信任和日常使用的一種基礎醫(yī)療資源,讓權威靠譜的醫(yī)學信息查詢和獲取不再成為問題。
要想獲得人們的信任并不容易,更何況人工智能本身還存在“幻覺問題”。一邊是容不得半點差錯的嚴肅醫(yī)學,一邊是經常會“胡說八道”的人工智能。就算只是一些微小的語義差異,對于醫(yī)學判斷來說,差之毫厘就失之千里。
如何訓練、調教“不聽話”的人工智能使之服務于醫(yī)學嚴肅場景,是鄧立宗博士及其團隊的主要研究目標。在鄧立宗博士看來,要實現這一目標,最核心的要素是要實現領域知識和大模型的有機融合。因此在之前的工作中,他和團隊研發(fā)了能夠自動進化的醫(yī)學文本數據處理算法——中文電子病歷的表型信息智能結構化與標準化系統(PIAT)算法,并成功入選“2022年度中國醫(yī)學人工智能代表性算法”。
除了有面向醫(yī)學領域科研人員的算法平臺,鄧立宗還與團隊開發(fā)了一款目標用戶為醫(yī)學生的備考軟件。借由大模型與醫(yī)學數據的結合,標注出教科書上的重點考點,為用戶定制個性化的備考助手。
正如鄧立宗在與雷峰網的對話中所提到的,大模型的出現對他所在的領域來說是個很好的促進,能讓他不再局限于傳統的算法模型里,而是可以專注于“大模型+”的探索研究。
近期,2024年度「第二屆生物信息與轉化醫(yī)學大會」落下帷幕。本屆大會以 “人工智能時代的轉化醫(yī)學”為主題,由北京攜云啟源科技有限公司承辦。來自中國醫(yī)學科學院蘇州系統醫(yī)學研究所的鄧立宗副研究員受邀參會。
借此契機,鄧立宗副研究員與雷峰網進行了深入對話。以下為對話全文(經編輯):
雷峰網:請介紹一下您目前的您現在的研究方向?
鄧立宗:我主要的研究方向是醫(yī)學大數據和人工智能,尤其關注中文醫(yī)學文本大數據的處理。
舉個例子,現實中,我們知道醫(yī)生看病是需要先學習教科書上的知識,再到實際場景中,查看這個病人有什么癥狀,需要做什么檢查,最后下診斷、開藥,這一系列活動都要結合實際病人的情況做進行。這些動作的產生,都建立在他了解這些醫(yī)學知識的基礎上,以及懂得如何運用這些醫(yī)學知識。
現在我們的研究工作,就是要機器去學習并應用這些醫(yī)學知識,從文本中學習這種語言、知識。但本質上,這是一種概率式的學習,而醫(yī)學是一個非常嚴肅的領域,我們需要在這研究過程中,盡量提高計算機學習醫(yī)學知識的精度和準確度,讓它能夠在嚴肅場景中生成讓用戶覺得靠譜的內容。
在過去的五到十年間,我們建立了一整套面向醫(yī)學文本數據的知識表征、抽取、標化和應用的完整技術體系,這算得上是大模型出現前的知識工程時代積累下來的工作基礎。
大模型技術的出現,對于各行各業(yè)都是一個大的沖擊。以前,每處理一個任務都要單獨去寫一個對應的算法或模型?,F在,一個大模型就能夠很好地完成很多任務,不管是實體識別、還是關系抽取,甚至是直接診斷,都能夠做到。所以我們的研究方向也在發(fā)生變化。
我們現在主要在做的事情是:如何利用大模型技術來強化我們之前整個醫(yī)學文本大數據處理和加工的流程。
因為我們以前的那些技術,主要還是基于一些小規(guī)模的傳統訓練語言模型,而大語言模型時代,它本身就像個通才,已經擁有很好的知識基礎,但它可能還沒有一些專業(yè)領域的知識,所以我們希望能夠好好訓練它,思考如何將我們的專業(yè)知識有效地灌入大模型中,使其能夠更好地服務于醫(yī)學領域。
簡單來說,我們現在在做的是“大模型+”的工作。大模型本身,不是我們研究的全部,但是我們肯定會順應大模型的發(fā)展,讓大模型能夠很好地和醫(yī)學大數據的加工技術,以及醫(yī)學知識的應用技術整合在一起。
雷峰網:是什么契機讓您進入醫(yī)學大數據這個研究領域?
鄧立宗:進入醫(yī)學大數據這個領域主要還是受師承的影響。大約2013年,我的導師蔣太交教授去美國訪問,當時他接觸到了一些關于醫(yī)學大數據研究方向的前沿進展。這些進展都共同提到了美國哈佛醫(yī)學院開展的一個醫(yī)學信息化項目i2b2(Informatics for Integrating Biology and the Bedside,由美國國家醫(yī)學圖書館搭建的集成生物學及內部的信息共享平臺),主要致力于發(fā)展先進信息技術將醫(yī)學大數據轉化為臨床應用。
在那幾年國外也成立了很多醫(yī)學大數據公司,醫(yī)學大數據這個概念在當時非常火熱。受此啟發(fā)和指引,我們也邁入了這個看起來前景光明的領域。在我博士畢業(yè)后,蔣教授來到了中國醫(yī)學科學院,并作為創(chuàng)始人之一創(chuàng)建了蘇州系統醫(yī)學研究所,我也因此跟隨蔣教授來到了蘇州。
在那時候我面臨著一個研究方向上的選擇。
第一個是繼續(xù)此前的研究方向——蛋白質結構預測、病毒序列、結構的分析,
第二個選擇是利用當時醫(yī)科院的數據優(yōu)勢,發(fā)展醫(yī)學大數據。因為上述原因,我選擇了后者,醫(yī)學大數據和人工智能方向。
我們當時的最終目標是想把這種醫(yī)學文本知識給充分利用起來,去發(fā)展機器醫(yī)生這么一個場景。
雷峰網:從您的學術生涯來看,您從本科到碩博是經歷了一次專業(yè)的轉換,這種跨學科的教育背景對您現在的研究方法和角度有什么影響嗎?
鄧立宗:是有影響的,我相當于是跨了領域。我的本科在中科大學習生命科學,之后在中科院攻讀生物信息學的碩士和博士學位,當時主要是利用AI技術和學習算法進行蛋白質結構的分析和預測。而我后來從事的其實是醫(yī)學信息學(正確)這方面的內容。這兩個學科的發(fā)展差異是非常大的。
因為當時我在生物信息學專業(yè)學習階段,整個生信領域數據的規(guī)范性和成熟度都要遠遠高于醫(yī)學信息學領域,特別是中文醫(yī)學信息學領域,所以后來在醫(yī)學信息學領域我們借用了很多生物信息學的理念。
比如說,蛋白質序列或者基因序列,其實也是一種語言,只不過它們更規(guī)范——就像蛋白質就是20種氨基酸,提到基因組就是ATGC。他們通過這些不同的符號組成了很多這種排列組合的生物學語言。后來我們做醫(yī)學大數據的時候,主要處理人類語言。如果你把它想象成是很多單詞或者文字的組合,從語言學的角度來看,處理生物符號和人類語言之間,其實差別也不大,所以我們當時把整個生物信息學的方向遷移過來使用了。
就像當初處理蛋白質結構預測的理念是,從序列出發(fā),我搭建一個識別語言的建構,基于這樣的語言結構、知識單元,再去做智能化的抽取,形成一個知識圖譜,最后讓機器利用起來。我把學習到的兩種東西以這種方式融合起來。
雷峰網:您和團隊對大模型所帶來的改變有什么看法?
鄧立宗:它的出現,給我們指明了未來技術發(fā)展的方向。剛開始出來的時候,我們確實非常受到震撼,當時以為會像蛋白質結構預測領域一樣,直接被顛覆,但是后來其實并不像我們所想的那樣。它只不過是打開了一個新的口子,讓科研人員可以順著這個方向,進一步去做更多事情。
在大模型落地醫(yī)學場景的時候,我們也發(fā)現了各種各樣的問題。
因為大模型在本質上是世界知識的一個壓縮器,屬于概率化的模型。而醫(yī)學場景是非常嚴肅的,它對可解釋性和精確性的要求極高。但是大模型有時候可能會胡說八道,要怎樣消除這種幻覺問題,讓它真正地能夠落地。比如,用積累的知識圖譜、醫(yī)學知識去強化大模型,降低大模型的幻覺率。這是我們在探索和思考的方向。
整體來說,我覺得大模型的出現,對我們這個領域有非常大的促進作用。它讓我們從以前各種各樣的模型里解脫出來,現在我們只需要專注于“大模型+”就好了,它成為了我們整個技術體系的重要拼圖。
雷峰網:針對大模型落地產生的幻覺問題,現在有什么解決辦法嗎?
鄧立宗:對于這樣的一個對話模型,我們所要解決的問題就是,希望大模型在醫(yī)學場景回答的時候能夠更準確、更可溯源,不容易胡說八道,避免給患者或者醫(yī)生帶來困擾?,F在有一些新的技術,比如在檢索增強方面進行改進,但我們通過實驗發(fā)現,其實還是沒有辦法有效避免幻覺問題的出現。
通過深入分析發(fā)現,要解決幻覺問題,對醫(yī)學知識的精準表征很重要。
舉個例子,像醫(yī)學的同義詞,比如發(fā)熱、發(fā)燒、體溫39度等,這些都指向相同的概念,但其中發(fā)熱有分高熱和低熱,腹痛也分為上腹痛、下腹痛。這些微小的語義差異對于醫(yī)學判斷來說,差之毫厘就失之千里,因為它可能完全導向不同的疾病。所以現在我們正在通過把這些知識規(guī)范化,使大模型能夠大幅度地提升知識檢索的精度。
為了驗證這一說法,我們當時做了一個大海撈針式的實驗。先是一個精準的信息檢索,模擬醫(yī)生翻書看病的過程,也就是檢索咨詢的過程。我們發(fā)現,通過目前這種向量化的表征方式,大模型的檢索質量并不好。而知識規(guī)范化后,其檢索精度就能發(fā)生顯著改變。
所以我覺得,在未來要思考,怎么樣讓大模型這樣的類人智能在類似醫(yī)學的垂直領域成為專家。我們不能夠那些知識通過字符串憑空生成,而是要讓它能基于很精確的知識基礎發(fā)揮作用。不管是在大模型生成之前就進行精準化提高,還是在其生成中間或者之后,我認為都有和精準知識基礎結合的必要。
雷峰網:您團隊所開發(fā)的基于中文電子病歷的表型信息智能結構化與標準化系統(PIAT)是如何解決這一問題的?
鄧立宗:PIAT(Phenotype Information Annotation Tool)系統是我們團隊開發(fā)的一個醫(yī)學文本數據處理的自我進化平臺。它能夠自動精準標注醫(yī)學新知識和醫(yī)學信息,還能夠自動對其進行規(guī)范化表達和統一表征。這個系統不僅能夠識別術語型和數值型表達,還能將它們映射到國外醫(yī)學語言系統,從而實現醫(yī)學文本數據的結構化、標準化。
此外,該系統還有專家?guī)椭鷻C器進行校對。如果計算機識別有誤,專家則予以修正,所累積的錯誤信息可用以更新底層知識庫和模型。通過這種方式,系統就能不斷地提高處理效果,所獲得的數據也能夠為后續(xù)的智慧醫(yī)學應用開發(fā)提供參考。
在實際應用上,PIAT系統此前也用于和北大人民醫(yī)院合作的一次課題中。我們利用PIAT系統對類風濕、關節(jié)炎進行亞型分析,還基于這種結構化、標準化的電子病歷數據做了輔助診斷模型。目前,PIAT系統主要在科研層面與專家合作。我們也希望未來能與醫(yī)學信息化方向的企業(yè)合作,因為他們具有將信息系統打通的能力。
對于PIAT這個平臺,我投入比較多。因為它不是單純的科學研究,我不像以前只是做算法的評估和技術。在開發(fā)過程中,需要協調很多資源,包括IT開發(fā)、算法開發(fā),并做好統籌規(guī)劃,包括涉及到整體的交互設計,需要去研究如何讓這個界面對用戶更友好,還有一些底層的進化設計,我由此收獲了工程化思想的體驗和技能。
雷峰網:現在國內醫(yī)學大數據分析領域現在發(fā)展到什么程度?主要面臨什么樣的挑戰(zhàn)?
鄧立宗:相較于十年前,現在國內醫(yī)學大數據領域進步得特別快。從國家層面提出大數據戰(zhàn)略之后,各種產學研的目光都被吸引過來了,我們這個領域也獲得了很多關注,大家開始在這個賽道上發(fā)力,現在在應用層面算是百花齊放。
但就整體而言,這個領域好像還沒有深入地影響到整個社會層面,還不能夠在深度診療環(huán)節(jié)發(fā)揮核心作用,真正地解放醫(yī)生的工作量。舉個簡單的例子,就像是現在,我們還沒辦法完全信任一個機器醫(yī)生給出的診療結果。
就挑戰(zhàn)而言,我覺得第一,尤其在中文領域,它的整個標準化體系相對來說比較缺乏。國際上有很多成熟的醫(yī)學術語標準,比如SNOMED這樣統一的語言體系。第二就是在發(fā)展算法的時候,我們會面臨訓練數據比較稀缺,導致其泛化能力不夠強的問題。這好比我們在做學術研究的時候,訓練題做得很好,但并不意味著在真正實踐時就能做得好。
后來我們解決這個問題的思路是,用進化式的思想來做。按目前的程度,肯定不可能一下做到完美,做到90分都很難。就像互聯網公司經常提到的“數據飛輪”,先建立一個體系,讓用戶用的時候給你反饋。而這個反饋能夠反映到底層模型的迭代更新上,不管是知識庫的積累還是模型的更新,最后它會變得逐漸進化。抱有這樣的學習系統或者進化系統的理念,才有可能不斷地從60分做到90分。
雷峰網:說到醫(yī)學術語標準化體系,現在我們國內的醫(yī)學術語標準化體系有哪些團隊在做?大概處于什么樣的水平?
鄧立宗:就如我剛剛提到的SNOMED系統,應該是目前世界上最大的醫(yī)學術語標準化體系,它是美國國立圖書館在做。我們中國其實也有不少這類標準化機構,影響大的就是國家衛(wèi)健委所組織的。他們非常重視標準,同時也在陸陸續(xù)續(xù)發(fā)布很多常用的臨床醫(yī)學術語。我還聽說還有個企業(yè)也在做這類標準化業(yè)務,浙江的OMAHA公司,做的也非常好。
整體來說,這種標準化系統的建立和推廣都需要很多力量投入,所以不管是對于學校還是研究組,都是一個龐大的工程。
我們國內的標準化體系發(fā)展起步相對比較晚。當年我的導師蔣太交研究員2013年在國外接觸到i2b2的時候,其實那時候他們已經研究了很多年,也發(fā)了很多的文章,進行了各種應用。而那個時候,國內才剛注意到這樣的概念,才開始對這塊領域有所研究。
我們也有嘗試過在醫(yī)院里實際治理過一些數據,當時發(fā)現挑戰(zhàn)非常大,因為整個流程體系都沒有建立起來。后來通過各方的努力,才慢慢把標準化的鏈條理順。從0到1走完之后,從1到100就相對好一點了。
雷峰網:那您覺得要推進中文醫(yī)學術語標準化系統的建立,應該在哪方面發(fā)力?是從高校對于醫(yī)學生的教育開始,還是從醫(yī)院的實際應用上開始?
鄧立宗:我們確實注意到,有些醫(yī)院也在做結構化、標準化的病歷數據處理,并且做得特別好。但是醫(yī)護人員需要花比較多的時間進行填寫,開發(fā)這個系統本身投入巨大,填寫這項工作還需要很多的投入。
這個病歷系統在醫(yī)院運行多年,要改造肯定會傷筋動骨,包括像醫(yī)學指南或者教科書,也不可能進行結構化處理,不然人就看不懂了。
所以這種情況下,我們覺得未來的很長一段時間,還是非結構化、非標準化會占主導,因為很難去約束人們的使用習慣。就像我們講話一樣,人在講話時就不會在意語言。如果在意語言語法的規(guī)范性,反而會限制正常交流。
我們能夠做的就是,第一個在技術層面上能夠怎么樣去改進、第二個在當前的數據和技術條件下,我們怎么樣能夠最大程度地把醫(yī)學數據發(fā)揮出它應有的價值。
把問題作為導向,可能會比單純地去思考要怎么樣改變現有系統、把這些東西都進行結構化處理會更加有效率且成本更低。
雷峰網:在研究成果轉化應用方面,您還有哪些案例可以分享?
鄧立宗:我們團隊開發(fā)了一款名為“文心醫(yī)考通”的智慧醫(yī)學應用,用來幫助醫(yī)學生怎么樣快速地看書、背書和備考,讓他們能夠更好地去掌握醫(yī)學知識。
當時我們開發(fā)這個應用時,就是希望把“大模型+知識”融入一個具體的場景里,去幫助學生背書、考試。最開始的時候,我們想讓大模型去形成學習計劃類的內容,但是發(fā)現它不可控,學生也因為它不夠精確,吐槽得多。
后來,我們通過各種各樣的技術融合手段,比如知識增強和知識融合,把大模型嵌進去,相當于是一個混合的系統。在適當的地方,知識與大模型互為補充,以這種方式融合在一起后,就能夠完成醫(yī)學生看書背書的一整套流程,如同把一個學霸的思維工具化,提高學習效率。
因為醫(yī)學是一個以知識記憶為主的學科,像內外婦兒這幾本書動輒幾百萬字,比四大名著還要厚。而醫(yī)學生要復習的第一步就是要抓住重點考點,這個應用就可以通過大模型的知識融合技術,基于真題,抓出教科書里的重點。
如果一段文字過長,應用還能將這段文字變成問答型的小卡片整理出來,方便用戶助學助記。另外,在刷題時產生的錯題,應用會基于學習記錄,去為用戶定制更有針對性的強化訓練。用戶可以和大模型進行交互,讓它成為個性化定制的備考助手。
下一步,我們會想,能不能利用這個AI去學習?比如利用歷年的真題出題規(guī)律來押題。這是一個很有挑戰(zhàn)性的任務。但本質上,就是讓大模型去學習規(guī)律,再進行知識分析,融合起來,最后提高押題的命中率。
這個應用推出還不到一年的時間。目前APP的注冊用戶大約是2萬多人。就使用頻率而言,一周內大概有四五千名醫(yī)學生會使用我們的APP。
我們的APP并沒有與高校進行正式合作,主要通過公眾號平臺、小紅書等渠道進行推廣,所以會吸引到各個院校、地區(qū)的醫(yī)學生?,F在整體用戶體驗不錯,至少不會再有關于出現事實性錯誤的吐槽。
雷峰網:您對于這個領域發(fā)展成熟后的理想落地場景是什么樣的?
鄧立宗:我理想中的場景,就像在科幻時代大家所暢想的,大數據最終轉化為醫(yī)學人工智能,在我們生活中發(fā)揮作用。比如變成我們可以非常信任的健康助手。當我們身體出現什么小毛病時,可以通過手機或者別的設備直接線上問診,馬上獲得很準確很靠譜的醫(yī)學信息,先讓自己心里對這個疾病有個底。這個東西暫時肯定是沒法取代醫(yī)生的,特別是無法取代醫(yī)生的核心診療作用,但作為日常的院外咨詢和自我管理還是可以的。
雷峰網(公眾號:雷峰網):您認為,在未來幾年,您所在的領域會有哪些趨勢?
鄧立宗:在我們這個領域,首先問題導向肯定不會變,也就是怎樣做好醫(yī)學人工智能,讓它去幫助臨床場景。
大模型在未來是一個繞不開的基座,但在這個基座之上,我們怎么樣能夠讓大模型和醫(yī)學領域有更好的交叉融合,精準知識這一環(huán)少不掉。但受制于大模型本身的原理,幻覺問題避免不了。如果大模型是用于創(chuàng)作,比如講笑話、講段子,出現這種幻覺問題沒什么所謂??墒菍τ卺t(yī)學這種嚴肅場景,未來肯定要進行精細的打磨和強化。
雷峰網:您現在的團隊大概是有多少人?蘇州系統醫(yī)學研究所有給您和團隊在科研上提供過什么樣的幫助?
鄧立宗:我們團隊的人不多,包括我在內的話是5、6個人。我所在的蘇州系統醫(yī)學研究所,是中國醫(yī)學科學院19個二級單位之一。我覺得我所在的環(huán)境“地利人和”。首先是所里的領導很重視人工智能及轉化方向,尤其重視我們這個方向的醫(yī)學人工智能;同時也會運用一些人脈幫我們進行推廣。其次因為我們的研究需要很多的算力,研究所建有一個高性能平臺,正好能夠滿足我們研究所需的算力資源。
雷峰網:團隊現在的主要合作對象和合作醫(yī)院有哪些?
鄧立宗:我們所合作的醫(yī)院主要還是醫(yī)科院體系內的。我們現在正通過醫(yī)科院的創(chuàng)新工程,在和協和醫(yī)院的專家合作,處理他們的數據,以此發(fā)展一些關于人工智能的輔助診斷,比如涉及早篩早診早治的一些應用。
雷峰網:在近日結束的第二屆生物信息與轉化醫(yī)學大會上您做了什么樣主題的報告?參會后有什么感受和收獲?
鄧立宗:在大會上,我主要圍繞醫(yī)學文本數據處理這個主題做了報告。我當時用了個詞“文心雕龍”,意思是我們做的所有事情,就是為了怎樣抓住文本,文本的核心就是那個“心”,如何把“心”抓出來,然后再用高質量數據去“雕刻”智慧醫(yī)學應用。抓住這個文心是最關鍵的,接下來的雕刻、應用反而沒那么難。
所以我們所有的技術都放在知識的精準表征上,也就是高效的抽取、規(guī)范化和標準化,然后通過算法,建立出體系。
我參加這次大會,主要是想去和不同領域的人進行交流。因為我們這領域是個交叉領域,領域跨度越大,帶來的靈感和碰撞也就越多,交流也更有意義。不然有時候容易陷入閉門造車,反而解決不了問題。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。