0
本文作者: 張利 | 2016-11-29 16:17 |
假如人生能夠重來,你變成了一名醫(yī)生,最近嘗試在線問診。一個病人感冒了,給你發(fā)來這樣幾句話:
“醫(yī)生,您好,在嗎?”
“醫(yī)生,我感冒,體溫現(xiàn)在38度,是不是發(fā)燒?。俊?/p>
“我還流涕、喉嚨癢,精神狀態(tài)也不太好?!?/p>
你每天都要面對無數(shù)條這樣的問題,有時病人說一大堆,其實重點就那幾個字。拿上述消息為例,從醫(yī)學角度來說,你真正需要的只是這幾個關鍵字:”體溫38度“、“流涕”、“喉嚨癢”等。每天沉浸在這口水化、繁冗的語言中,消耗大量的精力,讓你疲憊不堪。不過,你總是很幸運,“做社會真正需要的產(chǎn)品”的Lexigram公司可以幫到你。
不僅在線問診,如今電子記錄的關于健康的數(shù)據(jù)大部分是繁多冗長的,這樣的數(shù)據(jù)不能處理和應用,但如果它變得結構化,分析和應用就變得很容易了,并且有無限想象的空間。
Lexigram是一家硅谷創(chuàng)業(yè)公司,它做這樣一件事:按照客戶的需求,將自然語言轉換成云端健康數(shù)據(jù)。我們都知道,數(shù)據(jù)是信息的載體,將信息轉化為數(shù)據(jù)有助于保存和處理。公司目前獲得200萬美元的種子輪融資。
在這輪種子輪投資中,風暴創(chuàng)投是主要投資者,其他投資者有RTA Ventures和Stanford-StartX基金會。斯坦福大學投資該公司是有原因的,Lexigram公司總部位于加利福尼亞州的雷德伍德市,是從斯坦福生物醫(yī)學信息學研究中心發(fā)展起來的。
逐漸發(fā)展起來的Lexigram公司將自己定位為自然語言處理和機器學習的按需定制軟件服務提供商。
Lexigram公司聲稱,如今,文本、PDF文件和電子傳真已經(jīng)非常普及了,但這也同時意味著電子健康記錄的信息中有80%是非結構化的。這樣的非結構化數(shù)據(jù)對于臨床決策支持系統(tǒng)和其他分析引擎是無意義的。如果能根據(jù)關鍵詞的上下文,將這些自然語言文本結構化,就可以對其進行分析并且應用到合適的地方。能根據(jù)詞語的上下文,準確理解詞語的意思,這也是該公司技術的卓越之處。
以醫(yī)學術語Dermatome為例,它可以表示一種外科手術器械,也表示由單個脊神經(jīng)提供的一塊皮膚區(qū)域,如果單獨提煉出關鍵詞,而不了解出現(xiàn)該詞語的上下文,極有可能會出現(xiàn)意義模糊甚至理解錯誤。而Lexigram公司的軟件就能根據(jù)該詞語的上下文環(huán)境準確理解其意義。公司采用SaaS模式,通過API提供技術,旨在將這項技術帶給沒有配備數(shù)據(jù)科學家的小型醫(yī)療服務提供商。
該公司一個月前推出的第一個API從多個來源提取非結構化數(shù)據(jù),提供了與BioPortal(一個龐大的醫(yī)學本體庫)相關的知識圖表。
早期,大部分醫(yī)療相關數(shù)據(jù)是紙張化的形式存在,隨著強大的數(shù)據(jù)存儲,計算平臺,及移動互聯(lián)網(wǎng)的發(fā)展,醫(yī)療數(shù)據(jù)大量爆發(fā)并快速電子數(shù)字化。據(jù)雷鋒網(wǎng)調查,2011年,單單美國的醫(yī)療健康系統(tǒng)數(shù)據(jù)量就達到了150EB(如果你有一臺1TB硬盤容量的電腦,那1ZB就是大致等于10億臺電腦的容量,遠遠超出了我們一般的想象)。如今,五花八門的可穿戴設備、電子病歷可以采集到人體方方面面的大量的數(shù)據(jù),這些數(shù)據(jù)多格式、多源頭,如果能實現(xiàn)結構化、分析和整合,對醫(yī)療行業(yè)將產(chǎn)生巨大影響。
相關文章:
IBM 在醫(yī)學影像領域發(fā)力,一張照片就能診斷皮膚癌
預告:人工智能+醫(yī)學影像,會擦出怎樣的火花?| 硬創(chuàng)公開課
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。