0
本文作者: 張利 | 2017-07-20 18:07 |
2017年以來,關于人工智能泡沫的議論紛紛攘攘,知乎上一問題“這一波人工智能泡沫將會怎么破滅?”獲廣泛關注,其中,稟臨科技聯合創(chuàng)始人PENG Bo的觀點得最高贊同票,他認為,“人工智能有些危險,因為現在變現似乎是個難題?!薄澳壳翱磥恚珹I可能并不足以支撐一個獨立的公司,它更適合作為其它公司的一個部門,或被其它公司收購?!?br/>
許多智能影像一線從業(yè)者可能會對其觀點深表贊同。科大訊飛智慧醫(yī)療事業(yè)部醫(yī)療影像產品負責人馬文君告訴雷鋒網,“如今的智能影像很像前幾年的互聯網醫(yī)療,大家一窩蜂進來了,但下一步怎么做,是個問題?!眳R醫(yī)慧影梁恩銓認為,“整體來講,智能影像診斷真正深入到臨床診斷的很少,目前,業(yè)內嘗試與醫(yī)生合作做科研或提高效率方面嘗試,但要真正提高診斷率,目前還有很大差距?!?/p>
動輒可以聽到“AI取代醫(yī)生”“AI的準確率超過醫(yī)生”的言論,同時“理想很美好,現實很骨感”的感慨頻頻傳來,理想的豪言壯語隨處可見,那現實是什么呢?
有人說,21世紀是數據為王的時代;有人將算法比作發(fā)動機,數據比作石油;有人則強調行業(yè)數據、專家資源和核心技術是打造智能影像缺一不可的三要素。無論怎樣強調數據的重要性都不為過,我們且以影像數據為徑,智能影像公司的運營為緯,一窺智能影像公司的真實日常。
盡管我國存在第三方影像中心,但絕大多數的醫(yī)療影像數據來源于醫(yī)院。據悉,大的三甲醫(yī)院一年產生的影像數據在10T以上。宜遠智能CEO吳博稱,“單個醫(yī)院的影像數據存量就很大,每天數百例新增也很常見?!?/p>
在醫(yī)療信息系統(tǒng)中,PACS系統(tǒng)負責醫(yī)療影像采集、數據傳輸存儲以及影像分析、處理,并且不同的PACS系統(tǒng)之間,能以以DICOM國際標準方式對接。
總體來說,醫(yī)院影像數據多且大都標準化,便于機器閱讀,為此,智能醫(yī)療影像被業(yè)內人認為將率先實現商業(yè)化落地。
上海市兒童醫(yī)院影像科主任楊秀軍曾表示,“很多醫(yī)學影像領域特別適合人工智能/圖像識別技術,國內外有很多廠商從事這方面,也做出一些成果?!?/p>
吳博告訴雷鋒網,對于AI ,影像數據本身具有標準化的優(yōu)勢。不過,數據異常也容易碰到。“以CT為例,有的病人不是躺著而是趴著掃描;有的不是頭先進去而是腳先進去;CT長寬512像素或者768像素的差別,不同排數機器的層厚差異以及薄層重構算法,都會影響清晰度?!彼a充道,“處理流程只要充分考慮和兼容這些變化情況,原始數據的可用比例還是非常高的?!?/p>
對于一個AI系統(tǒng)而言,數據多多益善是有前置條件的,在保證喂養(yǎng)數據質量的情況下,增加數量才有意義。而判斷影像數據質量,主要取決于AI公司所打造智能診斷產品的臨床目的。除此之外,對于智能影像診斷而言,影像數據需要關聯更準確的診斷和后期結果關聯,否則垃圾進,垃圾出。
南方醫(yī)科大學副教授劉再毅曾表示,“我們數據多得不得了,我們影像科每天產生很多數據,但是有多少數據可以用?1%都不到,其中有大量錯誤信息?!彼a充道,“數據規(guī)范的問題沒有辦法管控,臨床信息經常有誤?!?/p>
拿現在很火的肺結節(jié)智能診斷為例,對于AI公司來說,有肺結節(jié)的影像才是有價值的,“在產生的影像數據中,只有10%或20%的病人有問題,即便如此,并不是所有有病灶的影像數據都能拿來用?!绷憾縻尫Q。而在醫(yī)院內部,醫(yī)學影像系統(tǒng)和診斷報告是兩個獨立的系統(tǒng),兩者并無關聯?!坝脭祿柧欰I很重要的一點是:需要系統(tǒng)判斷一個影像是否有結節(jié),是否有病灶。而醫(yī)院每天拍出來幾百影像,并沒有標出來哪里有結節(jié),對于AI公司來說,這就是沒有價值的數據。”梁恩銓告訴雷鋒網。
影像數據是醫(yī)院的,智能影像公司如何獲取呢?
醫(yī)療數據是一種資源,意味著它有價值,想獲取有價值的東西最簡單的邏輯就是“買買買”,這正是財大氣粗的IBM的戰(zhàn)略。在2014年相繼收購了大數據醫(yī)療保健分析提供商Phytel與Explorys后,2015年,以10億美元收購了醫(yī)學成像及臨床系統(tǒng)供應商Merge Healthcare,后者坐擁有8500家客戶,其中包括美國聯邦政府和州政府機構、雇主、醫(yī)保、醫(yī)院等,以及3億病人數據。
在我國,三甲醫(yī)院擁有絕大多數影像數據,但影像數據不出院是必須守住的紅線。為此,AI公司與醫(yī)院尋求“合作”就成了一種可能的路徑。一般來說,AI公司會選擇與醫(yī)院合作開發(fā),一方面得到脫敏的數據和行業(yè)專家,一方面收獲了產品打磨的場景,至于合作模式,則各有特色。
一般來說,智能影像公司官網上的合作醫(yī)院被視為彰顯自身實力的背書。雷鋒網從公司官網上了解到,推想科技稱其與北京協(xié)和醫(yī)院、同濟醫(yī)院、長海長征醫(yī)院等5家三甲醫(yī)院達成合作;科大訊飛先后與北京大學口腔醫(yī)院、上海交通大學附屬第六醫(yī)院南院等多家醫(yī)院合作;依圖科技與浙江省人民醫(yī)院合作。
劉再毅曾表示,非常希望與好的AI公司合作,以臨床目的為中心共享研究成果?!拔覀兣R床數據最寶貴,光有技術沒有臨床數據,很多都是紙上談兵?!?/p>
“我們現在不一定要獲取數據,而是想使用數據,我們在和醫(yī)生的合作中發(fā)現,他們對于數據共享持謹慎樂觀和開放的態(tài)度,我們提供深度學習的經驗,和對于數據標注、數據整理和數據隱私保護的方法論,結合醫(yī)療數據和專家只是,用科研服務、課題服務的形式結合起來?!皡遣┓Q道,宜遠智能切入醫(yī)療影像領域,目前不以工具見長,而選擇以貼身服務來做,同時,醫(yī)療影像數據敏感,處理算法要能分布式地下沉到數據所在位置,而不是一味期望數據統(tǒng)一歸集到統(tǒng)一平臺。
匯醫(yī)慧影CEO柴象飛稱,他們?yōu)轫敿夅t(yī)生提供工具、方法合作共贏,而對于偏基層的醫(yī)院,基于提供的IT工具之上,提供一些更加智能化、自動化的工具,同時不斷收集數據,進行算法模型的迭代。這與其規(guī)劃的商業(yè)模式是一致的,提高效率、降低誤診率的篩查類影像系統(tǒng),短期內醫(yī)院可以買單。至于與頂級醫(yī)院的合作模式,公司高級市場經理梁恩銓披露道,與很多醫(yī)院的合作是以科研合作的形式,最后的成果雙方都有署名,“產品歸我們,數據是醫(yī)院的?!?/p>
一如機器學習AI建模的流水線,醫(yī)療影像數據處理過程也要經歷數據標注、清洗、切割,隨后是建模、調參等。
在處理影像數據的技術問題上,據吳博介紹,醫(yī)療影像數據刻畫的是體內臟器,與肉眼容易識別花鳥蟲魚人臉等常規(guī)圖片,成像原理與視覺特征都不相同,深度學習模型尤其需要深度改造。
但醫(yī)療影像數據處理的特殊之處在于數據標注耗費時間更長、門檻更高,“要湊齊多名資深醫(yī)生對數據進行比下診斷報告還要細致的標注,難度、進度和成本都很高?!眳遣┓Q。無怪乎,科大訊飛智慧醫(yī)療事業(yè)部總經理陶曉東稱,行業(yè)數據、專家資源和核心技術是打造智能影像缺一不可的三要素,大多數AI公司與醫(yī)院合作開發(fā),由院內專家進行標注。
拿匯醫(yī)慧影為例,醫(yī)生使用其產品的同時就能對影像數據進行標注,產生他們需要的有效數據?!搬t(yī)生在看片的過程中,如果發(fā)現有病灶的影像,用我們的系統(tǒng)在病灶上直接標記。除此之外,系統(tǒng)中還集成了病理和病理數據,綜合這些信息才能判斷是否有癌癥。”梁恩銓告訴雷鋒網。而這引發(fā)了一個現實問題:數據產生速度很小。
在醫(yī)生的診斷中,影像僅是一個參考信息,最終還要參考病理診斷等信息進行確診,所以對于打造一個智能診斷系統(tǒng)來說,很多數據的集合才是有效的數據。對此,梁恩銓介紹道,AI公司需要盡可能多地打通不同的系統(tǒng),把病人的所有相關信息整合在一起,這其實是比較難的。匯醫(yī)慧影單獨開發(fā)了一個數據平臺,其中集成了數據清洗功能,把病理、病例和影像數據拿過來后,還要整合清洗。“醫(yī)療數據獲取難,標注工作量大,我們自嘲所謂人工智能,只有人工沒有智能。相對于機器視覺的其他領域,醫(yī)學上走得還是要慢一些。”
智能影像診斷系統(tǒng)準確率在95%以上,超過人類醫(yī)生的消息屢見不鮮,但其應用情況怎樣呢?
劉再毅曾表示,許多AI公司在訓練其智能系統(tǒng)時沒有甄別錯誤信息,導致真正投入臨床時,準確率只有50%,“這就沒有任何價值?!?/p>
梁恩銓稱,“若想用AI提升診斷率,目前為止還有很大差距?!彼硎?,AI診斷結果是個概率的問題,只要不能達到100%的準確率,公司難以為那1%負責。除此之外,很多公司在肺結節(jié)診斷上做得很好,但對于一些癌癥亞型,醫(yī)生本身就很難判斷,遑論AI了?!翱傮w來說,真正深入臨床流程的AI很少,現階段,AI公司大都在幫醫(yī)生做科研或在提高診斷效率方面嘗試。”
將頂級專家的診斷能力固化下來,提供給基層醫(yī)院,是許多智能影像公司勾勒的美好藍圖??拼笥嶏w智慧醫(yī)療事業(yè)部總經理陶曉東曾說道,智能影像診斷系統(tǒng),對三甲醫(yī)院的頂級醫(yī)生是錦上添花的事;而基層放射科醫(yī)生,每天只看四個片子,經驗比較少,這就是雪中送炭的事。杭州認知科技副總經理王泰峰稱,IBM Watson能提升基層醫(yī)生的決策效率。
但實踐起來同樣遇到尷尬。人工智能是基于云計算的,數據放在云端,基層醫(yī)院的信息化程度不夠,沒有大數據,怎么用人工智能?除此之外,大多數醫(yī)院使用的是局域網系統(tǒng),沒法連接外網,數據也無法走上云端。
怎樣說服醫(yī)院同意把數據放在云端,也是一個棘手的問題。“如何充分保證數據隱私,這是很難突破的地方?!绷憾縻尭嬖V雷鋒網,“但相對于其他數據,影像數據含有的隱私信息較少,還是比較好溝通的?!?/p>
智能影像:風口已至,還是初露端倪?
有人說,投資人判斷的不是行業(yè)趨勢,而是時間點,判斷機會在哪個時間點才是關鍵。如今,AI+醫(yī)療影像被認為是率先實現商業(yè)化落地的領域,這意味著風口已至,還是初露端倪?
劉再毅告訴雷鋒網,“如果真正去做醫(yī)學影像研究,會發(fā)現其中的陷阱、難度很多。我覺得這里面更多是做學術研究,真正落地到臨床上是很難的,路還有很長。”上海市兒童醫(yī)院影像科主任楊秀軍表示,“有的智能診斷產品針對某一種病,比如開發(fā)出一種軟件能更簡便、更快捷地診斷皮膚癌,但絕大多數的病變不是那么簡單的?!?/p>
梁恩銓認為,絕大多數智能診斷產品沒有Follow臨床工作流程,拿肺結節(jié)診斷來說,僅診斷出肺結節(jié)沒有問題,不能確定是否有其他疾病,而誤診或漏診的后果是非常嚴重的。
飛利浦大中華區(qū)臨床科學部高級總監(jiān)周振宇對此深以為然。此前,他出席雷鋒網承辦的CCF-GAIR大會上曾表示,“我今天來到這個會場,想看到更多人工智能在醫(yī)學方面的應用,但是我們看到還是和十幾年前一樣的,我們得到的結果還是停留在純粹數據驅動的結果上,100個肺結節(jié)找到多少百分比,這對于臨床知識來說沒有太大的價值?!彼f道,“另外,從疾病和臟器來看,目前還是僅限于皮膚病、肺結節(jié)等相對容易做的器官。更多的人類疾病,中國人比較重要的肝臟、腎臟、乳腺等方面,其實各個廠家的涉足點都是比較緩慢的?!?/p>
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。