0
“作為一個(gè)研究人工智能二十多年,同時(shí)在醫(yī)學(xué)影像處理方向耕耘八年的過來人。我認(rèn)為現(xiàn)階段醫(yī)療人工智存在的一大挑戰(zhàn)是,從業(yè)者們既沒捋順流程,也沒想清模式。單純覺得我有AI技術(shù),有幾家合作醫(yī)院,就能大干一場(chǎng)?,F(xiàn)在風(fēng)口的確很火,很多基金也愿意投錢。但醫(yī)療與其他行業(yè)不同,它是一個(gè)文火慢燉的過程,不見得那么容易?!?/p>
在與微軟亞洲研究院副院長(zhǎng)張益肇博士對(duì)話的一個(gè)多小時(shí)里,他不斷在強(qiáng)調(diào)人工智能在醫(yī)療領(lǐng)域的長(zhǎng)期價(jià)值,但也有存在一些短期的擔(dān)憂。
張益肇博士現(xiàn)任微軟亞洲研究院副院長(zhǎng),負(fù)責(zé)技術(shù)戰(zhàn)略部。他于1999年7月加盟微軟亞洲研究院,從事語音方面的研究工作,曾任微軟亞洲工程院副院長(zhǎng),是2003年工程院的創(chuàng)建者之一。
微軟之前,張益肇博士是全球最大語音識(shí)別公司Nuance Communications研究部創(chuàng)始人之一。張博士畢業(yè)于麻省理工學(xué)院,獲電氣工程和計(jì)算機(jī)科學(xué)學(xué)士、碩士和博士學(xué)位。
以下是雷鋒網(wǎng)與張益肇博士的談話內(nèi)容:
雷鋒網(wǎng):您怎么看待今年醫(yī)學(xué)影像+AI大熱的現(xiàn)象?
當(dāng)然是好事。
我經(jīng)常談一個(gè)觀點(diǎn),人類如果想要健健康康活到100歲,技術(shù),將扮演著非常重要的角色。近幾年我也看到不少計(jì)算機(jī)界精英投入大量人力財(cái)力到醫(yī)療領(lǐng)域,如此大規(guī)模的醫(yī)工交叉大潮讓人非常激動(dòng)人心。
這里我也不得不提醒大家,在醫(yī)療領(lǐng)域,無論是創(chuàng)業(yè)者也好,投資人也罷,必須要有愿意長(zhǎng)期投入和投資的心態(tài),切勿焦躁,保持平常心。
我個(gè)人研究人工智能二十幾年,其中八年時(shí)間在專攻醫(yī)療,我不覺得這個(gè)領(lǐng)域很容易出成果。
醫(yī)學(xué)技術(shù)的落地,不僅要千辛萬苦找對(duì)場(chǎng)景,還要說服政策制定者、監(jiān)管部門、醫(yī)院采購(gòu)者、科室主任、臨床醫(yī)生、病人等無數(shù)當(dāng)事人證明技術(shù)的有效性、安全性和可行性。最后,你還要明白你的產(chǎn)品誰來買單。
現(xiàn)階段行業(yè)存在的一個(gè)挑戰(zhàn)在于,很多時(shí)候,大家這三大關(guān)都沒有想清楚。單純覺得我有AI技術(shù),找到一些合作對(duì)象,就能大干一場(chǎng)了。
現(xiàn)在醫(yī)療+AI的確很火,很多創(chuàng)投也愿意投這個(gè)錢。但從長(zhǎng)久來看,不見得那么容易,也沒那么快,大家一定要沉下心多調(diào)研、多思考、多學(xué)習(xí)。
美國(guó)很多新藥研發(fā)公司可以獲得大量的融資,有些甚至不盈利也能夠上市。大家期待它所研發(fā)的新藥品最終能通過FDA,并且在藥效達(dá)到預(yù)期后,公司市值能夠上漲5倍、10倍甚至更多。當(dāng)然,面臨一文不值的風(fēng)險(xiǎn)也非常巨大。
大家在投資時(shí)明知道風(fēng)險(xiǎn)很大,明知短時(shí)間內(nèi)賬面并不可觀,但仍舊愿意投資、愿意長(zhǎng)期等待,因?yàn)樗麄兡軌蛘嬲斫怙L(fēng)險(xiǎn)。
國(guó)內(nèi)醫(yī)療人工智能大潮中,我最擔(dān)心的是國(guó)內(nèi)醫(yī)療人工智能創(chuàng)業(yè)者和投資者并沒有真正理解風(fēng)險(xiǎn),就開始投入大量資源在其中,這很可怕。
雷鋒網(wǎng):微軟目前在醫(yī)療AI方向有哪些研究?
微軟其實(shí)在醫(yī)療領(lǐng)域投入很多,在世界各地的研究院里有不少同事在做相關(guān)方面的工作。
醫(yī)學(xué)影像處理這塊,微軟亞洲研究院和微軟劍橋研究院都有在做。不過微軟亞洲研究院聚焦在病理切片,英國(guó)劍橋研究院專攻CT。
我們微軟亞洲研究院近幾年開始鉆研腦腫瘤病理切片的識(shí)別和判斷,通過細(xì)胞的形態(tài)、大小、結(jié)構(gòu)等,去輔助分析和判斷病人所處的癌癥階段。近兩年在該領(lǐng)域我們基于“神經(jīng)網(wǎng)絡(luò)+深度學(xué)習(xí)”的模式取得了兩大突破:
首先,實(shí)現(xiàn)了對(duì)大尺寸病理切片的圖片處理。通常圖片的尺寸為224*224像素,但腦腫瘤病理切片的尺寸卻達(dá)到了20萬*20萬、甚至40萬*40萬像素。對(duì)于大尺寸病理切片影像的識(shí)別系統(tǒng),我們沒有沿用業(yè)內(nèi)常用的數(shù)字醫(yī)學(xué)圖像數(shù)據(jù)庫(kù),反而在ImageNet的基礎(chǔ)之上利用盡可能多的圖片,通過自己搭建的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法不斷進(jìn)行大量訓(xùn)練而成,最終實(shí)現(xiàn)了對(duì)大尺寸病理切片的圖片處理。
對(duì)大尺寸病理切片圖片通過神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)算法進(jìn)行處理的流程
其次,在解決了細(xì)胞層面的圖像識(shí)別之后,又實(shí)現(xiàn)了對(duì)病變腺體的識(shí)別。
對(duì)病變腺體的識(shí)別,主要是基于醫(yī)學(xué)角度三個(gè)可以衡量癌細(xì)胞擴(kuò)散程度和預(yù)后能力的指標(biāo):細(xì)胞的分化能力,腺體的狀況和有絲分裂水平。我們針對(duì)這三個(gè)角度,通過多渠道(Multi-Channel)的數(shù)據(jù)采集和分析,希望在未來幫助醫(yī)生實(shí)現(xiàn)對(duì)病人術(shù)后、康復(fù)水平乃至復(fù)發(fā)的可能性做出預(yù)估和判斷。
腺體圖像經(jīng)過計(jì)算機(jī)處理后被抽象成不同的結(jié)構(gòu),以便于計(jì)算機(jī)進(jìn)一步識(shí)別與判斷
不同種類的惡性腫瘤切片經(jīng)過算法處理后進(jìn)行分類
該研究結(jié)果也可以擴(kuò)展至其他疾病的二維醫(yī)學(xué)影像的識(shí)別和判斷,例如我們正在研究的腸癌等。此外,我們還在研究肝腫瘤患者的CT三維影像。
除了醫(yī)學(xué)圖像外,我們?cè)卺t(yī)學(xué)文獻(xiàn)的處理和理解上也有所研究。
全球平均每年有將近50多萬篇醫(yī)學(xué)研究文獻(xiàn)發(fā)表,這種情況下,醫(yī)生在查詢所需文獻(xiàn)時(shí),不可能覆蓋到位。
我們微軟亞洲研究院具體是如何解決這一問題的呢?比如醫(yī)生在尋找遺傳基因的研究與哪幾篇文章相關(guān),我們會(huì)通過算法自動(dòng)對(duì)相關(guān)文獻(xiàn)進(jìn)行關(guān)聯(lián)。另外也在做不少與醫(yī)學(xué)相關(guān)的自然語言處理,比如不同病人想要問相關(guān)的醫(yī)療問題,可能有很多不同的方法來表達(dá)。而在話語里又有像阿莫西林等藥物在不同醫(yī)院里有幾十種、上百種叫法。
我們的工作就是用AI技術(shù)讓這些話語和詞匯的不同表達(dá),轉(zhuǎn)換為機(jī)器可以理解的統(tǒng)一信號(hào)。最終以AI系統(tǒng)的形態(tài)解答各種醫(yī)學(xué)問題。
雷鋒網(wǎng):團(tuán)隊(duì)研究醫(yī)學(xué)影像處理這8年間,相比于過去有哪些大的進(jìn)步?
深度學(xué)習(xí)算是一個(gè)比較大的跨越,坦白講,2013、2014年前后,深度學(xué)習(xí)開始被應(yīng)用到醫(yī)學(xué)影像分析當(dāng)中。按照傳統(tǒng)方式,很多醫(yī)學(xué)影像分析題目要做特征提取,這個(gè)特征甚至可能是細(xì)胞,過程較為復(fù)雜。
而深度學(xué)習(xí)可以自己學(xué)習(xí)并提取特征,節(jié)省了很多設(shè)計(jì)特征的時(shí)間。
其次就是遷移學(xué)習(xí),我們?cè)贗mageNet上訓(xùn)練出一個(gè)深度學(xué)習(xí)模型,以它作為基礎(chǔ)做醫(yī)學(xué)影像分析,雖然ImageNet上的圖像為自然圖片,但從中訓(xùn)練出來的特征提取能力,對(duì)醫(yī)學(xué)影像也相當(dāng)有用。
雷鋒網(wǎng):這個(gè)過程中您發(fā)現(xiàn)了哪些新的思路,并走過哪些彎路?
2012年我們團(tuán)隊(duì)開始用弱監(jiān)督學(xué)習(xí)來更好地使用數(shù)據(jù),這是一個(gè)對(duì)我們意義很大的方向。
大家也都知道醫(yī)生的時(shí)間非常寶貴,如果你沒辦法盡量節(jié)省他們的精力與時(shí)間,相比而言,你獲得數(shù)據(jù)的能力會(huì)更弱。用更優(yōu)秀的算法去填部分?jǐn)?shù)據(jù)的坑,這是一個(gè)很好的思路,而不是單純想著從醫(yī)院拿更多數(shù)據(jù)。
弱監(jiān)督學(xué)習(xí)在醫(yī)學(xué)影像中的應(yīng)用會(huì)是一個(gè)好的開始,也是一個(gè)值得長(zhǎng)期投入的方向。
找到好的場(chǎng)景,再找到好的數(shù)據(jù)庫(kù),其實(shí)比大家想的要耗時(shí)。很多時(shí)候,找到一個(gè)優(yōu)質(zhì)數(shù)據(jù)庫(kù)外,還要找到一個(gè)既懂技術(shù),又能幫忙做標(biāo)注的醫(yī)生。
對(duì)于我們走過的彎路,更多是認(rèn)知和思維上的彎路吧:過早覺得我們已較好地解決了醫(yī)學(xué)問題。
包括我們?cè)趦?nèi)的很多公司用Kaggel數(shù)據(jù)做基礎(chǔ)訓(xùn)練,但這種研究?jī)H是長(zhǎng)期研究的起步,而且這個(gè)起步往往并不見得特別有用,所以大家應(yīng)理性看待從Kaggle中訓(xùn)練出的結(jié)果。
在醫(yī)療+AI方向,大家不要迷信短時(shí)間內(nèi)得到的數(shù)字結(jié)果,一定要做好長(zhǎng)期投入的準(zhǔn)備。
語音識(shí)別從1960年代就開始萌芽,直到1970也還是所謂的非連續(xù)性語音識(shí)別,離絕大部分使用場(chǎng)景很遠(yuǎn)。盡管語音識(shí)別在今天已經(jīng)解決得很好,但在復(fù)雜環(huán)境和語境下的識(shí)別率仍舊不是特別理想。
人工智能在醫(yī)學(xué)中的應(yīng)用亦是如此。
雷鋒網(wǎng):像您剛提到的深度學(xué)習(xí)和遷移學(xué)習(xí)讓醫(yī)療人工智能大跨步發(fā)展,但這兩者的不可解釋性使得很多醫(yī)學(xué)問題無法詢證,這個(gè)難題目前微軟亞洲研究院有沒有一個(gè)標(biāo)準(zhǔn)對(duì)其進(jìn)行參考?
深度學(xué)習(xí)的可解釋性確實(shí)是一個(gè)很熱的題目。
算法可解釋性通??梢杂每催吔绾皖伾卣鱽砼袛嗾?fù),偏統(tǒng)計(jì)學(xué)方法,但也很難說出具體原因。
其實(shí)很多醫(yī)學(xué)任務(wù)也是靠統(tǒng)計(jì)來做。之前有醫(yī)生提到說,假如一個(gè)腫瘤小于5厘米和大于5厘米該各應(yīng)怎么判斷。大家提到“5厘米”這個(gè)單位也憑經(jīng)驗(yàn)去描述,為什么是5,而不是5.1或4.9。
我的意思是,醫(yī)學(xué)本身很多判斷是依照經(jīng)驗(yàn)來做,這些經(jīng)驗(yàn)里,也存在一些無法解釋的因素,因此不能完全否定“不可解釋性”。
很多AI功能尤其像靠深度學(xué)習(xí)訓(xùn)練出來的系統(tǒng),除了給你一個(gè)明確的判斷外,還會(huì)生成百分比形式的“程度值”做參考,這個(gè)程度值體現(xiàn)機(jī)器對(duì)判斷的“自信”與否。
現(xiàn)階段我們希望只做輔助醫(yī)生的工具,最后的結(jié)論還是需要醫(yī)生自己判斷。
任何系統(tǒng)都多多少少會(huì)產(chǎn)生一定的誤差和偏差,哪怕簡(jiǎn)單的血壓儀也可能存在偏差,所以最終還需讓醫(yī)生把所有信號(hào)整合起來判斷機(jī)器給出的結(jié)果是否合理。
雷鋒網(wǎng):也確實(shí)因?yàn)樯疃葘W(xué)習(xí)存在的弊病,最近Hinton提出要“拋棄”反向傳播,您怎么看待這件事的?
反向傳播也有幾十年的歷史了,這期間陸續(xù)有人提出不同的想法、不同的算法。
人的學(xué)習(xí)能力很強(qiáng),無需很多數(shù)據(jù),往往通過一兩個(gè)樣本就能學(xué)習(xí)、分類,但現(xiàn)在機(jī)器沒有辦法靠少量不同樣本進(jìn)行驅(qū)動(dòng)。
所以人工智能在算法層面可提升的空間很大,所以要有新的學(xué)習(xí)方法來做,尤其像可供使用數(shù)據(jù)量較小的醫(yī)療領(lǐng)域。
雷鋒網(wǎng):相比于醫(yī)學(xué)影像處理,語音電子病歷錄入服務(wù)各方面的條件更為成熟,Nuance和訊飛都已在醫(yī)院落地,微軟亞洲研究院目前有沒有切入這個(gè)方向?
推出這類產(chǎn)品,需要做的事情就比較專比較細(xì)了。
我加入微軟之前在Nuance Communications做語音識(shí)別,你提到的語音電子病歷錄入是Nuance的主要業(yè)務(wù)之一。
但國(guó)內(nèi)很多人可能有所不知,Nuance的業(yè)務(wù)里,語音轉(zhuǎn)錄系統(tǒng)只是一方面,另一方面Nuance還需雇人把機(jī)器轉(zhuǎn)好的文字,進(jìn)行人工整理。所以Nuance提供的是一整套服務(wù),而非單一的語音識(shí)別這一環(huán)節(jié)的產(chǎn)品。與此同時(shí),Nuance針對(duì)不同場(chǎng)景、不同科室做不同的產(chǎn)品優(yōu)化和服務(wù)。
所以如果做這類產(chǎn)品,研究之外的任務(wù)和工作相對(duì)來說會(huì)比較多。
雷鋒網(wǎng):您此前一直研究語音,是什么原因致使您開始做跨度很大的醫(yī)學(xué)影像?
從研究角度講,無論是語音還是影像,兩者之間有很多相通點(diǎn),都是基于機(jī)器學(xué)習(xí)作為發(fā)動(dòng)機(jī),數(shù)據(jù)作為汽油來建模、判斷。
當(dāng)然了,醫(yī)學(xué)影像也確實(shí)有很多專業(yè)知識(shí)需要學(xué)習(xí),更具挑戰(zhàn)性,同時(shí)也更有意思。因?yàn)槟阈枰芏嗖煌I(lǐng)域的人一起學(xué)習(xí),這個(gè)過程非常有意思。
另一方面,那時(shí)候我母親得了癌癥,我當(dāng)時(shí)心想醫(yī)學(xué)如果借助計(jì)算機(jī)技術(shù)一定會(huì)找到更多新的方法和新的應(yīng)用場(chǎng)景。作為普通民眾,我覺得這對(duì)身邊人,對(duì)社會(huì)非常有意義。作為研究人員,這個(gè)研究方向會(huì)非常有前景。
雷鋒網(wǎng):微軟亞洲研究院的醫(yī)學(xué)影像數(shù)據(jù)來自哪些地方?與哪些機(jī)構(gòu)有合作?
主要還是來自于公開數(shù)據(jù)集,首先這類公開數(shù)據(jù)標(biāo)注經(jīng)過很多人審核。其次,你要發(fā)表結(jié)果的話,同一類數(shù)據(jù)集上大家才有可比性。
在某些特定領(lǐng)域,我們與浙江大學(xué)前副校長(zhǎng)來茂德團(tuán)隊(duì)合作探索病理切片分析,來校長(zhǎng)在大腸癌方向有著很多積淀。大腸之外也有研究肺癌等國(guó)內(nèi)常見的幾個(gè)方向。除此之外,生活習(xí)慣和飲食健康也所有探究。
雷鋒網(wǎng):提到肺癌等國(guó)內(nèi)常見的方向,上次我跟訊飛陶曉東博士交流時(shí),他講到其實(shí)目前選擇做眼底、肺結(jié)節(jié)這類常見的、公開數(shù)據(jù)較多的領(lǐng)域,可以反映出大家創(chuàng)新力不足的現(xiàn)狀。微軟亞洲研究院在布局常見的方向之外,還在探索哪些挑戰(zhàn)性特別大的方向?
我們現(xiàn)在做病理切片的一大原因,就是因?yàn)椴±砬衅治鰳O具挑戰(zhàn)性。
首先病理切片單個(gè)數(shù)據(jù)很大,一張圖最大可達(dá)40萬×40萬像素,面對(duì)這么大的數(shù)據(jù)該怎么分析?要怎么才能把這個(gè)系統(tǒng)應(yīng)用得很好?這是很有趣的問題。
如此大的圖像,單是傳輸就已是一項(xiàng)很大的挑戰(zhàn),在此基礎(chǔ)上還進(jìn)行分析,計(jì)算量會(huì)非常巨大。
好在微軟亞洲研究院也有很多同事是系統(tǒng)方面的專家,研究高速運(yùn)算,基于此,我們可以通過整合研究院不同團(tuán)隊(duì)的專長(zhǎng)來做這件事。
雷鋒網(wǎng):這個(gè)過程當(dāng)中微軟亞洲研究院各個(gè)技術(shù)部門之間如何打配合?
各部門之間的合作其實(shí)蠻多。
2015年我們視覺計(jì)算組發(fā)明的ResNet大家都很熟悉了,它就是一個(gè)特別好的圖像特征提取方法,有了它之后,我們就在考慮如何用ResNet提取醫(yī)學(xué)影像特征。
微軟亞洲研究院已經(jīng)在做一些通過看一張圖然后對(duì)它進(jìn)行標(biāo)注的技術(shù),當(dāng)機(jī)器可以給一張圖自動(dòng)標(biāo)注的話,這就表明機(jī)器在一定程度上理解這張圖,不僅知道里面有哪些物體,同時(shí)也知道里面物體及場(chǎng)景之間的關(guān)系。
這屬于更高層次的理解。
回到肺結(jié)節(jié)上,通常情況我們只是去判斷某塊小區(qū)域是不是肺結(jié)節(jié)。其實(shí)有時(shí)候通過分析肺本身以及人體的構(gòu)造,也可以得出其他有用信息,而這些肺結(jié)節(jié)之外的信息,往往對(duì)診斷起到非常重要的作用。
目前大部分系統(tǒng)并沒有有效利用到這些“其他”信息,但影像科醫(yī)生與機(jī)器不同,他們?cè)谧x片時(shí),肯定會(huì)對(duì)這些信息有宏觀的認(rèn)知。所以我也經(jīng)常在講,人工看一張圖片時(shí),他不會(huì)只看一小部分,而是會(huì)形成一個(gè)整體的認(rèn)知去判斷。
所以,無論是一張普通海景照片中船和海的關(guān)系,還是醫(yī)學(xué)影像中肺結(jié)節(jié)和其他組織信息的關(guān)聯(lián)度,很多方面是相通的。我們希望把對(duì)常規(guī)圖像的認(rèn)知和理解,遷移到醫(yī)學(xué)影像中,這是一項(xiàng)非常重要的工作。
雷鋒網(wǎng):如果還要判斷其他組織信息,那么在對(duì)眾多非目標(biāo)對(duì)象的分割上,是否有產(chǎn)生更多更復(fù)雜的新問題?
確實(shí)如此,我再舉個(gè)例子,正常人的心臟在左邊,因此做內(nèi)臟分割時(shí),會(huì)有這樣的預(yù)知。但是也不排除少數(shù)人心臟長(zhǎng)在右邊的可能性,類似這種情況容易讓機(jī)器產(chǎn)生誤判和混淆,因此需要有更高層面的的知識(shí)理解。
但總體而言,現(xiàn)在在做的機(jī)器學(xué)習(xí)研究,無論是檢測(cè)、識(shí)別還是分割也罷,很多地方都是相通的。
雷鋒網(wǎng):除了影像和語音語義之外,微軟還有哪些醫(yī)療人工智能方面的研究?
我們?cè)诖髷?shù)據(jù)處理上探索也非常多。
負(fù)責(zé)管理微軟全球研究院的Eric Horvitz,他既是醫(yī)學(xué)博士,也是哲學(xué)博士。Eric Horvitz做了很多非常有趣的研究,通過用戶在互聯(lián)網(wǎng)上的搜索詞,來判斷你是否有一些疾病和癥狀。
雷鋒網(wǎng):那么這個(gè)研究的最終形態(tài)是以一個(gè)什么樣的終端功能或者服務(wù)去呈現(xiàn)?
我們有一項(xiàng)服務(wù)叫微軟Health,就是用一些功能,來提供insight,這些insight一方面給用戶看,一方面提供給醫(yī)生參考。
比如通過系統(tǒng)收集到很多人的血糖、血壓甚至睡眠和運(yùn)動(dòng)量數(shù)據(jù)后,存儲(chǔ)起來進(jìn)行長(zhǎng)期的追蹤和分析?;诖?,把這些信息全部整合起來后更好地幫助醫(yī)生、幫助用戶自身。
我們也與美國(guó)匹斯堡大學(xué)醫(yī)學(xué)中心UPMC合作,探討用AI挖掘有效健康信息。
一方面我們?cè)谧龊芏嗷A(chǔ)研究,另外一方面,微軟也希望尋找更多合作伙伴,探討可以著陸的場(chǎng)景。
雷鋒網(wǎng):“長(zhǎng)期”大概是多久?
取決于場(chǎng)景本身。
我們與蓋茨基金會(huì)的合作中,在非洲用機(jī)器來判斷一個(gè)人是否有得瘧疾,同時(shí)得出病癥的嚴(yán)重程度。
在國(guó)內(nèi)大家談機(jī)器與醫(yī)生的對(duì)比,但非洲這些地方連醫(yī)院醫(yī)生都沒有,相對(duì)來講,有一個(gè)工具給病人診斷,已經(jīng)是一個(gè)很大的醫(yī)療進(jìn)步。
這個(gè)例子,我相信在未來短期三五年之內(nèi),會(huì)有著很大的幫助,現(xiàn)在有些產(chǎn)品已經(jīng)在一些相對(duì)落后的國(guó)家試用。
但在比較發(fā)展的國(guó)家,醫(yī)生已經(jīng)有比較成熟、習(xí)慣的工作方式,供應(yīng)商的系統(tǒng)要進(jìn)入到醫(yī)院,需要想清楚整個(gè)環(huán)節(jié)才有辦法幫助到醫(yī)生。因?yàn)槎喾N客觀因素,會(huì)致使過渡時(shí)間更長(zhǎng)。
當(dāng)然了,如果找好場(chǎng)景的話,最快兩三年之內(nèi)就可以安全著陸。
雷鋒網(wǎng):您覺得哪幾個(gè)場(chǎng)景前景相比而言會(huì)比較明朗?
目前市場(chǎng)上很多企業(yè)在做診斷,其實(shí)我覺得可以往前探一步:做好分割。
一個(gè)醫(yī)生在做放射性療法之前,要先把不同放射性療法所影響到的這些不同區(qū)域標(biāo)出來,并進(jìn)行分割。分割工作的人力和時(shí)間成本很高,如果現(xiàn)在有一個(gè)工具能夠自動(dòng)進(jìn)行分割,再讓醫(yī)生去確認(rèn),需求會(huì)比較大。
當(dāng)一個(gè)系統(tǒng)先對(duì)影像做標(biāo)注,醫(yī)生去看的時(shí)候已經(jīng)有90%完成地很好,沒做好的地方醫(yī)生再去修改,最后一關(guān)由醫(yī)生來把守,這種輔助工具醫(yī)生也很樂意接受。
雷鋒網(wǎng):談?wù)勎磥砦④涐t(yī)療人工智能的展望?
我們希望能從人一出生開始便了解你的整個(gè)健康情況,通過收集身體信息,實(shí)時(shí)分析你生活和機(jī)體哪些地方需要改進(jìn),如飲食、睡眠、運(yùn)動(dòng)、病痛等等。
我覺得在未來應(yīng)該會(huì)演進(jìn)為這種形式,每個(gè)人都有一個(gè)專門屬于他的醫(yī)療人工智能健康助理。
雷鋒網(wǎng):產(chǎn)品形態(tài)是2C的形式嗎?
這個(gè)倒不見得是2C,更多是2B2C模式,產(chǎn)品在面向終端用戶時(shí)也要有醫(yī)生的參與。像美國(guó)就有很多家庭醫(yī)生,可通過家庭醫(yī)生把系統(tǒng)推向病人。
雷鋒網(wǎng):哪些新的人工智能技術(shù)將會(huì)對(duì)醫(yī)療行業(yè)帶來巨大變革?
其實(shí)“如何把不同的信息在不同層次進(jìn)行整合”這一認(rèn)知層面的課題,整個(gè)行業(yè)仍舊存在很多不足,現(xiàn)階段單是把知識(shí)結(jié)構(gòu)化就是一項(xiàng)很復(fù)雜的任務(wù)。如果解決了上述問題則對(duì)技術(shù)體系和行業(yè)的推動(dòng)力將非常大。
我們先以機(jī)器翻譯為例,大部分機(jī)器翻譯還是單句單句翻,但一段段翻跟一句句翻就很不一樣了,它涉及到“理解”。再以圖像識(shí)別為例,機(jī)器識(shí)別出圖像中有藍(lán)色的天空和藍(lán)色的海和帆船,但如果突然出現(xiàn)圖像中的天空為紅色,而它過去的訓(xùn)練集中沒有對(duì)紅色天空進(jìn)行標(biāo)注,那機(jī)器能懂得紅色的天空代表是晚霞嗎?
因此我們要讓機(jī)器建立起一個(gè)對(duì)故事、對(duì)世界、對(duì)環(huán)境的認(rèn)知能力。
這里的難點(diǎn)在于,它有很多很多參數(shù)的變化,你不可能讓機(jī)器學(xué)習(xí)把整個(gè)世界的種種元素挨個(gè)看一遍才能理解。而是應(yīng)該創(chuàng)建一種新的方法,把不同地方學(xué)到的知識(shí)給整合起來,從而解釋出圖像看起來是合理的。
醫(yī)學(xué)影像的解釋同樣如此,醫(yī)生在看MRI影像時(shí),基于經(jīng)驗(yàn)判斷某個(gè)人是女性,但有一些地方卻不像女性(如變性人等)。這時(shí)候要有更高層的知識(shí)能力、知識(shí)架構(gòu),也就是用Mental Mode去解釋去理解,這會(huì)是一個(gè)很大的挑戰(zhàn),同時(shí)也是一個(gè)很大的機(jī)會(huì)。
雷鋒網(wǎng):當(dāng)前很多像醫(yī)院等傳統(tǒng)機(jī)構(gòu)對(duì)AI處于觀望狀態(tài),市場(chǎng)還需教育。企業(yè)應(yīng)該如何讓各行各業(yè)的人更快了解人工智能?
為什么互聯(lián)網(wǎng)興起后能迅速影響到各行各業(yè)?因?yàn)槟菚r(shí)候大家即便不懂互聯(lián)網(wǎng),但至少有瀏覽器產(chǎn)品供我們使用,雖然有別于可觸摸的實(shí)體物品,但我們可以看到互聯(lián)網(wǎng)產(chǎn)品的界面,也可在上面進(jìn)行操作和交互,這才使得人們對(duì)互聯(lián)網(wǎng)的認(rèn)知建立的如此之快。
人工智能普及進(jìn)度慢,一大原因就是沒有一些典型的終端產(chǎn)品讓大家直接感受。要想教育一個(gè)市場(chǎng),最好的方式就是讓他們?nèi)ンw驗(yàn)AI的能力。
雷鋒網(wǎng):您在微軟亞洲研究院任職18年,談?wù)勥@里留住您最大的一個(gè)原因是什么?
在這18年里,我最大感觸是微軟亞洲研究院為很多優(yōu)秀的研究員創(chuàng)建了能夠長(zhǎng)期鉆研細(xì)分領(lǐng)域課題的極佳環(huán)境。在微軟亞洲研究院這樣的基礎(chǔ)研究機(jī)構(gòu)里,好比在MIT、斯坦福,我們?cè)陂L(zhǎng)時(shí)間探索各式各樣的有趣題目。
近兩年量子計(jì)算很火,但很多人所有不知,我們研究院從十幾年前便開始做量子計(jì)算了。除此之外,也有美國(guó)的同事在探索用DNA來存儲(chǔ)信息,人體中一個(gè)DNA大概有4GB內(nèi)存,你想想,一個(gè)細(xì)胞大小的體積便能存儲(chǔ)4GB的內(nèi)容,密度遠(yuǎn)高于我們用的SD卡。
像這種看得很遠(yuǎn)的方向,只有在研究院才有機(jī)會(huì)去接觸,這對(duì)任何一位研究者都極具吸引力。
蓋茨早在26年前便建立微軟研究院,并且在同期啟動(dòng)三大研究組:自然語言處理組、語音組、計(jì)算機(jī)視覺組。
這些研究在當(dāng)時(shí)來看,離落地非常遙遠(yuǎn)。
但微軟今天能夠站在人工智能最頂端,不是因?yàn)槲覀凅w量多大,也不是我們?nèi)瞬艍蚨啵谟谘芯吭汉蜔釔垩芯康倪@一批批人早已為此準(zhǔn)備26年之久。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章