0
今年,醫(yī)學(xué)影像分析頂會MICCAI 2019在深圳舉行。在這次會上,英偉達(dá)醫(yī)療副總裁Kimberly Powell也來到了中國,并且?guī)砹艘粋€(gè)20多人的隨行團(tuán)。
作為全球最大的獨(dú)立 GPU 供應(yīng)商,英偉達(dá)給外界釋放的信號不言而喻。Kimberly說到,之所以來參加MICCAI,是要見一些潛在的合作伙伴。同時(shí),英偉達(dá)也將會在NVIDIA內(nèi)部打造中國本土的醫(yī)療團(tuán)隊(duì)。
2008年,Kimberly加入英偉達(dá),負(fù)責(zé)將英偉達(dá)GPU開發(fā)為可應(yīng)用于醫(yī)療成像儀器的加速器平臺。此前,她曾表示,醫(yī)療領(lǐng)域是英偉達(dá)規(guī)模最大、也是最為成熟的一個(gè)領(lǐng)域?!霸诜派鋵W(xué)中,我們可以利用人工智能大幅的降低成本,提升圖像的質(zhì)量,并且將醫(yī)療和人工智能整合到一起?!?/p>
作為入局醫(yī)療的重要一步,2018年,英偉達(dá)發(fā)布了Clara平臺。時(shí)隔一年,Clara的進(jìn)展如何?Clara能否支撐起英偉達(dá)的醫(yī)療夢想?
實(shí)驗(yàn)室表現(xiàn)出色的AI遲遲難以在醫(yī)院落地應(yīng)用,很重要的一個(gè)原因就是“臨床環(huán)境非常復(fù)雜”。
就以設(shè)備來說,很多醫(yī)院還在用十幾年前生產(chǎn)的成像設(shè)備,因?yàn)樵O(shè)備升級耗資巨大,醫(yī)院的“改造動力”并不充足。這也是英偉達(dá)入局醫(yī)療的動力之一。
Kimberly說,在消費(fèi)級AI當(dāng)中,英偉達(dá)更關(guān)注的是數(shù)據(jù)訓(xùn)練、模型訓(xùn)練。醫(yī)學(xué)影像的數(shù)據(jù)規(guī)模非常龐大,一些主流的消費(fèi)級AI工具無法處理。如果沒有更為先進(jìn)的工具,AI就很難進(jìn)入到下一個(gè)層級的應(yīng)用。
現(xiàn)在,英偉達(dá)更關(guān)注的是規(guī)模可擴(kuò)展的推理,以更快、更大規(guī)模的方式來進(jìn)行推理。在Clara平臺上,醫(yī)生可以繼續(xù)使用原來的超聲、CT等成像設(shè)備,輸入圖像后,系統(tǒng)可以自動推理出更加清晰的圖像。
Kimberly向雷鋒網(wǎng)表示,醫(yī)療將會是世界上對于計(jì)算能力需求最大的產(chǎn)業(yè)?!澳P秃蛿?shù)據(jù)集的規(guī)模較大,而且很多都是3D數(shù)據(jù)。想象一下,我們有十幾種醫(yī)療器械,身體結(jié)構(gòu)、器官、疾病都有十幾種分類。因此,針對各個(gè)細(xì)分領(lǐng)域的AI算法種類是指數(shù)級增長的?!?/p>
除此之外,考慮到醫(yī)學(xué)數(shù)據(jù)的敏感性,醫(yī)院對于數(shù)據(jù)本地化的要求比較苛刻,對于底層CPU、GPU性能的要求不斷上升。
這些是英偉達(dá)決定開發(fā)Clara平臺來滿足醫(yī)療需求的原因。
作為一個(gè)軟硬件相結(jié)合的平臺,Clara的核心是英偉達(dá) Clara AGX,是一套以英偉達(dá) Xavier 人工智能運(yùn)算模塊和英偉達(dá) Turing 架構(gòu) GPU 為基礎(chǔ)的運(yùn)算架構(gòu)。
2018年,Clara軟件開發(fā)工具包(SDK)在北美放射學(xué)會會議上發(fā)布,定位于針對醫(yī)療行業(yè)分層的軟件堆棧。
發(fā)布將近一年后,Kimberly也向雷鋒網(wǎng)分享了Clara平臺的成績。
其中一個(gè)比較大的進(jìn)展,是工具集的高度模塊化。在Clara第一個(gè)版本當(dāng)中,整個(gè)工作流是提前設(shè)定好的。也就是說,用現(xiàn)有的模型去訓(xùn)練現(xiàn)有的預(yù)定好的模型。
而在最新的版本當(dāng)中,用戶可以將自己的模型帶到平臺上來進(jìn)行訓(xùn)練,“所以在使用層面,Clara變得更加友好了?!?/p>
其次,英偉達(dá)還整合了一些開源的工具。比如,新的醫(yī)療影像瀏覽器能從三個(gè)視角觀察圖像,相當(dāng)于是一個(gè)AI助理分析工具,從用戶的角度而言,使用更方便。
再然后是優(yōu)化了性能,尤其是改善了數(shù)據(jù)加載訓(xùn)練的時(shí)間。Kimberly笑道,“有開發(fā)者反映,有時(shí)候數(shù)據(jù)加載的時(shí)間,比訓(xùn)練的時(shí)間還要長?!?/p>
最后,新的SDK還實(shí)現(xiàn)了自動化的多GPU訓(xùn)練,不再需要用戶過多干涉。
據(jù)雷鋒網(wǎng)了解,Clara主要針對三種類型醫(yī)療客戶,第一是醫(yī)療設(shè)備公司,第二是人工智能軟件開發(fā)公司,第三是那些擁有幾百個(gè)應(yīng)用的醫(yī)院。
Kimberly認(rèn)為,對于這些醫(yī)療領(lǐng)域的用戶,英偉達(dá)可提供四個(gè)方面的能力。
第一、訓(xùn)練好的模型,可以用來訓(xùn)練數(shù)據(jù),利用這些模型來作為醫(yī)生的助理;第二,讓模型表現(xiàn)非常有效的一個(gè)辦法是對數(shù)據(jù)進(jìn)行標(biāo)記,在Clara平臺上,研究人員可以來做預(yù)標(biāo)記的事情;第三,有一個(gè)預(yù)訓(xùn)練模型讓開發(fā)者有一個(gè)比較高的起點(diǎn),對這個(gè)模型再進(jìn)行訓(xùn)練時(shí),可以用更少的數(shù)據(jù)量就達(dá)到非常高的準(zhǔn)確度;第四,就是應(yīng)用的部署。
很多AI初創(chuàng)企業(yè)手里有一些AI模型,但是他們需要將這些AI模型進(jìn)行大規(guī)模的運(yùn)轉(zhuǎn),比如:每天至少做上百個(gè)推理。
所以,Clara平臺實(shí)際上就提供了可擴(kuò)展的AI推理功能,那些初創(chuàng)企業(yè)和醫(yī)療公司就可以用Clara平臺快速和低成本的擴(kuò)展。
據(jù)了解,英偉達(dá)在醫(yī)療領(lǐng)域已經(jīng)收獲國內(nèi)包括平安保險(xiǎn)、華大基因、碳云智能、聯(lián)影智能、推想科技等在內(nèi)的眾多合作伙伴。例如,推想科技使用的就是Clara里的推理引擎,并行執(zhí)行多個(gè)人工智能算法。如果沒有這個(gè)推理引擎,一個(gè)AI的模型就必須有一個(gè)專門的GPU執(zhí)行。
此外,聯(lián)影智能也在NVIDIA DGX系統(tǒng)的基礎(chǔ)上構(gòu)建AI架構(gòu),以便開發(fā)用于全棧式醫(yī)學(xué)影像的人工智能軟件uAI。
Kimberly說,AI初創(chuàng)企業(yè)現(xiàn)在基本上都是基于英偉達(dá)的技術(shù)來打造自己的應(yīng)用,英偉達(dá)做的事情就是給他們的應(yīng)用去加速,去做更底層的事情。
雷鋒網(wǎng)了解到,從發(fā)布以來,Clara平臺的開發(fā)者數(shù)量增長非常迅速。Kimberly說,英偉達(dá)在今年春天正式發(fā)布了這個(gè)應(yīng)用框架,幾個(gè)月的時(shí)間,Clara開發(fā)者的數(shù)量增加了4倍。
深度學(xué)習(xí)仍然是這波人工智能熱潮中占“統(tǒng)治性”地位的技術(shù)。據(jù)雷鋒網(wǎng)了解,這一次的MICCAI會議上,仍然有超過70%的研究人員做的都是深度學(xué)習(xí)領(lǐng)域的研究。
但是,值得注意的一個(gè)現(xiàn)象是,聯(lián)邦學(xué)習(xí)悄悄成為了今年MICCAI上的一個(gè)熱詞。
大會主席沈定剛教授向雷鋒網(wǎng)表示,聯(lián)邦學(xué)習(xí)對于醫(yī)療數(shù)據(jù)的隱私性來說是一個(gè)很好的方法,既可以保證數(shù)據(jù)“不出院”,又能夠利用不同醫(yī)院的數(shù)據(jù)訓(xùn)練同一個(gè)算法。
英偉達(dá)資深研究科學(xué)家Nicola Rieke說,聯(lián)邦學(xué)習(xí)的提出,主要是為了解決“數(shù)據(jù)收集”的問題。
“如果一項(xiàng)研究需要跨國或者跨區(qū)域,就不可能建一個(gè)共有的數(shù)據(jù)池。在聯(lián)邦學(xué)習(xí)里,其實(shí)是模型找數(shù)據(jù),而不是數(shù)據(jù)找模型,醫(yī)學(xué)數(shù)據(jù)一直沒有離開醫(yī)院。這個(gè)新技術(shù)的最大突破點(diǎn)在于,模型訓(xùn)練完、數(shù)據(jù)回傳時(shí),要保證最少的涉及到隱私的數(shù)據(jù)被回傳過來。所以我們只是回傳訓(xùn)練后模型的數(shù)據(jù),而不是原有的數(shù)據(jù)?!?/p>
其次,如果采取集中化的數(shù)據(jù)處理方式,會大大增加數(shù)據(jù)的規(guī)模?!氨热?,CT的圖象原來有1TB。我把這個(gè)數(shù)據(jù)集中之后,就相當(dāng)于把1TB做一個(gè)拷貝,創(chuàng)造了2TB的數(shù)據(jù)?!?/p>
當(dāng)然,Nicola Rieke也提到“數(shù)據(jù)安全”的問題:如果根據(jù)模型訓(xùn)練出來的數(shù)據(jù),又知道底層的運(yùn)行邏輯,確實(shí)是可以進(jìn)行模型反推。
因此,英偉達(dá)和倫敦國王學(xué)院的研究人員在這個(gè)模型上引入了稀疏向量技術(shù)(SVT,Sparse Vector Technique)。訓(xùn)練完數(shù)據(jù)之后,在數(shù)據(jù)中加入“噪點(diǎn)”,讓數(shù)據(jù)變得模糊、改變原有數(shù)據(jù)的顆粒度,讓反推變得更加困難。
當(dāng)然,任何一個(gè)方法都不是完美的。此前,很多的數(shù)據(jù)訓(xùn)練放在云端,用大量的GPU去做。但是,由于聯(lián)邦學(xué)習(xí)需要把集中于中心服務(wù)器的模型訓(xùn)練過程分散到了各地。這對于合作對象的硬件條件提出了要求,會增加各地的GPU數(shù)量。
Nicola Rieke表示,確實(shí)存在這種情況,但是現(xiàn)在英偉達(dá)的GPU硬件,基本上對于每一個(gè)服務(wù)器的供應(yīng)商來說都是可以使用的,最入門的、最低的投入可能只需要1萬美金,一定程度上降低了使用的門檻。
借助于聯(lián)邦學(xué)習(xí),今年8月,英偉達(dá)與總部位于英國的藥物研發(fā)聯(lián)盟MELLODDY組織聯(lián)手,圍繞藥物研究展開合作。
MELLODDY包括了10家領(lǐng)先的制藥公司,如安進(jìn)、拜耳、葛蘭素史克、楊森和諾華;兩所歐洲頂尖大學(xué)——魯汶大學(xué)和布達(dá)佩斯科技經(jīng)濟(jì)大學(xué)以及四家初創(chuàng)企業(yè)。MELLODDY的研究人員創(chuàng)建了一個(gè)分布式深度學(xué)習(xí)模型,用于在不同的云集群中的傳輸以及對未知的1000萬化合物注釋數(shù)據(jù)的訓(xùn)練工作。
在英偉達(dá)內(nèi)部,Clara的定位就是“一個(gè)工具”。
NVIDIA中國高性能計(jì)算、產(chǎn)業(yè)AI業(yè)務(wù)總經(jīng)理劉通說到,對于任何使用Clara的用戶用,原則上是沒有任何限制的。相反,無論是初創(chuàng)企業(yè)還是大的醫(yī)療公司做AI,工具恰恰都能提供非常好的幫助。
Kimberly表示,Clara支持任何階段的初創(chuàng)企業(yè)。如果是非常早期的初創(chuàng)企業(yè),可能需要的更多是技術(shù)上的幫助。如果是成熟一點(diǎn)的初創(chuàng)企業(yè),可能它們需要的是市場方面的幫助。
市場化的能力體現(xiàn)在幾個(gè)方面。一方面,在英偉達(dá)的渠道上進(jìn)行宣傳;另一方面,在GTC大會上,英偉達(dá)也會邀請這些公司參與大會、發(fā)表演講?!耙?yàn)橛泻芏囡L(fēng)投參會,通過這種良性的循環(huán),我們能幫助這些企業(yè)拿到一些好的風(fēng)投基金?!?/p>
除此之外,英偉達(dá)也與學(xué)術(shù)機(jī)構(gòu)合作。4月,英偉達(dá)與美國放射學(xué)會聯(lián)手,將Clara AI平臺整合到旗下的ACR AI-LAB中,讓超過38000名的放射科醫(yī)生創(chuàng)建滿足自己需求的AI工具。
而在半個(gè)月前,英偉達(dá)與加州大學(xué)舊金山分校合作,用DGX超級計(jì)算機(jī)打造自己的AI訓(xùn)練架構(gòu),并且用Clara開發(fā)和部署了應(yīng)用。
Kimberly補(bǔ)充說,英偉達(dá)更多的是扮演一個(gè)“賦能者”的角色,為整個(gè)AI生態(tài)系統(tǒng)打造了一個(gè)完善的開發(fā)工具,幫助創(chuàng)業(yè)公司更好地執(zhí)行醫(yī)療AI的應(yīng)用。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。