0
本文作者: 貝爽 | 2020-11-05 18:02 |
有數(shù)據(jù)顯示,世界50%新冠(COVID-19)病例由無癥狀感染者傳染。
無發(fā)燒、乏力、頭暈等明顯特征的無癥狀感染者,已在不知不覺中成為新冠病毒傳播和復(fù)發(fā)的最大威脅。
近日,麻省理工學(xué)院(MIT)研究團(tuán)隊(duì)聲稱其利用AI開發(fā)了一種無癥狀感染檢測新方法。有意思的是,該方法利用的是人的生物特征——咳嗽聲。
他們發(fā)現(xiàn),無癥狀感染者發(fā)出的咳嗽聲與健康人存在不同,其中細(xì)微的差別人耳很難分辨,但AI可以。
在最近發(fā)表在《IEEE醫(yī)學(xué)與生物工程學(xué)雜志》上的一篇論文中,MIT研究人員明確表示,他們已經(jīng)開發(fā)出一種能夠識別COVID-19咳嗽聲的AI。該AI算法已通過迄今為止最大的咳嗽數(shù)據(jù)集測試,無癥狀感染者的診斷準(zhǔn)確率可達(dá)到100%。
目前,MIT研究團(tuán)隊(duì)已經(jīng)與一家企業(yè)展開合作,計(jì)劃將該AI算法整合到手機(jī)應(yīng)用程序中。項(xiàng)目負(fù)責(zé)人布萊恩·蘇比拉納(Brian Subirana)表示:
如果每個(gè)人在去教室,工廠或餐廳之前都使用該AI診斷工具,將會有效減少新冠大流行的傳播?!?br/>
據(jù)悉,該項(xiàng)研究成果也同步提交到了FDA和其他監(jiān)管機(jī)構(gòu),如獲得批準(zhǔn),COVID-19咳嗽應(yīng)用程序?qū)⒚赓M(fèi)用于大規(guī)模人群篩查。
人耳能夠分辨出五到十種不同的咳嗽特征,但通過機(jī)器學(xué)習(xí)和信號處理,AI能夠識別300多種。
在醫(yī)學(xué)領(lǐng)域,AI識別「咳嗽聲」已用于多項(xiàng)疾病檢測任務(wù)。比AI檢測肺炎,哮喘或者神經(jīng)肌肉疾病等。
如Subirana所說,“說話和咳嗽的聲音都受到聲帶和周圍器官的影響。 這也意味著,我們可以從聲音中獲取有關(guān)體內(nèi)器官的信息,而AI恰好可以做到這一點(diǎn)。”
因此,在疫情爆發(fā)之前,MIT研究團(tuán)隊(duì)已經(jīng)在嘗試?yán)肁I辨“音”來診斷阿爾茨海默癥(AD)早期的患者。
需要注意的是,正是通過這項(xiàng)研究,研究人員發(fā)現(xiàn)了識別COVID-19無癥狀感染者的可能性,并提供了AI算法支持。
阿爾茨海默病是一種神經(jīng)系統(tǒng)退行性疾病,不僅與記憶力衰退有關(guān),還與聲帶減弱等神經(jīng)肌肉退化有關(guān)。因此,研究人員開發(fā)了一種通用的機(jī)器學(xué)習(xí)算法(或稱為ResNet50的神經(jīng)網(wǎng)絡(luò)),來區(qū)分與不同聲帶強(qiáng)度所產(chǎn)生的聲音。
具體來說,他們訓(xùn)練了三個(gè)神經(jīng)網(wǎng)絡(luò)模型。第一個(gè)神經(jīng)網(wǎng)絡(luò)代表一個(gè)人聲帶的強(qiáng)弱,利用有聲讀物數(shù)據(jù)集(含1000h語音)進(jìn)行訓(xùn)練;第二神經(jīng)網(wǎng)絡(luò)用來區(qū)分言語中的情緒狀態(tài)。據(jù)了解,AD患者的神經(jīng)功能衰退較一般人更為普遍,經(jīng)常會表現(xiàn)出沮喪、悲傷等負(fù)面情緒。因此,研究人員利用演員表達(dá)不同情緒的大型語音數(shù)據(jù)集,開發(fā)了情緒語音分類器。第三個(gè)神經(jīng)網(wǎng)絡(luò)在自建的咳嗽數(shù)據(jù)集上訓(xùn)練,用來辨別肺和呼吸功能的變化。
最后將三種模型結(jié)合起來,形成了一個(gè)用于檢測肌肉退化的AI框架。研究人員經(jīng)過檢測發(fā)現(xiàn),基于聲帶強(qiáng)度、情緒、肺和呼吸功能等生物特征,該AI能夠準(zhǔn)確識別出AD患者。
基于此,當(dāng)冠狀大流行開始蔓延后,Subirana開始思考是否可以利用AI診斷COVID-19,因?yàn)橐呀?jīng)有證據(jù)表明,新冠感染患者會發(fā)生一些類似的神經(jīng)系統(tǒng)癥狀,比如,暫時(shí)性神經(jīng)肌肉損傷。
后來,Subirana在COVID-19咳嗽數(shù)據(jù)集上訓(xùn)練了阿爾茨海默氏病AI模型,結(jié)果取得了驚人的發(fā)現(xiàn)。該AI模型不僅可以高精度識別出新冠感染患者,而且無癥狀感染者的準(zhǔn)確率更高。
AI模型和數(shù)據(jù)集是決定疾病診斷準(zhǔn)確率的兩項(xiàng)關(guān)鍵指標(biāo)。
今年4月,MIT研究人員建立了一個(gè)公開咳嗽數(shù)據(jù)收集網(wǎng)站,允許所有人通過網(wǎng)絡(luò)瀏覽器、手機(jī)或者筆記本電腦等設(shè)備自愿提交咳嗽錄音。
網(wǎng)站地址:https://opensigma.mit.edu/
截止測試前,該網(wǎng)站收集了超過7萬個(gè)錄音,每段錄音中有幾次咳嗽,約有20萬份咳嗽音頻樣本。其中,2500多個(gè)樣本是由已經(jīng)確診患者提交的,包括那些無癥狀感染者。
Subirana稱:“在醫(yī)療領(lǐng)域,這是迄今為止最大的咳嗽數(shù)據(jù)集”。
實(shí)驗(yàn)中,研究人員使用2500個(gè)感染患者的音頻樣本,以及另外2500個(gè)隨機(jī)樣本,對AI模型進(jìn)行訓(xùn)練。然后利用其余的1000張錄音作為檢測數(shù)據(jù),來查看它是否能準(zhǔn)確地辨別出COVID-19患者和健康人的咳嗽。
在模型方面,采用的仍然是阿爾茨海默氏癥AI模型,并且同樣以聲帶強(qiáng)度、情緒、肺和呼吸四項(xiàng)生物特征作為診斷COVID-19感染患者的標(biāo)準(zhǔn)。
在該模型內(nèi)部,咳嗽音頻通過梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient)進(jìn)行轉(zhuǎn)換,并輸入到基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的AI架構(gòu)中,如上文所說,該AI架構(gòu)由生物特征層和3個(gè)并行的ResNet50神經(jīng)網(wǎng)絡(luò)構(gòu)成。最終會輸出二進(jìn)制形式的預(yù)篩查診斷結(jié)果。
基于以上兩個(gè)方面,研究人員對其進(jìn)行了測試,結(jié)果發(fā)現(xiàn)AI模型識別COVID-19患者的準(zhǔn)確率為98.5%,無癥狀感染者的準(zhǔn)確率為100%。
論文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9208795
這一結(jié)果表明,COVID-19的患者即時(shí)沒有明顯癥狀,其聲音也會發(fā)生明顯的變化。同時(shí),該AI模型可以通過這一變化有效地識別出無癥狀感染者。
據(jù)了解,MIT的團(tuán)隊(duì)已經(jīng)在考慮與相關(guān)企業(yè)合作將該AI模型整合到手機(jī)應(yīng)用程序中,以便人們可以方便地對疾病風(fēng)險(xiǎn)進(jìn)行初步評估。
與此同時(shí),研究人員也開始與世界各地的多家醫(yī)院合作,以收集更大,更多樣化的咳嗽記錄集,這將有助于訓(xùn)練和增強(qiáng)AI模型的準(zhǔn)確性。
不過,需要強(qiáng)調(diào)的是,該AI模型的優(yōu)勢不在于檢測有癥狀的新冠患者。
這一點(diǎn)Subirana在論文中也明確強(qiáng)調(diào)。他說,不管他們的癥狀是由COVID-19還是其他癥狀(如流感或哮喘)引起的。該工具的優(yōu)勢在于它能夠分辨無癥狀感染者的咳嗽和健康人的咳嗽。
引用鏈接:
https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。