0
本文作者: 付靜 | 2021-02-24 18:17 |
一年前的此刻,武漢封城已有一個(gè)月,而新冠疫情的蔓延態(tài)勢(shì)仍在不斷升級(jí)。科學(xué)家們除了要解析病毒演化傳播、分析病例樣本、研發(fā)疫苗等,也在關(guān)注一件事——建立疫情預(yù)測(cè)模型。
當(dāng)時(shí),包括鐘南山院士在內(nèi)的多名專家的觀點(diǎn)是:
對(duì)病毒在人群中傳播的智能預(yù)測(cè)模型構(gòu)建與驗(yàn)證是當(dāng)前的工作重點(diǎn)。
三個(gè)月后,蘭州大學(xué)西部生態(tài)安全省部共建協(xié)同創(chuàng)新中心正式對(duì)外發(fā)布「全球 COVID-19 疫情預(yù)測(cè)系統(tǒng)」(鏈接:http://covid-19.lzu.edu.cn/index.htm)。
作為世界首個(gè)全球疫情預(yù)測(cè)系統(tǒng),「全球 COVID-19 疫情預(yù)測(cè)系統(tǒng)」自 2020 年 5 月上線運(yùn)行以來,已實(shí)現(xiàn)對(duì) 190 余個(gè)國(guó)家新增確診病例的預(yù)測(cè)。
據(jù)《光明日?qǐng)?bào)》最新報(bào)道:
近日,鐘南山院士在“廣州實(shí)驗(yàn)室科技助力基層疫情防控萬里行”啟動(dòng)儀式上,對(duì)這一系統(tǒng)表示肯定,他稱贊:“他們一些預(yù)測(cè)的模型還是相當(dāng)可靠的?!?/p>
首個(gè)全球疫情預(yù)測(cè)系統(tǒng)建立
「全球 COVID-19 疫情預(yù)測(cè)系統(tǒng)」的官網(wǎng)頁面主要涵蓋了三部分預(yù)測(cè):
全球每月預(yù)測(cè)概況:按月分析全球各地區(qū)疫情蔓延情況,列出每月預(yù)測(cè)新增病例數(shù)前 10 位國(guó)家。
突發(fā)新冠疫情預(yù)測(cè):預(yù)測(cè)疫情態(tài)勢(shì)將出現(xiàn)突出變化的城市,如 2020 年 8 月 2 日預(yù)測(cè)香港本輪疫情有望在 8 月底得到控制。
新冠疫情二次爆發(fā)預(yù)警:根據(jù)溫度等氣象要素的季節(jié)性變化、游行抗議和城市解封等大規(guī)模聚集性活動(dòng),預(yù)測(cè)全球各地疫情二次暴發(fā)。
這一模型的相關(guān)研究成果 2020 年 5 月 18 日由中國(guó)科學(xué)院主辦的自然科學(xué)綜合性期刊 Science Bulletin 接收,2020 年 8 月 2 日正式發(fā)表,題為 Global prediction system for COVID-19 pandemic(新冠疫情全球預(yù)測(cè)系統(tǒng))。
論文介紹,現(xiàn)代流行病學(xué)反應(yīng)的一個(gè)重要特點(diǎn)是利用所有可用數(shù)據(jù)提供實(shí)時(shí)反應(yīng)信息。理論上,通過引入最新的疫情數(shù)據(jù)來提高先前流行病學(xué)模型的可信度是可行的。
實(shí)際上,新冠疫情的發(fā)生具有時(shí)空異質(zhì)性,也就是說,可能與不同地區(qū)的氣象條件和地方政府實(shí)施的干預(yù)措施有關(guān)。因此研究團(tuán)隊(duì)認(rèn)為,有必要建立一個(gè)將天氣預(yù)報(bào)和氣候分析作為自變量的流行病預(yù)警系統(tǒng),以提高預(yù)測(cè)的整體精度。
【該系統(tǒng)預(yù)測(cè)的美國(guó)本月及本季疫情情況】
研究團(tuán)隊(duì)的做法是,將疫情預(yù)測(cè)模型與全球真實(shí)疫情數(shù)據(jù)相結(jié)合,綜合考慮環(huán)境因素(溫度、濕度)的影響以及控制措施的實(shí)施情況,從而建立了一個(gè)自己的全球預(yù)測(cè)系統(tǒng)。
論文顯示:
該預(yù)測(cè)系統(tǒng)是一個(gè)改進(jìn)的 SIR 模型。
SIR 模型,即 Susceptible Infected Recovered Model,即一種傳染病模型中最經(jīng)典的模型,其中 S 表示易感者,I 表示感染者,R 表示移出者(主要指被隔離或因病愈而具有免疫力的人)。
具體來講,研究團(tuán)隊(duì)的 SIR 模型包含了真實(shí)的全球疫情數(shù)據(jù)、氣象因素和量化的隔離措施。
在該模型中,假設(shè)疫情期間該地區(qū)的總?cè)丝跀?shù)(N = S + I + R)保持不變,病毒僅通過人與人之間的感染傳播,個(gè)體之間的免疫力無差異。
研究團(tuán)隊(duì)將 2020 年 1 月 22 日至 5 月 14 日六個(gè)國(guó)家(美國(guó),意大利,英國(guó),俄羅斯,沙特阿拉伯和巴西)報(bào)告的確診病例數(shù)與按照模型預(yù)測(cè)的結(jié)果進(jìn)行了比較,如下圖所示(橙色表示未來預(yù)測(cè)值、粉色表示模擬值、紫色表示報(bào)告確診值。)
不難發(fā)現(xiàn),系統(tǒng)成功進(jìn)行了各國(guó)疫情變化曲線的模擬。
雷鋒網(wǎng)根據(jù)官方途徑了解到,「全球 COVID-19 疫情預(yù)測(cè)系統(tǒng)」其實(shí)有兩版:
第一版使用了上述改良的 SIR 模型;
第二版則使用了更復(fù)雜的 SEIR 模型——團(tuán)隊(duì)在這一版中還考慮了社區(qū)解封時(shí)間以及市民自我隔離對(duì)疫情發(fā)展的影響,第二版可用來進(jìn)行季節(jié)性預(yù)測(cè)及疫情二次爆發(fā)的預(yù)測(cè)。
所謂的 SEIR 也是一種常見的傳染病模型,相比 SIR 模型,這種模型多了一個(gè) E(Exposed,暴露者),即指接觸過感染者但暫無能力傳染給其他人的人,這適用于潛伏期長(zhǎng)的傳染病——此前有關(guān) SARS 的傳播動(dòng)力學(xué)研究大多也都采用了 SEIR 模型。
值得一提的是,2020 年 2 月 27 日廣州市政府新聞辦舉辦的一場(chǎng)疫情防控專場(chǎng)新聞通氣會(huì)上,鐘南山院士曾提到:
疫情開始時(shí),國(guó)外有流行病學(xué)家用權(quán)威的試驗(yàn)?zāi)P?,預(yù)測(cè) 2 月初中國(guó)感染新冠肺炎人數(shù)將達(dá) 16 萬人。這是沒有考慮到國(guó)家的強(qiáng)力干預(yù),也沒有考慮春節(jié)后的延遲復(fù)工,我們也做了預(yù)測(cè)模型,2 月中旬或下旬達(dá)到疫情高峰,確診病例約六、七萬人,投到國(guó)外權(quán)威期刊,被退了回來,感覺和上面的預(yù)測(cè)水平差太多,還有人給我發(fā)微信說“你的話幾天之內(nèi)就會(huì)被碾個(gè)粉碎”。但事實(shí)上,我們的預(yù)測(cè)更接近權(quán)威。
雷鋒網(wǎng)此前曾報(bào)道,雖然鐘南山院士并未詳細(xì)介紹被退回的疾病預(yù)測(cè)模型,但知乎一位名為“瘋狂紳士”的計(jì)算機(jī)軟件背景人士認(rèn)為,鐘南山院士的模型叫「具有飽和發(fā)病率 SIQS 傳染病模型」。根據(jù)其解釋,任何傳染病都具有飽和發(fā)病率,即不可能完全被消滅。
該網(wǎng)友提到,SIQS 正是在 SEIR 的基礎(chǔ)上加入了干預(yù)手段。
這一模型由蘭州大學(xué)西部生態(tài)安全協(xié)同創(chuàng)新中心主任黃建平教授領(lǐng)銜完成。
據(jù)系統(tǒng)官網(wǎng)介紹:
西部生態(tài)安全協(xié)同創(chuàng)新中心于2018年12月獲得教育部認(rèn)定,由蘭州大學(xué)牽頭,中科院相關(guān)研究所,西藏大學(xué)、青海大學(xué)等高校,甘肅省治沙研究所等地方研究機(jī)構(gòu)協(xié)同參與。
雷鋒網(wǎng)注意到,論文最后簡(jiǎn)要介紹了黃建平教授。
黃建平教授任職于蘭州大學(xué)大氣科學(xué)學(xué)院,同時(shí)也是西部生態(tài)安全省部共建協(xié)同創(chuàng)新中心主任、半干旱氣候變化教育部重點(diǎn)實(shí)驗(yàn)室主任,致力于通過結(jié)合實(shí)地觀察和理論研究來進(jìn)行長(zhǎng)期氣候預(yù)測(cè)、塵埃云相互作用和半干旱氣候變化的研究。
【圖片截自黃建平教授團(tuán)隊(duì)官網(wǎng)】
據(jù)知乎答主“李大鵬”稱,上述研究成果:
從數(shù)學(xué)的角度來看就是應(yīng)用了 SIR 傳染病模型,蘭州大學(xué)數(shù)學(xué)院其實(shí)有研究團(tuán)隊(duì)做傳染病模型和基本再生數(shù)建模,但此次似乎沒有參與這項(xiàng)研究。黃建平老師團(tuán)隊(duì)最擅長(zhǎng)的就是優(yōu)化數(shù)學(xué)模型的各種參數(shù)。簡(jiǎn)單的說,用到的數(shù)學(xué)模型其實(shí)不難,但是如何讓模型變得有實(shí)際應(yīng)用價(jià)值,需要大量的技術(shù)和經(jīng)驗(yàn)支持。
自然,建立疫情預(yù)測(cè)模型并非一定要借助 SIR、SEIR 模型。
2020 年 2 月 28 日,鐘南山院士及團(tuán)隊(duì)在醫(yī)學(xué)期刊 JTD 發(fā)表了一篇題為《公共衛(wèi)生干預(yù)下 COVID-19 流行趨勢(shì)的 SEIR 和 AI 預(yù)測(cè)修正》的論文。
這一研究中,團(tuán)隊(duì)不僅將 2020 年 1 月 23 日前后的人口遷移數(shù)據(jù)及最新的新冠肺炎流行病學(xué)數(shù)據(jù)整合到 SEIR 模型中導(dǎo)出流行曲線,還通過 LSTM 模型預(yù)測(cè)新增感染數(shù)隨時(shí)間的變化。
LSTM 即 long-short term memory,長(zhǎng)短期記憶模型,是一種用于處理、預(yù)測(cè)各種時(shí)間序列問題的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),是為解決 RNN 模型梯度彌散的問題而提出。
而就在上周,彭博社也報(bào)道了一個(gè)美國(guó)疫情預(yù)測(cè)系統(tǒng)。
這一系統(tǒng)的設(shè)計(jì)者是華裔 Youyang Gu,他擁有 MIT 電氣工程和計(jì)算機(jī)科學(xué)碩士學(xué)位及數(shù)學(xué)學(xué)位。
Youyang Gu 在 SEIR 模型(已開源:https://github.com/youyanggu/covid19_projections)的基礎(chǔ)上加入機(jī)器學(xué)習(xí)算法,并通過對(duì)預(yù)測(cè)與最終報(bào)告的死亡總數(shù)不斷比較進(jìn)行算法調(diào)整,使其預(yù)測(cè)更加準(zhǔn)確。
此前,憑 Youyang Gu 一己之力設(shè)計(jì)的模型已被美國(guó)疾控中心采用。
根據(jù)美國(guó)著名公立大學(xué)阿默斯特馬薩諸塞大學(xué)生物統(tǒng)計(jì)學(xué)和流行病學(xué)系的副教授 Nicholas Reich 對(duì)眾多類似模型的統(tǒng)計(jì),Youyang Gu 的模型表現(xiàn)始終位居前列。
引用來源:
https://www.sciencedirect.com/science/article/pii/S2095927320305235?via%3Dihub
https://epaper.gmw.cn/gmrb/html/2021-02/24/nw.D110000gmrb_20210224_4-14.htm
http://hjp.lzu.edu.cn/gerenjianjie/index.html
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。