0
本文作者: 付靜 | 2020-04-28 18:40 |
這場(chǎng)疫情再次拉近了我們和科學(xué)家之間的距離。
疫情之下,科研人員的一次次探索與發(fā)現(xiàn),都成為公眾關(guān)注的焦點(diǎn)和政策制定的依據(jù)。獲取最新科研信息,對(duì)我們建立更立體、客觀的新冠疫情認(rèn)知,有著關(guān)鍵意義。
近日,微軟亞洲研究院(Microsoft Research Asia,MSRA)推出了一個(gè)新冠數(shù)據(jù)分析網(wǎng)站 COVID Insights,旨在通過較為全面的疫情數(shù)據(jù),達(dá)到支持學(xué)術(shù)研究和向公眾科普的目的。
COVID Insights 網(wǎng)站基于計(jì)算生物學(xué)、數(shù)據(jù)分析等領(lǐng)域的專業(yè)知識(shí)和研究經(jīng)驗(yàn),使用了約翰霍普金斯大學(xué)、美國疾病控制與預(yù)防中心、GISAID 等機(jī)構(gòu)的官方數(shù)據(jù),主要分為感染數(shù)據(jù)分析、基因組和蛋白質(zhì)結(jié)構(gòu)、研究趨勢(shì)三大板塊。
跨國家或地區(qū)比較傳播動(dòng)態(tài)
哪些地區(qū)的疫情發(fā)展趨勢(shì)比較接近?有些國家的數(shù)據(jù)降下來了,他們的做法值得參考嗎?
實(shí)質(zhì)上,「感染數(shù)據(jù)分析」板塊對(duì)這類問題給出了答案——通過微軟亞洲研究院對(duì) COVID-19 數(shù)據(jù)的分析,流行病學(xué)參數(shù)對(duì)特定國家與地區(qū)的疾病傳播動(dòng)態(tài)的影響便一目了然。
例如,澳大利亞 2020 年 2 月 3 日至 2020 年 4 月 26 日的疫情傳播趨勢(shì)與冰島 2 月 1 日至 4 月 17 日的趨勢(shì)相似度為 56%,因此冰島便可以借鑒澳大利亞的疫情防控措施。
而通過移動(dòng)光標(biāo)的位置,將時(shí)間限定在 3 月 22 日至 4 月 15 日,可以發(fā)現(xiàn)這一時(shí)期澳大利亞的傳播趨勢(shì)與韓國在 2 月 29 日至 3 月 17 日的趨勢(shì)相似度為 80%,因此澳大利亞便可以參考韓國在 2020 年 3 月中下旬的防控措施。
眾所周知,當(dāng)前美國新冠肺炎確診人數(shù)逼近 100 萬,若利用這一功能,我們可以看到 3 月 20 日至 4 月 26 日(目前該功能的數(shù)據(jù)只更新至 4 月 26 日)美國的疫情發(fā)展趨勢(shì)和兩周前的伊朗有 75% 的相似度,那么此時(shí)參考對(duì)方的措施不失為一種可行的方案。
雷鋒網(wǎng)了解到,這一功能的數(shù)據(jù)集來源于約翰霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心公布的新冠疫情數(shù)據(jù)。
相比上述板塊,「基因組和蛋白質(zhì)結(jié)構(gòu)」板塊則顯得比較抽象了,該板塊展示了 SARS-CoV-2(新型冠狀病毒)的病毒學(xué)分析結(jié)果,主要將目光放在 SARS-CoV-2 病毒本身,主要包括以下兩個(gè)功能:
第一,基因組與蛋白質(zhì)結(jié)構(gòu)。
前不久,外媒“新冠病毒來自武漢”的說法引起了軒然大波。實(shí)際上,早在 2020 年 2 月 20 日,中國科學(xué)院西雙版納熱帶植物園就曾發(fā)布了研究成果,稱武漢華南海鮮市場(chǎng)的新型冠狀病毒是從其他地方傳入的 ,于是便出現(xiàn)了新冠病毒「國外起源論」。
在這一研究中,有一幅非常復(fù)雜的圖,實(shí)際上就反映出了病毒基因組變異的問題。實(shí)際上,就病毒基因組變異而言,如今全球已經(jīng)有了很多的研究數(shù)據(jù)。
根據(jù)網(wǎng)站介紹,微軟亞洲研究院從全球流感序列數(shù)據(jù)庫 GISAID 上下載了 SARS-CoV-2 基因組數(shù)據(jù),以病毒株 Wuhan-Hu-1 作為參考序列確定出各病毒序列發(fā)生變異的氨基酸及其位置。
因此,通過在下拉列表中選定某一個(gè)大洲,我們就能直觀地看到特定核酸片段上發(fā)生變異的氨基酸的數(shù)目、地區(qū)分布與變異時(shí)間線。
同時(shí),網(wǎng)站上經(jīng) SARS-CoV-2 病毒核酸序列轉(zhuǎn)化得到的蛋白質(zhì)三維結(jié)構(gòu),也為相關(guān)研究提供了參考。
第二,與其他冠狀病毒的比較。
據(jù)了解,當(dāng)前在全球肆虐的 SARS-CoV-2 病毒是目前已知的第 7 種可以感染人的冠狀病毒,其余 6 種中就包括我們可能已經(jīng)不陌生的 SARS-CoV(引發(fā)“非典”的病毒)和 MERS-CoV(引發(fā)中東呼吸綜合征的病毒)。
除了拿 SARS-CoV-2 與 SARS-CoV、MERS-CoV 進(jìn)行比較,在 COVID Insights 網(wǎng)站上還有 SARS-CoV 和另外兩種病毒的比較。
值得一提的是,這兩種病毒 Bat-CoV 和 Pangolin-CoV 分別來自此前新冠病毒潛在中間宿主的熱門人選中華菊頭蝠和馬來穿山甲。
根據(jù) COVID Insights 網(wǎng)站,Bat-CoV、Pangolin-CoV、SARS-CoV、MERS-CoV 與 SARS-CoV-2 的相似度依次遞減,分別為 96%、90%、79%、49%。
2020 年 1 月 1 日至 2020 年 4 月 22 日,眾多領(lǐng)域科研人員都做出了非常多的研究。微軟亞洲研究院通過統(tǒng)計(jì)、整合論文開放獲取數(shù)據(jù)庫 COVID-19 Open Research Dataset 的數(shù)據(jù),根據(jù)不同時(shí)間段(按周統(tǒng)計(jì)),做出了流行病學(xué)、社會(huì)科學(xué)、 病毒學(xué)、診斷學(xué)四個(gè)領(lǐng)域的新冠研究趨勢(shì)詞云。
因此我們可以發(fā)現(xiàn),2020 年 2 月 26 日至 2020 年 3 月 4 日那一周,流行病學(xué)研究中“transmission”(傳播)一詞出現(xiàn)的頻率較高。
2020 年 4 月 8 日至 2020 年 4 月 15 日那一周,社會(huì)科學(xué)研究中,“number”(數(shù)字)一詞成為關(guān)鍵詞。
值得一提的是,COVID Insights 網(wǎng)站也將流行病學(xué)、社會(huì)科學(xué)、 病毒學(xué)、診斷學(xué)四個(gè)領(lǐng)域的高引用論文列了出來,這樣一來,公眾也在某種程度上降低了受低質(zhì)量論文誤導(dǎo)的風(fēng)險(xiǎn)。
實(shí)際上,近一段時(shí)間以來,疫情相關(guān)的學(xué)術(shù)論文呈現(xiàn)出井噴式增長態(tài)勢(shì),低質(zhì)量研究論文泛濫的現(xiàn)象也相當(dāng)嚴(yán)重。2020 年 4 月 23 日,卡內(nèi)基梅隆大學(xué)道德與政策中心主任 Alex John London 和麥吉爾大學(xué)生物醫(yī)學(xué)倫理部教授兼主任 Jonathan Kimmelman 也在《科學(xué)》雜志發(fā)表文章,發(fā)出呼吁:
不應(yīng)以 COVID-19 疫情爆發(fā)的緊迫性為借口,在病毒研究和疫苗研發(fā)等方面降低科研標(biāo)準(zhǔn)。
可見,雖然 COVID Insights 網(wǎng)站目前的數(shù)據(jù)并非特別全面,但的確在加速優(yōu)質(zhì)科研信息的互通互享方面發(fā)揮了重要的作用。正如比爾·蓋茨所說:
這次疫情是現(xiàn)代社會(huì)第一場(chǎng)真正意義的大流行病。這就像一場(chǎng)世界大戰(zhàn),不同的是,這次我們都在同一條戰(zhàn)線。
引用來源:
[1]https://mp.weixin.qq.com/s/4KglP1kRVgSrkMFc-L1_NA
[3]https://coronavirus.jhu.edu/
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。