0
本文作者: 楊鯉萍 | 2020-02-05 19:20 |
雷鋒網(wǎng) AI 開(kāi)發(fā)者按:自 AI 迅速發(fā)展以來(lái),除互聯(lián)網(wǎng)之外,其在醫(yī)療方面也是屢屢作出突出貢獻(xiàn)。無(wú)論是高效的檢測(cè)速率,還是高精度的診斷結(jié)果,都幫助醫(yī)者大大減少了工作量,為病人奪得了更寶貴的救治時(shí)間。
就在最近全球緊密關(guān)注的新型冠狀病毒戰(zhàn)「疫」中,AI 再次發(fā)揮了其高效特性。在由浙江省疾控中心、阿里巴巴達(dá)摩院、杰毅生物共同研發(fā)的一套全新檢測(cè)平臺(tái)中,研究者們巧妙利用 AI 算法,最終使得病毒基因分析的速度由半天(約 8 小時(shí))縮短到半小時(shí)!
而作為公民兼開(kāi)發(fā)者的我們,盡管大多數(shù)人無(wú)法參與這次的抗疫開(kāi)發(fā)實(shí)戰(zhàn)中,但我們可以加入 AI 研習(xí)社【肺炎檢測(cè)挑戰(zhàn)賽專(zhuān)題】,將我們所擁有的力量,以另一種方式貢獻(xiàn)到這次抗疫支援行動(dòng)中。
眾所周知,要贏得這場(chǎng)瘟疫戰(zhàn)勝利的關(guān)鍵,一方面在于通過(guò)確診從而嚴(yán)密控制疫情擴(kuò)散;另一方面則是特效疫苗的成功研制。而整個(gè)過(guò)程中,無(wú)論是病毒基因檢測(cè),還是疫苗研發(fā),都需要大量的時(shí)間。
以前在面對(duì)疫情時(shí),我們的醫(yī)者只能通過(guò)人工進(jìn)行長(zhǎng)時(shí)間的反復(fù)研究、反復(fù)修改、反復(fù)檢測(cè),然后獲得預(yù)期的疫苗,但現(xiàn)在我們有了 AI——這一能夠?qū)A繑?shù)據(jù)進(jìn)行精密計(jì)算的得力助手,這將大大有利于我們提高研究效率,更快取得這場(chǎng)沒(méi)有硝煙戰(zhàn)爭(zhēng)的勝利!
圖片來(lái)源:CNBC 所有者:CNBC
根據(jù)各個(gè)機(jī)構(gòu)公布的數(shù)據(jù),新型冠狀病毒全基因組序列全長(zhǎng) 29847bp,是基因組序列最長(zhǎng)的病毒之一。而在 2 月 1 日浙江省疾控中心上線的自動(dòng)化全基因組檢測(cè)分析平臺(tái)中,就充分利用了阿里達(dá)摩院研發(fā)的 AI 算法,替代了原有的核酸檢測(cè)方法。
相比之下,AI 檢測(cè)除了將原來(lái)數(shù)小時(shí)的新型冠狀病毒肺炎疑似病例基因分析縮短至半小時(shí),大幅縮短確診時(shí)間之外;還彌補(bǔ)了原有方法只能檢測(cè)到病毒基因局部的局限,能夠更加精準(zhǔn)檢測(cè)出病毒的變異情況。
新型冠狀病毒結(jié)構(gòu)
在傳統(tǒng)的病毒基因分析過(guò)程中,整個(gè)流程涵蓋主要包含了:樣本標(biāo)記、分裝;核酸提??;熒光定量 PCR 體系配制;上機(jī)檢測(cè);數(shù)據(jù)報(bào)告分析。
可以發(fā)現(xiàn),其中的病毒基因的檢測(cè)和分析是兩種不同的工作。據(jù)了解,這次提高檢測(cè)效率的核心則在于將檢測(cè)的結(jié)果進(jìn)行「數(shù)據(jù)化」,然后交由達(dá)摩院開(kāi)發(fā)的算法進(jìn)行分析。
其中阿里達(dá)摩院的一位算法專(zhuān)家在采訪中表示,每次測(cè)序過(guò)程會(huì)產(chǎn)生海量的數(shù)據(jù),基于一系列優(yōu)化的算法,可以加快樣本病例的檢測(cè)速度;在這個(gè)環(huán)節(jié)里,算力和算法同樣重要。
達(dá)摩院算法專(zhuān)家顧斐博士在疾控中心基因檢測(cè)分析現(xiàn)場(chǎng)
而在算法方面,具體而言,在序列比對(duì)過(guò)程中開(kāi)發(fā)者增加了分布式設(shè)計(jì),可以有效提升比對(duì)效率。而在病毒序列拼接階段則用到了分布式設(shè)計(jì)的 de Bruijn 圖算法,從而將病毒拼接的速度由 30 分鐘-1 小時(shí)縮短到 15-30 分鐘。
而且截止目前,檢測(cè)結(jié)果還未出現(xiàn)不準(zhǔn)確的情況;通過(guò)這樣的檢測(cè)方式,甚至變異病毒也能得到精準(zhǔn)的檢測(cè)結(jié)果。它能夠?qū)σ伤撇±牟《緲颖具M(jìn)行全基因組序列分析比對(duì),避免因?yàn)椴《咀儺愒斐傻穆z情況。
新型冠狀病毒的電鏡照片 圖片來(lái)源:中國(guó)疾控中心
通過(guò)這次 AI 抗疫,我們可以看到,AI 檢測(cè)相關(guān)技術(shù)確實(shí)能夠大幅縮短醫(yī)生的工作量,并且提高專(zhuān)業(yè)診斷的效率和準(zhǔn)確性。
本次由 2019-nCoV 病毒引發(fā)的肺炎疫情仍在持續(xù)。因此,AI 研習(xí)社(https://god.yanxishe.com/)重啟「肺炎賽題」,希望大家盡量減少外出,安心在家打比賽、拿獎(jiǎng)金、勤洗手、戴口罩;全國(guó)人民上下一心,共抗疫情。
圖片來(lái)源:AI 研習(xí)社
大賽主頁(yè)提供了「肺炎 X 光片」相關(guān)的數(shù)據(jù)集,包括了訓(xùn)練集 20013 張以及測(cè)試集 6671 張。比賽任務(wù)即:編寫(xiě)相應(yīng)代碼,訓(xùn)練模型正確識(shí)別肺炎 X 光病灶數(shù)量~
開(kāi)始時(shí)間:2020-02-04 09:00:00
結(jié)束時(shí)間:2020-03-05 00:00:00
大賽基礎(chǔ)獎(jiǎng)金池為 5000 元,除了比賽原有的三種獎(jiǎng)項(xiàng)——參與獎(jiǎng)(30%)、突破獎(jiǎng)(20%)、排名獎(jiǎng)(50%);AI 研習(xí)社春節(jié)紅包活動(dòng)仍在繼續(xù),邀請(qǐng)好友參賽得獎(jiǎng)金,獎(jiǎng)金直接劃入個(gè)人賬戶(hù),視同比賽獎(jiǎng)金。以上四種獎(jiǎng)項(xiàng)均互不沖突哦!
數(shù)據(jù)集部分圖片示例
數(shù)據(jù)集下載鏈接:
春節(jié)紅包活動(dòng):
最終提交結(jié)果文件如下所示,其中,第一個(gè)字段位:測(cè)試集圖片 ID(注意 ID 即文件名是從 0 開(kāi)始的);第二個(gè)字段:病灶數(shù)量(0、1、2、3、4)。
Ps:建議使用 UTF-8(BOM)編碼,共計(jì) 6671 個(gè)結(jié)果,數(shù)量不足可能導(dǎo)致無(wú)法評(píng)分哈~
整個(gè)比賽的評(píng)審?fù)耆该骰?,我們將?huì)對(duì)比選手提交的結(jié)果文件,按照如下公式計(jì)算得分,其中:
True:模型分類(lèi)正確數(shù)量
Total :測(cè)試集樣本總數(shù)量
每日 24:00,我們也會(huì)將最新結(jié)果更新在官網(wǎng)排行榜上。眾志成城,武漢加油!
雷鋒網(wǎng) AI 開(kāi)發(fā)者 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。