丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
醫(yī)療科技 正文
發(fā)私信給嘉嘉
發(fā)送

0

騰訊研究成果登《Nature》子刊:「scBERT」模型攻克單細(xì)胞測(cè)序數(shù)據(jù)分析痛點(diǎn)

本文作者: 嘉嘉 2022-09-28 15:05
導(dǎo)語(yǔ):AI算法有何解法?

9月27日,騰訊在人工智能、生命科學(xué)跨學(xué)科應(yīng)用領(lǐng)域的最新研究成果《scBERT as a Large-scale Pretrained Deep Language Model for Cell Type Annotation of Single-cell RNA-seq Data》(《基于大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的單細(xì)胞轉(zhuǎn)錄組細(xì)胞類(lèi)型注釋算法》),登上國(guó)際頂級(jí)學(xué)術(shù)期刊《Nature》子刊《Nature Machine Intelligence》。 

據(jù)了解,《Nature Machine Intelligence》只關(guān)注對(duì)該領(lǐng)域具有重要影響的科研成果。因其嚴(yán)格的評(píng)審標(biāo)準(zhǔn),每年收錄論文數(shù)量平均僅60篇左右。目前該期刊在計(jì)算機(jī)科學(xué)、人工智能領(lǐng)域期刊中排名第一。 

騰訊在論文中創(chuàng)新性地提出關(guān)于單細(xì)胞注釋的“scBERT”算法模型,受到《Nature Machine Intelligence》雜志評(píng)審高度認(rèn)可,表示該成果對(duì)于單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析領(lǐng)域未來(lái)研究具有深遠(yuǎn)意義。

單細(xì)胞測(cè)序技術(shù)是生命科學(xué)領(lǐng)域的一項(xiàng)革命性技術(shù),可以細(xì)粒度地觀察和刻畫(huà)各個(gè)物種中組織、器官和有機(jī)體中單細(xì)胞分子圖譜(細(xì)胞表達(dá)),便于更好地了解腫瘤微環(huán)境,以達(dá)到精細(xì)分析病因、精準(zhǔn)匹配治療方案的效果,對(duì)于“精準(zhǔn)醫(yī)療”具有極高的應(yīng)用價(jià)值。

值得注意的是,受數(shù)據(jù)樣本量小、人工干預(yù)多、過(guò)度依賴(lài)marker gene(已報(bào)道的特異性基因)等因素的影響,單細(xì)胞測(cè)序細(xì)胞類(lèi)型注釋技術(shù)一直面臨著泛化性、可解釋性、穩(wěn)定性均比較低的問(wèn)題,現(xiàn)存的算法難以有更廣泛的應(yīng)用。

針對(duì)以上問(wèn)題,論文中首次提出“基于大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的單細(xì)胞轉(zhuǎn)錄組細(xì)胞類(lèi)型注釋算法”,即“scBERT”模型,首次將“transformer”(自然語(yǔ)言處理算法經(jīng)典計(jì)算單元)運(yùn)用到單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析領(lǐng)域。

該模型基于BERT范式,將細(xì)胞中基因的表達(dá)信息轉(zhuǎn)化成可被計(jì)算機(jī)理解、學(xué)習(xí)的“語(yǔ)言”,并對(duì)細(xì)胞進(jìn)行精準(zhǔn)標(biāo)注。

為了保證全基因組內(nèi)基因級(jí)別的可解釋性,“scBERT”在預(yù)訓(xùn)練數(shù)據(jù)上沒(méi)有做任何的降維或篩選處理,最大程度上保留數(shù)據(jù)本身的特性和信息。

此外,該模型復(fù)用了大規(guī)模的公開(kāi)數(shù)據(jù)集,包含不同實(shí)驗(yàn)來(lái)源、批次和組織類(lèi)型的單細(xì)胞數(shù)據(jù),以保證模型能學(xué)習(xí)到更為“通用”的知識(shí),精準(zhǔn)捕獲單個(gè)基因的表達(dá)信息及兩兩基因之間的作用關(guān)系。

從結(jié)果上來(lái)看,“scBERT”模型實(shí)現(xiàn)了高解釋性、高泛化性、高穩(wěn)定性的單細(xì)胞類(lèi)型注釋技術(shù)。

截至目前,通過(guò)了9個(gè)獨(dú)立數(shù)據(jù)集、超過(guò)50萬(wàn)個(gè)細(xì)胞、覆蓋17種主要人體器官和主流測(cè)序技術(shù)組成的大規(guī)模benchmarking測(cè)試數(shù)據(jù)集上,該算法模型的優(yōu)越性均得以驗(yàn)證。

其中,在極具挑戰(zhàn)的外周血細(xì)胞亞型細(xì)分任務(wù)上,相較現(xiàn)有最優(yōu)方法的70%準(zhǔn)確度提升了7%。

在應(yīng)用價(jià)值層面,該項(xiàng)技術(shù)能給細(xì)胞中的每個(gè)基因都印上專(zhuān)屬“身份證”,可用于臨床單細(xì)胞測(cè)序數(shù)據(jù),并輔助醫(yī)生描述準(zhǔn)確的腫瘤微環(huán)境、檢測(cè)出微量癌細(xì)胞,從而實(shí)現(xiàn)個(gè)性化治療方案或者癌癥早篩。

同時(shí),對(duì)疾病致病機(jī)制分析、耐藥性、藥物靶點(diǎn)發(fā)現(xiàn)、預(yù)后分析、免疫療法設(shè)計(jì)等領(lǐng)域都具有極其重要的作用。

此前,騰訊AI Lab團(tuán)隊(duì)科研成果曾多次入選《Nature Communications》、ACL-IJCNLP等國(guó)際權(quán)威期刊,研究方向涵蓋文本理解、文本生成、智能對(duì)話(huà)、機(jī)器翻譯、信息抽取、信息檢索等領(lǐng)域。

未來(lái),騰訊會(huì)繼續(xù)基于自身先進(jìn)AI技術(shù)的積累,與下游臨床、制藥和生命科學(xué)基礎(chǔ)研究領(lǐng)域進(jìn)行密切合作,為行業(yè)貢獻(xiàn)更多價(jià)值。


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)