0
本文作者: 楊玲俐 | 2023-03-31 17:10 |
蛋白質(zhì)相互作用(PPI)可以說是人體最重要的分子事件之一,事關(guān)人體生長發(fā)育、新陳代謝,是疾病治療干預(yù)的重要來源,PPI失調(diào)會導(dǎo)致癌癥等疾病發(fā)生,因而該領(lǐng)域也是醫(yī)藥行業(yè)關(guān)注的研究熱點(diǎn)。
為了更好地預(yù)測和解讀PPI,并深入挖掘相關(guān)分子信息,2023年3月,騰訊 AI Lab 聯(lián)合香港科技大學(xué)、中國科學(xué)院大學(xué)相關(guān)團(tuán)隊(duì),將深度學(xué)習(xí)領(lǐng)域的層次圖學(xué)習(xí)技術(shù)引入PPI研究,提出了一種雙視圖層次圖學(xué)習(xí)模型(HIGH-PPI),模型被證明在PPI研究中具有更高的預(yù)測準(zhǔn)確性和更好的可解釋性,研究成果在知名國際學(xué)術(shù)期刊《自然-通訊》(Nature Communications)發(fā)表。
人類蛋白質(zhì)組學(xué)數(shù)據(jù)分析表明,人體的PPI網(wǎng)絡(luò)涉及約65萬個(gè)相關(guān)接觸位點(diǎn)。處理這樣量級的數(shù)據(jù),人工智能的效率要明顯高于人類,相關(guān)技術(shù)引入可以更加高效、準(zhǔn)確地幫助人們找出重要信息,促進(jìn)靶向藥物的開發(fā)和癌癥等疾病的治療。
圖:蛋白質(zhì)結(jié)構(gòu)和網(wǎng)絡(luò)結(jié)構(gòu)都對PPI的準(zhǔn)確預(yù)測至關(guān)重要。(a)蛋白質(zhì)序列通常能提供關(guān)于PPI的細(xì)節(jié)信息,但它也可能導(dǎo)致PPI的預(yù)測準(zhǔn)確性降低,例如不具備序列相似性的兩個(gè)蛋白質(zhì)(SERPINA1、3)可能和同一蛋白質(zhì)(ELANE)在相同作用界面發(fā)生PPI;(b)包含網(wǎng)絡(luò)結(jié)構(gòu)信息的PPI,將蛋白質(zhì)區(qū)分為不同的社區(qū),社區(qū)內(nèi)的蛋白質(zhì)之間存在密集的交互,而社區(qū)之間通常只有微弱的連結(jié);(c)HIGH-PPI具備雙視圖層次,頂視圖包含網(wǎng)絡(luò)結(jié)構(gòu)信息,底視圖包含蛋白質(zhì)結(jié)構(gòu)信息。
這項(xiàng)研究是騰訊 AI Lab 對PPI層次問題建模的首次嘗試,得到了審稿人的高度評價(jià),被視為生物信息領(lǐng)域一項(xiàng)富有潛力的創(chuàng)新貢獻(xiàn),文章也得到了學(xué)界的認(rèn)可,被選入《自然-通訊》年度編輯精選文章合集。
HIGH-PPI模型是騰訊在AI+生命科學(xué)研究領(lǐng)域的最新研究成果,此前,團(tuán)隊(duì)在蛋白質(zhì)相關(guān)的藥物發(fā)現(xiàn)領(lǐng)域已經(jīng)取得諸多領(lǐng)先成果,發(fā)表多項(xiàng)關(guān)于蛋白質(zhì)結(jié)構(gòu)-功能關(guān)系研究的文章,如蛋白質(zhì)高精度結(jié)構(gòu)模型、疾病分類、蛋白動力學(xué)建模以及蛋白質(zhì)組學(xué)數(shù)據(jù)等。
長期以來,騰訊 AI Lab 致力于推動AI技術(shù)與各行業(yè)的結(jié)合,在研究與應(yīng)用并重發(fā)展的策略下,騰訊AI Lab關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、語音技術(shù)及自然語言處理四大方向,持續(xù)探索AI在工業(yè)、農(nóng)業(yè)、醫(yī)療、醫(yī)藥、生命科學(xué)等領(lǐng)域的研究應(yīng)用。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。