1
本文作者: 李旭旭 | 2014-12-18 22:20 |
近日,遺傳學(xué)家與程序員組成基因組學(xué)與健康全球聯(lián)盟,聯(lián)合開發(fā)互聯(lián)網(wǎng)DNA信息交互的協(xié)議。這一成果將可與HTTP傳輸協(xié)議對網(wǎng)絡(luò)的重要性相比。
團(tuán)隊展示的第一個成果為是一個簡單的搜索引擎,它將儲存在9處的包含數(shù)千人類基因組的DNA文獻(xiàn)進(jìn)行梳理,其中就包括了Google的服務(wù)器群。團(tuán)隊表示,這個搜索引擎是DNA網(wǎng)絡(luò)的開端,并最終將無數(shù)基因組連接在一起。
此前,由于基因組數(shù)據(jù)大多儲存在私人數(shù)據(jù)庫中,受法律許可協(xié)議所限制,也受限于隱私權(quán)的桎梏,部分科學(xué)家出于對自身科研的保護(hù),自私地將數(shù)據(jù)私有,基因信息無法得到共享。因此50名科學(xué)家在萬維網(wǎng)聯(lián)盟(W3C)之后,組成了這個聯(lián)盟。
團(tuán)隊的研究成果可以說是一種可以交換基因信息的互聯(lián)網(wǎng)語言。
現(xiàn)在正在開發(fā)的是應(yīng)用程序接口API,可以使不同基因數(shù)據(jù)庫之間實現(xiàn)信息交互。將不同的基因信息綜合起來,有助于加快發(fā)現(xiàn)基因是如何影響人體,并幫助醫(yī)生通過將擁有疑似基因突變的兒童與已有病例進(jìn)行比對,診斷罕見的先天畸形。
由于基因解碼的成本降低,近兩千美元就可以測量基因數(shù)據(jù),而現(xiàn)在是時候采取一些行動了,發(fā)揮數(shù)據(jù)價值了。
由于遺傳學(xué)家需要搜索更多的人的基因信息,因此基因組數(shù)據(jù)的儲存成為一大難題。他們用一百萬名志愿者的DNA信息來搜索有關(guān)精神分裂癥、糖尿病以及其他疾病的相關(guān)基因。然而即使已有這么多的數(shù)據(jù)仍不足以發(fā)現(xiàn)什么遺傳規(guī)律。科研需要成千上萬的基因組信息,另外也沒有任何獨立的數(shù)據(jù)庫足夠大。
而解決的方法就是網(wǎng)絡(luò),它能為科學(xué)家獲取數(shù)據(jù)庫開辟了一條途徑。目前,團(tuán)隊已經(jīng)著手將全球最大的乳腺癌BRCA1,與BRCA2基因信息數(shù)據(jù)庫連接起來,還包括九個可能導(dǎo)致罕有兒童疾病基因的獨立數(shù)據(jù)庫。
團(tuán)隊將會陸續(xù)公布這款軟件,希望使得任何科學(xué)家能對任何實驗室擁有的基因數(shù)據(jù)進(jìn)行共享,不用受到技術(shù)壁壘及隱私權(quán)的限制。
今年三月,團(tuán)隊開始了一項測試,看科研機(jī)構(gòu)是否愿意共享數(shù)據(jù)。一個取名Beacon的產(chǎn)品使得數(shù)據(jù)庫擁有者將數(shù)據(jù)嚴(yán)格限定在幾個搜索引擎內(nèi)分享。目前為止,Beacon適用于15個數(shù)據(jù)庫,其中三個為Google擁有的公共基因組。
未來會有一種協(xié)議可以搜索到更多數(shù)據(jù),但是并不是以任意的方式??茖W(xué)家們必須要注冊或者甚至簽署協(xié)議合同。如果想要獲取全部的基因組,用戶還需要輸入聯(lián)系方式。
同時這項聯(lián)盟正在推進(jìn)的一個變化是一種新的知情同意書,列出了交出基因組的志愿者的權(quán)力。這份同意書涵蓋的內(nèi)容比大多數(shù)更多,比如可允許全球研究者受控方位,此外還保證研究者不會通過基因組透露參與者的身份信息。
via mit
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。