丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
AI+ 正文
發(fā)私信給張利
發(fā)送

1

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

本文作者: 張利 2017-05-19 09:38 專題:雷峰網(wǎng)公開課
導(dǎo)語:對(duì)于人類基因組,我們可能認(rèn)識(shí)了不少單詞,粗略地理解了語法,但還完全不懂?dāng)嗑?,我們?duì)整篇文章一無所知

隨著基因測(cè)序價(jià)格以超摩爾定律的勢(shì)態(tài)下降,其被廣泛應(yīng)用于基因組學(xué)研究、臨床診斷以及多種疾病個(gè)性化治療等領(lǐng)域。對(duì)此,業(yè)內(nèi)人士認(rèn)為,當(dāng)今基因測(cè)序行業(yè)面臨最大的挑戰(zhàn)已不再是基因測(cè)序技術(shù),而是處理巨大的數(shù)據(jù)量以及如何從巨大數(shù)據(jù)中獲取臨床指導(dǎo)。據(jù)雷鋒網(wǎng)了解,生物信息分析服務(wù)是目前業(yè)界公認(rèn)的最具發(fā)掘潛力以及盈利能力的環(huán)節(jié),但目前國內(nèi)還處于起步階段。

那么,基因數(shù)據(jù)與其他數(shù)據(jù)有何異同?處理基因數(shù)據(jù)又何難點(diǎn)和挑戰(zhàn)?基因數(shù)據(jù)的未來是怎樣的?本次公開課,雷鋒網(wǎng)AI掘金志欄目邀請(qǐng)了華大基因研發(fā)中心副總監(jiān)金鑫,帶來《基因大數(shù)據(jù)簡(jiǎn)史——起源、現(xiàn)狀和未來》的主題演講。

嘉賓介紹:

華大股份研發(fā)中心副總監(jiān)、BGI Online平臺(tái)負(fù)責(zé)人金鑫,華大基因的青年科學(xué)家。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

金鑫曾參與了一系列重大科研項(xiàng)目攻堅(jiān),包括國際千人基因組計(jì)劃、中丹糖尿病基因組計(jì)劃、人類泛基因組圖譜計(jì)劃、高原基因組計(jì)劃,及自閉癥基因組計(jì)劃等。早在2009年,金鑫就以在校生的身份在《Nature》子刊《Nature Biotechnology》發(fā)表《構(gòu)建人類泛基因組序列圖譜》,并首次提出了“人類泛基因組”概念。

公開課視頻:

(注:本次公開課中,金鑫博士展示有趣的案例,并回答多個(gè)網(wǎng)友精彩問題,所以推薦優(yōu)先觀看視頻。)


以下是金鑫博士演講內(nèi)容,雷鋒網(wǎng)做了不改變?cè)獾木庉嫞?/em>

我是金鑫,來自華大基因,我現(xiàn)在是華大股份研發(fā)中心副總監(jiān),同時(shí)也是BGI Online和大數(shù)據(jù)專項(xiàng)的負(fù)責(zé)人。今天我想跟大家分享的題目是基因數(shù)據(jù)起源、傳承與演化。

我們都說基因是上帝的語言,在說基因之前,我先給大家看一塊石碑,這塊石碑叫羅塞塔石碑,已經(jīng)保存了2200多年,大約是公元前197年制作的,其上面刻有多種語言:希臘文字、埃及象形文字、也有當(dāng)時(shí)埃及的民間文字、羅馬文字。實(shí)際上,石碑是迄今為止已知的保存信息最長久的一種載體。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

我們身體里有很多細(xì)胞,每個(gè)細(xì)胞里都有一個(gè)完整的基因組,基因組上所承載信息的載體是ATCG這四個(gè)非常簡(jiǎn)單的基本單元,我們稱之為堿基。從地球上有生命起,絕大部分已知的地球生物都是通過DNA的形式來承載我們生命的全部秘密,但所謂的承載和傳遞并不是只做一次記錄,更多的是通過不斷的復(fù)制把它傳遞下去,而且傳遞過程并不是非常精確的完整復(fù)制過程,這使得如今整個(gè)地球上的物種成千上萬、豐富多彩。

基因的起源

很多年前,人類就開始了讀基因天書的努力。

在20世紀(jì),人類有三大科學(xué)創(chuàng)舉:1945年的曼哈頓原子彈計(jì)劃、1969年的阿波羅登月計(jì)劃和2000年前后完成的人類基因組計(jì)劃。

從一開始,我們就是人類基因組計(jì)劃中的一份子,當(dāng)時(shí)一共有6個(gè)國家參加,美、英、法、德、日、中,中國是唯一一個(gè)參與人類基因組計(jì)劃的發(fā)展中國家。1999年9月9日,華大基因?yàn)橥瓿扇祟惢蚪M計(jì)劃中國部分那個(gè)1%而成立的。當(dāng)時(shí)要去讀取人的基因數(shù)據(jù),需要做一個(gè)完整的人類基因參考序列,就像一個(gè)地圖導(dǎo)航坐標(biāo)系一樣,這其實(shí)是非常困難的。6個(gè)國家成百上千科學(xué)家花費(fèi)了13年時(shí)間和30億美金才完成了第一個(gè)人的基因組測(cè)序,當(dāng)然,這個(gè)過程中,也帶來很多相關(guān)學(xué)科、技術(shù)和產(chǎn)業(yè)的發(fā)展。我想給大家講的是,2000年之前,讀一個(gè)人的基因數(shù)據(jù)要耗巨資需要十幾年的時(shí)間。

如今,是一個(gè)數(shù)據(jù)的時(shí)代,一個(gè)互聯(lián)網(wǎng)的時(shí)代,一個(gè)智能的時(shí)代,而所有這一切的核心是我們今天講的數(shù)據(jù)。

相比其他數(shù)據(jù),基因數(shù)據(jù)的產(chǎn)生有很多特別的地方,基因數(shù)據(jù)的獲取需要一個(gè)特別的設(shè)備——基因測(cè)序儀。2015年10月份,中國第一款的國產(chǎn)自主知識(shí)產(chǎn)權(quán)的基因測(cè)序儀問世,這就是華大研發(fā)的。

其實(shí),過去幾十年,如同很多的高精尖醫(yī)療設(shè)備和其他大型設(shè)備一樣,基因測(cè)序儀其實(shí)大部分依賴進(jìn)口。而如今,全球只有兩個(gè)國家三家公司能夠量產(chǎn)臨床級(jí)別的基因測(cè)序儀,兩個(gè)國家是美國和中國,三家公司是illumina、賽默飛世爾和中國的華大基因。

很多人都非常熟悉摩爾定律,價(jià)格不變時(shí),集成電路上容納晶體管數(shù)量18個(gè)月增加一倍。而在2007年前后,基因測(cè)序技術(shù)的大突破使得基因測(cè)序成本飛速下降,下降速度甚至超過了摩爾定律的斜率。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

這個(gè)圖是截止到2011年的1月份的,而如今,這條線已經(jīng)基本上跟坐標(biāo)軸的最底部平齊,也就是說讀取一個(gè)人的基因數(shù)據(jù)成本已經(jīng)低于一千美金了。我們相信隨著技術(shù)的進(jìn)一步提升、生產(chǎn)進(jìn)一步規(guī)?;覀冞€有機(jī)會(huì)把它變得更便宜。

基因數(shù)據(jù)與很多其他數(shù)據(jù)有一個(gè)很大的不同點(diǎn):獲取單位數(shù)據(jù)成本依然較高。淘寶有電商數(shù)據(jù)、百度有搜索數(shù)據(jù)、滴滴打車有出行數(shù)據(jù),這些是在大家使用的過程伴生的,我們可以認(rèn)為這些數(shù)據(jù)產(chǎn)生的邊際成本幾乎為0,但是基因數(shù)據(jù)的產(chǎn)生需要專門的操作,通過抽血或取唾液,從中提出DNA,經(jīng)過專門的基因測(cè)序設(shè)備,最終才能夠得到基因數(shù)據(jù)。所以,如果基因數(shù)據(jù)要像其他數(shù)據(jù)一樣被人人所接觸、為人人的健康服務(wù),那么其獲取成本應(yīng)進(jìn)一步降低,獲取速度進(jìn)一步加快。

2003年,我們完成了第一個(gè)人基因組測(cè)序,從2006年左右開始,有人獲得了自己完整的基因組數(shù)據(jù),其中就有DNA雙螺旋結(jié)構(gòu)發(fā)現(xiàn)者沃森。2008年左右,第一次獲取了亞洲人的基因數(shù)據(jù)圖譜,后來日本人、韓國人、非洲人等的基因數(shù)據(jù)也不斷被解碼出來,但當(dāng)時(shí),有自己個(gè)人基因組數(shù)據(jù)的人幾乎沒有,2010年開始,有非常多大型科研項(xiàng)目啟動(dòng),全球很多人有了自己的基因數(shù)據(jù)。保守估計(jì),有自己基因數(shù)據(jù)的人已經(jīng)超過了數(shù)百萬,我覺得這是令人非常興奮的事情,因?yàn)閷?duì)于基因數(shù)據(jù),我們?cè)?jīng)是一無所知的,但是從過去十年開始,基因數(shù)據(jù)非??焖俚乇猾@取和積累起來。

傳承

英國皇室家庭曾經(jīng)有人攜帶一個(gè)非常嚴(yán)重的遺傳病的基因——血友病,這種基因的突變會(huì)導(dǎo)致其凝血能力發(fā)生障礙,同時(shí)皇室家族又講究血統(tǒng)的純正,所以血友病在這個(gè)家族代代相傳,如今這一代的英國皇室已經(jīng)基本上沒有人是血友病致病基因的攜帶者了,但是歐洲很多其他的皇室家族中依然有血友病基因存在,這就是基因數(shù)據(jù)代代相傳。把自己的基因傳遞下去,其實(shí)是每一個(gè)個(gè)體、每一個(gè)物種的最基本本能,基因傳遞了我們所有的各種各樣的特征,也包括了致病基因。

遺傳是代代相傳,但同時(shí)也有一母生九子,九子各不同,生命傳遞的過程中有變異存在的可能性,而這個(gè)變異所帶來的風(fēng)險(xiǎn)其實(shí)是每個(gè)人都可能會(huì)遇到的每個(gè)人都可能會(huì)遇到的。

我們之前做過一個(gè)自閉癥科研項(xiàng)目,其中選取的自閉癥樣本都是父母雙方正常,但是他們的孩子卻很明確地判定是自閉癥,基因檢測(cè)發(fā)現(xiàn)父母雙方?jīng)]有任何奇怪的基因。關(guān)于孩子發(fā)生嚴(yán)重的疾病原因,后來有很多專家說是父母雙方將其基因傳遞給子代時(shí),后代的基因更多來自于父方。男性跟女性的生殖策略是非常不同的,女性一生中卵子的數(shù)目是確定的,大約每月排出一個(gè)卵子直到絕經(jīng),但是男性從有生育能力開始就在大量的復(fù)制精子,以量取勝,成千上萬、甚至上億顆精子不斷的被生產(chǎn)出來,而精子復(fù)制過程中發(fā)生新突變的可能性比卵子要大很多。

我們?cè)?jīng)做過一個(gè)觀測(cè),我們找到了很多家庭,把這個(gè)父親的年齡作為一個(gè)自變量,觀測(cè)父親年齡跟孩子基因中發(fā)生新變異的數(shù)量的關(guān)系,發(fā)現(xiàn)一個(gè)明顯的正相關(guān)關(guān)系,據(jù)當(dāng)時(shí)估算,父親的年齡每增加一歲,孩子就有可能會(huì)增加一個(gè)左右的新突變。人類基因組數(shù)量很大,基因突變可能發(fā)生在任何的位置,可能在絕大部分位置的小突變,不會(huì)有什么問題,但是如果不幸,突變發(fā)生在很重要位置上,那么孩子就有患病的風(fēng)險(xiǎn)。

那么,為什么生命數(shù)據(jù)要這樣呢?為了把基因數(shù)據(jù)傳遞下去,相對(duì)更精確得復(fù)制、產(chǎn)生的錯(cuò)誤更少一些不是更好嗎?

如果我們從整個(gè)物種的角度講,對(duì)此的考慮就可能會(huì)很不一樣。在某種程度上,新突變?cè)黾恿宋锓N基因多樣性。如果基因多樣性變得單一,那么物種繼續(xù)發(fā)展下去就變得比較困難。

舉一個(gè)非常簡(jiǎn)單的例子,廣東、廣西和海南省地中?;驍y帶率相對(duì)較高,這是有原因的,這是人類生存過程一種與環(huán)境的妥協(xié),地中海貧血基因一開始是在地中海沿岸發(fā)現(xiàn)的,而地中海貧血大都發(fā)生在這個(gè)維度上,原因是這樣的,很久之前,在這種維度的自然和氣象環(huán)境之下,瘧疾高發(fā),一旦患病非常嚴(yán)重會(huì)導(dǎo)致死亡,而地中海貧血致病基因攜帶者對(duì)瘧疾有一定的抗性,在人類還沒有別的手段控制瘧疾時(shí),這種基因攜帶者有生存優(yōu)勢(shì),最終,導(dǎo)致地中海貧血致病基因在這些地區(qū)大量傳開了。

如今,我們經(jīng)常會(huì)被問到,是不是攜帶某種壞基因?但什么是好基因,什么是壞基因呢?從根本上講,基因沒有好壞之分,只有多樣性。這種多樣性導(dǎo)致有些人由于基因突變看起來與我們不一樣,但這其實(shí)為人類生存贏得一種新的可能性,比如環(huán)境、氣象和地質(zhì)條件發(fā)生大規(guī)模的變化,或整個(gè)食物結(jié)構(gòu)發(fā)生巨變等,這時(shí)如果說人類基因都非常相似的話,那人類這個(gè)物種生存的可能性就會(huì)大大降低。

基因科技&未來

那么,對(duì)于嚴(yán)重遺傳病、腫瘤、傳染病等,科技能做什么呢?

從生育角度,像地中海貧血這樣的遺傳病可以在寶寶出生之前進(jìn)行產(chǎn)前檢查,尤其是在高發(fā)地區(qū),甚至在備孕之前就可以去做基因檢測(cè),進(jìn)行相應(yīng)的準(zhǔn)備并接受指導(dǎo)。如果檢查結(jié)果是父母雙方攜帶同樣的遺傳病致病基因,可以進(jìn)行相應(yīng)的干預(yù),比如植入胚胎,選擇沒有攜帶致病突變或說不會(huì)引起疾病的基因拷貝的胚胎做植入,如果成功受孕,寶寶就肯定是健康的。另外還有不孕不育的問題,一部分不育是因?yàn)榱?xí)慣性流產(chǎn),其中一大部分與基因有關(guān),可以通過基因檢測(cè)發(fā)現(xiàn)和預(yù)防。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

如今,我們做的最多的是無創(chuàng)產(chǎn)前檢查,用于篩查21-三體綜合癥。未來,我相信每個(gè)寶寶出生時(shí)都會(huì)做一個(gè)基因檢測(cè),讀取其基因數(shù)據(jù),用于疾病預(yù)防和用藥指導(dǎo)。

如今,我們還面臨很多其它挑戰(zhàn),比如腫瘤。腫瘤最重要的是預(yù)防,當(dāng)處于腫瘤中晚期發(fā)現(xiàn)時(shí),治療辦法是非常有限的,如果能早發(fā)現(xiàn)、早期篩查并且輔以個(gè)性化藥物的話,能有效控制病情甚至未來可能治愈。我們現(xiàn)在知道腫瘤是一種基因病,是環(huán)境和基因共同導(dǎo)致的?;驒z測(cè)不僅僅意味著早期篩查,同時(shí)這項(xiàng)技術(shù)對(duì)藥物研發(fā)也有重要作用,比如對(duì)腫瘤細(xì)胞進(jìn)行基因檢測(cè),找到其特異性的標(biāo)靶序列,把這些序列添加到經(jīng)過加工的免疫細(xì)胞上,將這個(gè)免疫細(xì)胞注入身體中,這種技術(shù)能在一定程度上治療腫瘤。

大家可能對(duì)SARS記憶猶新,在非典病人的組織液、血液等提取病原體,進(jìn)行基因檢測(cè),能確定病原體類型。如今,我們基本能做到,對(duì)于絕大部分已知的病原微生物,我們不僅可以知道它是什么,而且可以知道其有沒有抗藥性、對(duì)某種抗生素是否有抗性等。

那么,基因技術(shù)能做什么?

精準(zhǔn)醫(yī)療人人都在講,但精準(zhǔn)醫(yī)療的基礎(chǔ)是基因數(shù)據(jù)。2016年,這三家公司都積累了100多萬人的部分基因數(shù)據(jù),所謂部分基因數(shù)據(jù),是通過基因芯片技術(shù),讀取部分?jǐn)?shù)據(jù)得到某方面的基因信息。

華大基因也積累了很多數(shù)據(jù),到2016年4月份時(shí),僅僅無創(chuàng)產(chǎn)篩這個(gè)項(xiàng)目就做了100萬人,但我們是通過全基因組數(shù)據(jù)測(cè)序獲取數(shù)據(jù)的,所以盡管樣本量差不多,我們的數(shù)據(jù)量級(jí)是遠(yuǎn)遠(yuǎn)超過他們的。而到現(xiàn)在,華大基因的數(shù)據(jù)量至少已經(jīng)翻倍了。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

2001~2015年,基因數(shù)據(jù)產(chǎn)生是大型研究機(jī)構(gòu)推動(dòng)的,2015年之后,研究機(jī)構(gòu)和企業(yè)有了很多基因檢測(cè)的應(yīng)用,從研究項(xiàng)目驅(qū)動(dòng)轉(zhuǎn)為研究項(xiàng)目和應(yīng)用共同驅(qū)動(dòng),基因數(shù)據(jù)的積累速度肯定會(huì)加速的。

但隨著基因數(shù)據(jù)積累,讀懂基因這本天書的重要性和難點(diǎn)就凸顯出來了。

對(duì)于人類基因組,我們可能認(rèn)識(shí)了不少單詞,粗略地理解了語法,但還完全不懂?dāng)嗑洌晕覀儗?duì)整篇文章一無所知,我們對(duì)基因的了解還處在非常早期階段,我們可以從簡(jiǎn)單的物種開始做起,比如最簡(jiǎn)單的生命、病毒等,但依然有非常多的挑戰(zhàn),但我認(rèn)為,大數(shù)據(jù)和人工智能/機(jī)器學(xué)習(xí)將會(huì)為其帶來突破。

華大基因BGI Online負(fù)責(zé)人金鑫主講:基因大數(shù)據(jù)的起源、現(xiàn)狀與未來| 雷鋒網(wǎng)公開課

基因數(shù)據(jù)與其它數(shù)據(jù)有區(qū)別,獲取數(shù)據(jù)的成本比較高,同時(shí)數(shù)據(jù)量大。若用現(xiàn)在的技術(shù),若要將基因數(shù)據(jù)讀得準(zhǔn)確,需要讀很多份并組合起來,才能知道其排列,一般要讀30次,腫瘤研究中,有時(shí)候會(huì)測(cè)幾百次甚至幾千次。每個(gè)人的基因數(shù)據(jù)至少有100G的原始數(shù)據(jù),如果把全中國人的基因數(shù)據(jù)全都讀出來,怎么存、怎么處理就是一個(gè)很大的問題。

我們知道了基因數(shù)據(jù),也知道其最終的表現(xiàn),隨著數(shù)據(jù)增多,我們就有可能理解基因數(shù)據(jù),這其中會(huì)用到人工智能技術(shù)。但以我們目前處理信息和數(shù)據(jù)的能力,理解、解讀、歸納和總結(jié)基因數(shù)據(jù)的挑戰(zhàn)非常大。但如今人工智能技術(shù)有很大的突破,加上愈來愈便宜的數(shù)據(jù)產(chǎn)出,我們認(rèn)為這件事未來是美好的。

科學(xué)發(fā)現(xiàn)推動(dòng)了技術(shù)發(fā)明,技術(shù)發(fā)明帶動(dòng)了產(chǎn)業(yè)發(fā)展,三個(gè)齒輪互相聯(lián)動(dòng),科學(xué)發(fā)現(xiàn)是核心。本質(zhì)上,我們要把科學(xué)問題轉(zhuǎn)化成技術(shù)問題,技術(shù)問題轉(zhuǎn)化為經(jīng)濟(jì)問題。馬斯克最近說到99%的科研論文都是沒用的,他表達(dá)的意思與此類似,科研只是進(jìn)行了探索和驗(yàn)證,最終還需要工程上的落地。

那華大做了什么呢?我們希望將單個(gè)基因讀取的成本降至極限,這意味著每個(gè)人有更大可能性獲取自己的基因數(shù)據(jù),同時(shí)基因數(shù)據(jù)與個(gè)人的關(guān)系也會(huì)更大。同時(shí),我們?cè)谠贫俗龌驍?shù)據(jù)分析——即華大基因BGI平臺(tái),希望把基因數(shù)據(jù)分析的成本降至極限,通過與阿里云合作,基因數(shù)據(jù)分析的成本已經(jīng)降至100元以內(nèi)了。

物理、數(shù)學(xué)中都有很多定理和公式,但生物學(xué)中沒有,希望隨著生命數(shù)據(jù)積累越來越多和分析技術(shù)的逐步提升,生命科學(xué)也能有一個(gè)核心公式。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

我是雷鋒網(wǎng)醫(yī)療科技編輯,歡迎與我交流:zhangli@leiphone.com
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄