D总-2

周代星2017中国绿公司年会演讲:用基因大数据创造新未来简史

4月22-24日由中国企业家俱乐部主办的主题为“分化与进化:寻找经济新动能”的“2017中国绿公司年会“在河南郑州举行。本届年会内容丰富,包括创变者专场、焦点论坛、闭门会等多场密集活动,众多重量级嘉宾包含颇具远见的国内知名企业家马云、马蔚华、刘永好、李东生、左晖等,与1000多名参会嘉宾一起,共同探讨中国商业如何实现可持续发展

贝瑞和康CEO周代星出席并在创变者专场以“基因,疾病,测序和健康大数据”为题进行了演讲。

D总-2

周代星介绍,人类的23对染色体各司其职,如同一本书的23个章节,每个章节都起着非常重要的作用,有的基因突变直接和一些疾病有关,有的突变则影响到人的性格,比如,有的会使人变得懒惰,有的则使人喜欢冒险、追求刺激。
科学研究也表明,实际上确实有一些基因会给人类似“超人”的能力,现在发现有5种基因与此有关。有的能让人表现为耐受力更强,更精力旺盛,有的基因突变后,人只需要四小时的睡眠就够了。
他表示,现在的无创检测技术,可以把所有遗传疾病,在小孩出生前查出来,只要能承担这个成本。从某种程度上,肿瘤比胎儿更容易做。因为从第一个细胞变成肿瘤细胞,到能被影像学识别的肿瘤,一般情况下差不多要十年左右,如果检测手段非常准确的话,有足够长时间把这些肿瘤查出来。
以下为发言实录:
基因究竟是什么?在座的各位可能多多少少有点了解,但怎么定义这个?其实在人类的知识发展过程中花了很长时间才对这个有所认识,我们今天讲的比较清楚是因为前人的很多工作。
这张图显示了人类从一个机体变到最细的基因的整个过程,人类有37万亿个细胞,细胞起着各种各样的功能。除了一些比较特殊的细胞之外,每一个细胞都有一个细胞核,细胞核里有染色体,类似弹簧,染色体不断拉伸后能看到双螺旋的DNA,DNA由GATC组成。
幻灯片2基因是什么?基因就是DNA里面的一个片断,有大有小,大到80万个碱基,小到几十个碱基。基因是一个功能单位,人类的基因组织成23对染色体,每一个染色体就是刚说的一个弹簧。

23对染色体的发现其实不是那么简单。在1955年之前,整个人类认为我们有48条染色体。1955年12月22号,华裔科学家蒋有兴教授在瑞士做研究的时候,发现人类的染色体实际上只有23对,总共只有46条,从那之后,染色体就得到了各种各样的关注和研究。幻灯片3到现在,我们后面会提到的人类基因组测序结束之后,我们知道23对染色体各司其职,如果把染色体存在的信息看作是一本书的话,这本书有23个章节,每个章节都起着非常非常重要的作用。这个章节如果出现了偏差会对人体产生什么样的影响,当然有一些偏差,大家也都知道,会产生疾病,疾病是什么样的?幻灯片4

我们先说大的偏差,整个章节形成了一个重复,多了一条染色体。大家比较熟悉的唐氏综合征,是21号染色体重复了,那有没有其他的重复呢?比如2号、1号、5号染色体重复会是什么样?现在没有这样的病人,因为这样的人生不出来,这些染色体对发育太重要了,所以我们只看到唐氏综合征的存在,这是整个染色体重复的情况。幻灯片5那有没有其他的缺失,小一点的,不是整条染色体的,是一个染色体里面的一部分重复或缺失了,这里面列了15种重复缺失。有一个疾病是22号染色体上面有200万个碱基缺失了,导致的是一种叫DiGeorge的疾病。我们看到右边这个小孩生出来是兔唇,DiGeorge的小孩,并不是所有都是先天性心脏病,有70%的是先天性心脏病,30%是先天性肾脏病。这是一个案例,就是我们染色体缺了一段、多了一段的案例。幻灯片6如果再进一步,染色体并不是多了少了一段,而是只有一个字节,就是一个碱基发生了改变,染色体加起来的碱基数是30亿个,整个信息的量相当于我们看一部电影,正常一部稍微长一点的电影的信息量,这个电影里面有一个字节出现了偏差,会产生什么样的情况?幻灯片7这张图是一个案例,这是最早的一个被人类发现的疾病,叫黑尿症,是一位英国科学家1905年发现的,跟遗传有关,但那个时候并不知道遗传信息是什么,经过接近100年的努力之后,1996年才把基因的突变定位在3号染色体长臂21号这个位置上,基因当时被克隆。

人类最常见的突变是色盲,8%的男性患有色盲,0.6%的女性患有色盲,色盲为什么会这么普遍?色盲主要有三个基因主导,其中有两个基因在X染色体上,女性有2条X染色体,男性有一条X染色体,如果控制颜色的基因出现差错就会产生色盲,所以男性比较容易得色盲。幻灯片8我们仔细想想这个事情,实际上我们在座的男性要知道我们是处于劣势的,人类里面的一个分支,女性的优势实际上比我们有优势,就是因为她们有2条X染色体。
我刚才提到突变不是那么严重,要么是尿黑了,要么眼睛看不见颜色了,都跟颜色有关,我们人类研究基因突变很多年了,有很多突变会引起疾病。
这里举一个例子,NF1基因,位于17号染色体上面,出现了一个突变,产生了一个疾病,这是人的外表皮肤会产生肉瘤,多了会把人的眼睛、嘴巴盖住,这些人经常会因为不会呼吸导致死亡。当然这个疾病会有一个怪的现象,每个人的身上出现的程度不太一样。最右边显示的是这些人得的是同样位置的突变,但是他的程度不是那么严重,这牵扯到基因表达的问题,人的基因有两个拷贝,如果一个拷贝表达量超过另外一个拷贝,虽然另外一个拷贝有异常,但不一定能显示出来,这在遗传学上叫基因穿透。幻灯片9刚才提到基因有那么多跟疾病有关的突变,有没有跟疾病没有关系的突变呢?有个非常有意思的基因叫DRD4,位于11号染色体上,这个基因的第三个外显子有一个48个碱基的重复,在人群中的重复不太一样,有的人是两个,一个重复,有的人有11个,平均起来差不多是4个重复,这个重复跟人的性格,甚至在动物上也有这个基因,跟动物的性格有非常大的关系。中国绿公司20170422-Final

做的小鼠实验,如果把基因长的片断去掉,或者把整个基因去掉的话,这个小鼠会懒惰到看到食物不愿意吃,最后饥饿而死。就这么一个基因,在人群里面没有看到这么懒惰的人,但是在人的系统里面,人群里面,这个对性格还起一定的作用。
这个基因长的重复的DRD4,这种人很喜欢冒险,早上会做过山车,中午还觉得不够过瘾,到晚上还希望做一下飞机上面跳伞,很喜欢做刺激动作的人,这些人静不下来。这个故事以前跟疾病没关,没有科学依据,一直到最近,美国的一个大学的学生参与的实验、调研,发现经常有一些一夜情等的人大部分都是长的重复,就是7个以上重复的人比较多,所以基因跟性格是有一定的关系。幻灯片11

当然基因最大的,大家想过有没有超人基因。这个是加州的东面,有一个滑雪圣地,这是我两个星期之前在那个地方拍的,那个地方现在在下雪,这个地方著名之处是在1960年的时候,第8届冬奥会在这儿举行。第8届冬奥会也没有什么稀奇,第8届是第一次通过电视直播,所以它的影响力非常非常重要。
这个芬兰的一个运动员埃罗.门蒂兰塔,获得越野滑雪的冠军,大家觉得他体内有跟别人不一样的地方,是不是吃兴奋剂,最后他也承认确实吃了荷尔蒙,那个时候在冬奥会是合法的。到1991年大家对他家族基因做了一个检测,发现19号染色体上的一个基因叫促红细胞生成素受体(EPOR)发生了突变,这个突变导致他体内红血球比正常量增长50%。所以他们的耐力非常非常强,输氧能力非常强。
这个故事后来刺激了很多电影届的想象力,觉得人是不是有超人基因。大家都知道,有各种各样这方面的电影,比如说XMAN,他把自己的体型变掉。我们在科学界,在生物界也进行了研究,想弄清楚究竟超人的基因有多少,到现在只发现了5种,就是埃罗的耐力比较强,还有一个生物调控能力比较强,这基因突变了之后,人只睡四个小时就够了。幻灯片12大部分基因突变还是与疾病有关。2009年公布的材料里面看得出我们已经把很多疾病跟23对染色体对应起来,这个图一直在增长,增长到现在,4月15日的时候,重新更新了一下,看得出来密密麻麻每一个染色体上面都有一个。就像托尔斯泰说的,每个家族都有他的不幸之处,像埃罗的家族他们有幸之处是有了一些突变,但是大部分家族历史遗留下来都有突变。
幻灯片14幻灯片14我们做科研的时候就在想,能不能将人类的基因组信息非常简单的获取,刚才提到人的基因组有一部稍微长一点的电影的信息,要获取这个信息的话,需要工具。这个工具是从一九七几年的时候开始想研发出来,这是第一代测序技术,是由英国大学的Sanger教授发明的一个技术,这个技术到目前还在用。幻灯片15

目前产出最好的通量是一年7兆的数据,我们人类这部电影是30亿个碱基,用一台这样的机器,用好几年才能把这个数据产出来。这个机器虽然数据不是那么快,但是在人类对基因认识方面起了很大的作用,在1989年到2001年之间人类做了一件事儿,把人类基因组破解了,破解用的大部分就是这个机器。幻灯片16总共花了13年的时间,花了30亿美金,对应的就是我们刚才说的30亿个碱基的数据,所以30亿美元破译30亿碱基,相当于一个碱基一个美元的成本,这个成本对于第一代测序技术已经是非常好的结果,第二代,我们当时从1997年开始,如果是这样的话,我们每个人都有一部电影要制作出来,这个成本和时间根本就不能适应这个需求,所以就开始研发第二代测序技术。
经过20年左右的努力,1997年开始,到2006年第二代测序技术正式上市,到现在差不多20年的时间,我们今年能做到,美国Illumina公司年初公布的一个测序仪NovaSeq,它的通量能做到相当于设置36万部电影的数据量,当然为了精确度,我们行业内不会只设置一次,要设置30次左右才能把这个电影拍的精准一点,所以这样算下来,一台机器一年可以拍摄1万个人的数据量。幻灯片17在这个过程中,我们做了很多工作使成本不断的降下来,目前的成本,刚才提到的NovaSeq,目标是100美金,现在是800美金,今后差不多一年半时间会到100美金,我们算了一下降低的速度,每六个月下降一半的成本,从2007年开始到目前,这个速度是超过摩尔定律,摩尔定律是每18个月计算的通量缩减一半,人类测序成本每六个月下降一次。这么快速的下降,这么快速的技术更新的情况下会出现什么情况,人类对自身的认识越来越深,它的应用也开始出现。幻灯片18第一个应用是我非常好的朋友,香港中文大学卢煜明教授,1997年他发现母体血液中存在着胎儿的游离DNA,这是不可思议的,但是就是这么一个简单的发现,在2007年的时候,卢煜明教授我们两个一块来设计怎么用这个现象解释这个异常。现在在一百多个国家正在用的技术,叫无创产前检测(NIPT),可以把所有的遗传疾病,在小孩没有出生之前可以查得出来,只要孕妇能承担这个成本的话。幻灯片19我们国内和一百多个国家推广无创检测的是针对简单的比较重要的疾病,这个成本是可以控制的,非常非常低,今后的方向是把成本不断的下降,下降到所有疾病检查的时候有一个非常低的成本。同样一个概念,我们胎儿在母亲体内有十个月的过程,我们在十个月内抓住异常,然后查出来。幻灯片20肿瘤在没有出现征兆的时候能不能查的出来?从理论上来说,肿瘤比胎儿更容易做。第一个细胞变成肿瘤细胞,到能被影像学识别的肿瘤,一般情况下已经在转移的过程中,差不多要十年左右的时间,刚才说对于胎儿说是十个月,对于肿瘤来说是十年,我们如果检测的手段非常非常准确的话,我们有足够长的时间把这些肿瘤没有被发现的时候就能查出来。幻灯片21但是现在问题是,大家还没有看到这样的应用,没有实现的原因是因为肿瘤没有胎儿那么大,肿瘤的DNA跟胎儿一样都会进入到血液里面,但是它的DNA含量特别低,这样检测技术就要求非常非常高,这是我们这个行业,包括我们自己公司都在积极努力的、要实现的一个目标。幻灯片22

假定我们真的实现这个目标,能把肿瘤的突变找到,那还存在一个问题,这个突变是各种各样的突变都有,有一些有意义,有一些没意义,我们还要建一个数据库。要建这个数据库,首先得建一个基线,就是正常人的数据库。几年前开始我们和阿里云开始合作,建立中国人的数据库,到去年为止,有40万的中国人的数据在我们数据库里面,今天可以说我们实际上拥有中国人的突变,不管是致病也好,还是不致病也好,是基线的数据库。光有基线也不行,我们还要建立疾病的数据库。幻灯片23疾病的数据库怎么建立?这个案例大家也比较熟悉的,安吉丽娜.朱莉的故事,我们选乳腺癌作为第一个数据库来建立,我们通过这几年努力,差不多有60个基因跟乳腺癌有关,安吉丽娜.朱莉的基因突变是发生在第17号染色体上的BRCA1,在美国有3.5%的乳腺癌病人与这个突变有关。

幻灯片24

那我们中国人是怎么样?我们和北大肿瘤医院进行了合作,我们把这1万个人的基因测了一下,发现乳腺癌病人的里面有10%的人是已知的遗传缺陷,我们就认为10%的乳腺癌病人最起码以现在的知识认为是由遗传导致的。幻灯片25但跟茱莉不太一样的地方,在中国人群里,BRCA1不是最重要的致病因素,而是另外一个基因BRCA2。这个工作还在进行之中,我们把数据库不断建立起来,我们现在正在建立不同的疾病数据库。我们希望几年之后更多的疾病基因数据库都能建立起来,我们需要的是这样的工作,就是根据数据库信息能不能对治疗产生一定的影响。
这几年也有很大的进展,分成两类,一类是根据基因的信息设计叫小核酸的药,就是核酸作为药来用,这些药跟以往的药不一样,不一样的地方在哪儿,比如左边这个图是波士顿的一个公司去年底做了第一期临床实验,这个药注射一针,这个人的血脂能六个月之内维持降低50%左右,对应的蛋白基因能降低75%左右,这就代表了一种新型的治疗方案,Gene-Based治疗方案,今后很有可能注射一针能够实现六个月、一年,甚至有其他几个药现在临床实验已经证实六个月内一针就够了。幻灯片26当然长远的解决的问题,是小孩刚出生,甚至还没出生的时候就进行治疗,这个治疗方案是另外一个跟基因编辑有关的治疗方案,或者底下的一个分支。
今后如果有数据,有治疗方案,就会形成另外一个局面。这个局面对人会是什么样的状态?最近有一本书,《未来简史》,这本书对今后的预期实际上有点不太那么好,就是人今后信息累计太多的时候,会变成对人类自身是一个不利的状态,人会演变到更新的层次,跟人现在完全不一样的层次。幻灯片27这还不是目前我们关注的地方,我认为今后我们要打造的社会,最起码在今后几年之内先从基因的信息,通过检测把它聚集起来,聚集之后,我们有知识能用这个基因的信息指导医院该怎么做,治疗该怎么用,再往后很有可能进入另外一个状态,改变我们基因的信息,这是另外一个阶段。到那个阶段,可能跟这本书里面写的状态有关。希望有关是良好的有关,而不像这本书里面提到的是比较灰暗的。

1 回复

发表评论

想要加入讨论?
欢迎自由加入!

发表评论

电子邮件地址不会被公开。 必填项已用*标注