重金创建基因组数据库 贝瑞和康卡位基因解读

来源:健康界

目前我国婴儿的出生缺陷率达到5.6%,全民患肿瘤风险达到1/1000,如果能用基因测序的方式排除这些巨大的隐患,就具有重大的社会意义。

“科研领域,任何一个项目都不可能有100%成功的把握,但是我会尽力而为。尤其是最有挑战性的技术项目,花再多的钱也值得尝试!”接受健康界采访时,北京贝瑞和康生物技术股份有限公司(以下简称贝瑞和康)CEO周代星如此评价公司正在重金建设的“神州基因组数据云”项目。

 

9月23日,在第十九届全国临床肿瘤学大会暨CSCO学术年会上,贝瑞和康公布了在生物信息分析领域和大数据建设方面做出的重要成果。凭借“神州基因组数据云”项目,贝瑞和康不仅为公司的基因测序业务扩张搭建了坚实的数据基础平台,也为公司在生物信息领域筑起了一道人才技术护城河。

基因测序“解读”战

“当基因测序成本在几年前迅速下降以后,拥有数据量的多少不再是行业里唯一的竞争优势,而是否能够将海量的大数据进行解读,转换成具体能够应用的有效信息,这才是测序企业发展的核心竞争力。受益于测序成本下降,中国非常有可能在生物基因信息解读这一领域超越西方。” 贝瑞和康CIO于福利告诉健康界。

2015年4月24日,贝瑞和康宣布曾任职于美国贝勒医学院(Baylor College of Medicine)的于福利教授正式加入贝瑞和康担任首席生物信息官一职。作为全球范围内生物信息分析领域的著名专家,于福利教授的加盟将进一步增强贝瑞和康的生物信息的研究与开发实力。

周代星告诉健康界,现在,获得海量的基因数据已不再是制约,而基因行业最终将发展成为信息行业,信息的解读与整合成为核心竞争力。于福利加盟贝瑞和康以前,公司一直与其保持长期合作,他的加入也是多年磨合的结果。

于福利加盟贝瑞和康后,公司就启动了基因大数据分析项目。仅仅在一年后,肿瘤临床学术年会(CSCO)公布了阶段性成果,充分证实贝瑞和康的基因大数据分析能力已位居全球前列。

于博2于福利   教授

贝瑞和康在该次大会上发布了中国40万人基因组大数据项目在临床应用层面上所取得的阶段性成果,结果显示中国人乳腺癌基因突变和其他人种相比具有显著性差异。

于福利在报告中指出,现如今,获得大数据已不再是数据库建设的瓶颈,最关键的在于对数据的准确注释解读及其如何对临床产生应用价值。

目前贝瑞和康集成40万中国人群的基因组大数据还将持续累积,在此基础上,通过开发的专利算法和应用平台,挖掘中国人群特有突变并智能化生成分析结果,帮助临床医生结合患者表型进行医疗决策。而Enliven®变异注释系统正在发挥出“千真万确”的解读作用,并将很快落地实施。

事实上,数据量的多寡以及数据分析能力的强弱,在欧美国家早已经成为了衡量一家基因公司强弱的标准。

于福利告诉健康界,Myriad genetics(MYGN)是美国一家分子诊断公司,主要业务集中于预测医学、个性化医学和临床药物检测。其中最知名的基因检测包括用于遗传性乳腺癌和卵巢癌的BRAC Analysis,以及用于检测遗传性结肠癌和其他多种癌症的COLARIS。由于Myriad genetics进行基因数据的分析解读已有三十多年,在美国,很多医生都在使用它的数据库,医学界对此也非常认可。

相比于Myriad 30多年的积累,国内企业在起步时间上显然晚于美国。不过于福利告诉健康界,由于我们能够很快地获得大量数据,因此只要在数据解读能力上快速突破,并非没有可能实现弯道超车。

目前,对于贝瑞和康来说,已经掌握核心算法,接下来还需要积累更多数据。“神州基因组数据云”启动项目时只有40万人的数据。

“40万肯定不够,国际上做人类基因组数据库,至少要100万人的数据才能覆盖所有的突变,因此我们还要继续大量增加测序样本量。”于福利告诉健康界。

解读能力“卡位战”

如何建立强大的解读分析能力?显然贝瑞和康已在摸索当中找到了一条可不断复制和延续的成功路径。

不同于其他领域的数据解读,基因测序领域所需的计算分析能力,已经超过了一般的云计算概念。

于福利表示,参与“神州基因组数据云”项目的总人数达到了100多人,基本上来自于医学、分子生物学、遗传学、计算机编程等研究领域的博士。这是一个知识密集型项目。项目组分成三个团队,一个是由几位资深研究人员组成的贝瑞和康的团队,一个是于福利本人在贝勒实验室的团队,另外一个则是专门做高性能运算的阿里云团队。

据于福利回忆,阿里云团队对数据云项目非常感兴趣。只不过没有料到难度如此之大。这个项目对软硬件的要求连阿里云都感到吃惊。

有了完备的人才团队之后,项目方舍不舍得下血本也是大数据项目能否成功的关键。于福利说,这个项目烧钱很快,一烧就在百万级别。所以,先做小批量数据测试,测试方案做了半年,一遍不行就推倒重来。

周代星作为项目坚定的支持者,也对这样的开销感到惊讶。

但是,他认为解读非常重要,其关键是如何把数据变成信息,再转变为知识结构。比如,通过大规模人群调查,把健康人群和乳腺癌患者的数据进行比较,最终通过技术能够80%地解决癌症风险评估的问题。

北京大学肿瘤医院解云涛教授在遗传性妇科肿瘤的研究中始终精耕细作,2016年7月发表在Breast Cancer Res Treat杂志的一篇名为《Comprehensive analysis of BRCA1 and BRCA2 germline mutations in a large cohort of 5931 Chinese women with breast cancer》的文章中公布了5931例未经选择的中国乳腺癌患者的BRCA1/2基因的携带情况。在CSCO会议上,他不仅分享了该研究的数据结果,还介绍了与贝瑞和康合作的依托高通量测序技术进行的“中国人遗传性乳腺癌基因突变图谱项目”,该项目包含近万例妇科肿瘤(乳腺癌)患者样本,通过高通量测序方法获得检测结果经一代测序验证后,结果符合率达到99%以上,因此解教授认为未来用高通量测序进行肿瘤基因检测在技术上无懈可击。

于福利说,解云涛教授从事乳腺癌的研究和治疗已有20年,解教授的研究团队若想具备与解教授同等的疾病解析能力,则需要解教授把20年的学术经验完全传授给团队成员,这又是何其艰难!目前国内欠缺对临床咨询的系统性教育和培训,使得临床医生相关知识结构不完整,临床咨询能力不足。这需要好几代人的经验与知识的积累以及建立完备的教育与培训体系。而贝瑞和康的“神州基因组数据云”项目正好可以补充这些不足。

于福利深感未来大数据库的应用意义重大。“前几天我去山东省做报告时,发现产前筛查日益受到重视。目前我国婴儿的出生缺陷率达到5.6%,全民患肿瘤风险达到1/1000,如果能用基因测序的方式排除这些巨大的隐患,就具有重大的社会意义。”于福利感慨道。

“神州基因组数据云”项目的另一层意义则与我国医疗政策中正在力推的分级诊疗政策息息相关。通过与专家合作,大数据体系所提供的数据解读能力能达到90%的覆盖率,这将对基层临床产生重要的指导意义。我们可以想象,在三线四线城市,医生利用该数据云平台分析基因测序数据,在当地可以获得同样质量的检测分析,获得和在大城市大医院同等质量的报告,就能够进一步促进实现分级诊疗。

0 回复

发表评论

想要加入讨论?
欢迎自由加入!

发表评论

电子邮件地址不会被公开。 必填项已用*标注