Bionano DLS和PacBio技术双剑合璧,助力欧洲谷仓燕高质量基因组组装

Bionano光学图谱派的最新成员DLS大侠因身怀基因组辅助组装的绝技,此前力战各大高手,江湖上已连出多篇武林公告,一时间人皆心向往之。近期,DLS大侠也没闲着,游历到风光旖旎的意大利米兰,偶遇欧洲谷仓燕家族的美燕一枚,听闻她身世不明便拔刀相助,飞鸽传书召唤好基友PacBio,一路抽丝剥茧破解了身世之谜。欲知后事,且听……

咳咳,切正题!说人话!最近沉迷武侠小说无法自拔的小编,就收收心为大家解析一篇最新发表的Bionano光学图谱技术结合PacBio三代测序技术,完成欧洲谷仓燕高质量基因组组装的文章。

 

SMRT long-read sequencing and Direct Label and Stain optical maps allow the generation of a high-quality genome assembly for the European barn swallow ( Hirundo rustica rustica )

研究单位:意大利米兰大学,德国苏黎世大学,美国Bionano Genomics公司,

美国加州州立理工大学,意大利帕维亚大学

 

谷仓燕(Hirundo rustica)是一种雀形目鸟类,在欧洲、亚洲和北美洲至少有8个亚种。作为一种候鸟,已成为大量生态、行为和遗传研究的焦点。获取高质量的基因组资源,包括参考基因组的可用性,是推动该物种研究和保护的关键。

 

样本选取:取意大利米兰附近农场某雌性个体的血液,全血离心后分离得到有核红细胞和白细胞,提取DNA构建SMRTbell文库。

测序策略:PacBio(45.4X)+ Bionano NLRS(28.2X)+ Bionano DLS(30.6X)

研究思路:

1.利用PacBio测序进行组装,加上Bionano NLRS和DLS数据分别辅助组装以及混合辅助组装,得到各个不同的组装版本,并对版本之间组装连续性进行比较。

2.对于PacBio、Bionano NLRS和DLS数据混合组装版本中极短的Contigs,与连成Scaffold的序列的相似性进行比对,相似性高的推测是独立组装出来的单倍体,删除之后得到的final版本,然后进行注释、组装评估。

3.与家鸡基因组进行共线性分析,显示组装质量很高,且与家鸡共线性很高。

 

1. 组装结果

仅PacBio SMRT测序技术组装的结果Contig N50为5.2 Mbp, 较之前用Illumina短读长测序技术组装的美国亚种 H. r. erythrogaster (Contig N50为3.9 Kbp)提升了134倍。

加入 Bionano DLS最新光学图谱技术辅助组装后,最终组装出来的基因组final版本大小为1.21 Gbp,Scaffold N50为 25.9 Mbp,相比仅使用PacBio数据组装得到的Contig N50来说,提升了5倍。

 

表1 本文组装的基因组与公布的美国亚种H. r. erythrogaster基因组的组装指标对比

 

2.基因和重读序列的注释

重复序列比例为7.11%,与鸟类一致。重复序列主要是由L2/CR1/Rex LINE 元件(3.37%)、retroviral LTRs(1.59%)和简单重复序列(1.56%)构成。最后预测到了35644个蛋白质编码基因,其中24331个含有pFAM蛋白结构域。基于BLASTP的简单相似性搜索表明,17895个蛋白编码基因,与来自家鸡的GRCg6a基因组的基因最佳匹配。

 

3.BUSCO基因评估

用4915个保守的鸟类BUSCO基因进行评估,4598个(93.6%)是完整的,4521个(92%)是完整的而且是单拷贝的,77个(1.6%)是完整且多拷贝的,192个(3.9%)是不完整的,125个(2.5%)是丢失的。连续组装到的BUSCO基因的百分比与安娜蜂鸟(Calypte anna)和斑马鱼(Taeniopygia guttata)的最新结果一致。

 

4.与家鸡和蜂鸟基因组的共线性分析

最终组装版本与最近发布的家鸡基因组(GRCg6a)的比较结果表明:这两个基因组之间具有高度的共线性,染色体内重排数目有限。这也和之前在鸟类中观察到的高度共线性和极少的染色体间重组一致。

图1 最终组装版本与家鸡基因组(GRCg6a)的比较分析

 

将 PacBio SMRT的数据同Bionano 光学图谱的NLRS和 DLS数据相整合,其组装的基因组连续性指标远远超过脊椎动物基因组计划(VGP)指定的 “白金基因组”的组装水平。

 

贝瑞基因作为全球Bionano光学图谱技术的践行者,较早推行无需酶切即可进行荧光标记的DLS技术,可实现构建跨越整个染色体臂甚至完整染色体的超长基因组图谱,提升基因组组装长度和精度,具有广泛的物种适应性,为基因组研究带来新的突破

 

参考文献:

Formenti, Giulio, et al. “SMRT long-read sequencing and Direct Label and Stain optical maps allow the generation of a high-quality genome assembly for the European barn swallow (Hirundo rustica rustica).” bioRxiv (2018): 374512.

 

咨询请联系贝瑞基因当地销售或致电010-84409702/发送电子邮件至sequence@berrygenomics.com。

0 回复

发表评论

想要加入讨论?
欢迎自由加入!

发表评论

电子邮件地址不会被公开。 必填项已用*标注