技术简介

真菌属于较低等的真核生物, 种类庞大而多样;真菌基因组大小一般在 2.5Mb~150Mb,

复杂程度介于细菌和大型动植物之间。以Illumina为代表的二代测序技术平台很难解决微生物基因组中的重复区域与高GC区域的组装问题,往往需要借助RCR扩增、Sanger测序等方式来填补组装后基因组中的gap。  PacBio三代测序平台的长读长及无需PCR扩增的技术优势,可进一步降低引入人为错误的可能性,克服部分微生物基因组GC含量高或重复序列多等问题,实现对微生物基因组进行更加详细的描绘,进而推进精细基因注释等研究。

目前 PacBio RS II测序仪一个 SMRT Cell 含有 150,000个 ZMW,数据产出 500Mb-1.5Gb/SMRT Cell;PacBio最新型 Sequel测序仪一个 SMRT Cell含有 1百万个 ZMW,数据产出约 5-10Gb/SMRT Cell。

技术路线

幻灯片3

产品优势

超长的读长和超高的准确性,可获得0 gap基因组完成图,1个contig=1条染色体

无GC偏好性,对于GC%正常菌株和GC%异常菌株,PacBio平台可获得高质量测序数据

对于包含质粒的菌株,不仅可获得完整的真菌染色体基因组,还可同时获得完整的质粒基因组序列

信息分析内容

基本分析:

1、 数据质控

2、基因组组装:初步组装、组装结果优化、组装结果补洞

3、基因组情况评估:基因组碱基分布、Coverage 统计

4、基因组组分分析:编码基因预测、非编码 RNA预测、重复序列分析、假基因分析

5、基因功能注释分析:KOG 功能注释、GO功能注释、KEGG 功能注释、Swiss_prot功能注释、NR/NT 注释

6、分泌蛋白预测

高级分析:

1、比较基因组分析:

基因家族

共线性(需提供比较物种基因组序列信息)

系统进化(仅限群体样本)

基因组大片段复制分析

2、病原真菌致病性研究:

病原与宿主互作数据库(PHI)注释

碳水化合物相关酶(CAZy)数据库注释

细胞色素 P450 数据库注释

案例分析

Luigi Faino,a Michael F. Seidl, Single-Molecule Real-Time Sequencing Combined with Optical Mapping Yields Completely Finished Fungal Genome. mBio. (2015), 6(4): e00936-15.

研究背景

本研究采用了二代测序和三代测序相结合的方法,并结合光学图谱分析,最终获得了黄

萎病菌基因组完成图。

研究方法

1) 黄萎病菌菌株JR2采用PacBio RS测18个SMRT Cell(248 X), 8.9 Gb数据量;VdLs17同样采用 PacBio测序共计 4个 SMRT Cell(44 X),1.6 Gb数据量;PacBio 测序过程前后使用了 P4C2 和 P5C3两个版本的测序试剂。

2) 黄萎病菌菌株 JR2采用 Illumina构建插入片段为 500 bp的 PE文库(32.5 X测序)和 5

Kb的 mate-pair大片段文库(30 X测序)。

3) JR2和VdLs17菌株的PacBio长reads运用HGAP和光学图谱混合组装,然后用PB Jelly

补洞,并用 Illumina的短 reads校正。

研究结果

1) 黄萎病菌菌株 JR2的18个Cell数据采用 HGAP组装,Contig N50=3.4 Mb,其中 5条  Contig包含 JR2菌株的完整染色体 1、3、6、7、8,剩下的 3条染色体也通过 PacBio与

光学图谱结合组装的方式获得了完整的序列,最终得到 8条无 gap的完整染色体

2) 黄萎病菌菌株 VdLs17的4个Cell采用 HGAP组装,Contig N50 711 Kb,同样得到了 8条完整染色体

3) PacBio测序与光学图谱结合的组装策略可以获得的真菌基因组完成图

zhenjun

 

图为:无gap的黄萎病菌菌株JR2基因组组装结果

样本要求

幻灯片4