技术简介

目前 PacBio RS II测序仪一个 SMRT  Cell 含有 150,000个 ZMW,数据产出 500Mb-1.5Gb/SMRT Cell;PacBio最新型 Sequel测序仪一个 SMRT Cell含有 1百万个 ZMW,数据产出约 5-10Gb/SMRT Cell。

以Illumina为代表的二代测序技术平台很难解决微生物基因组中的重复区域与高GC区域的组装问题,往往需要借助RCR扩增、Sanger测序等方式来填补组装后基因组中的gap。  PacBio三代测序平台的长读长及无需PCR扩增的技术优势,可进一步降低引入人为错误的可能性,克服部分微生物基因组GC含量高或重复序列多等问题,实现对微生物基因组进行更加详细的描绘,进而推进精细基因注释等研究。基于微生物完成图的精细组装,可为病原菌的预防控制、工业发酵定向育种、农业微生物功能基因挖掘等多个领域应用提供准确全面的数据支撑。

技术路线

幻灯片3

产品优势

超长的读长和超高的准确性,可获得0 gap基因组完成图

无GC偏好性,对于GC%正常菌株和GC%异常菌株,PacBio平台可获得高质量测序数据

对于包含质粒的菌株,不仅可获得完整的细菌染色体基因组,还可同时获得完整的质粒基因组序列

生物信息分析流程图

bacteria shengwuxinxi

信息分析内容

 基本分析

1、 数据质控

2、基因组组分分析:编码基因预测、非编码 RNA预测、重复序列分析、CRISPR(Clustered regularly interspaced short palindromic repeats,  规律成簇的间隔短回文重复)序列预测

3、基因功能注释分析:NR/NT注释、Swiss-Prot功能注释、COG功能注释、GO功能注释、KEGG功能注释

4、注释结果统计与展示:样品预测得到的基因数目、能够注释到相应数据库的基因数目和比例和没有比对到任何数据库的基因数目与比例。

幻灯片2

基因和注释结果Circle图

高级分析

1、基因岛预测

2、前噬菌体(Prophage)预测

3、比较基因组分析(基因家族、共线性、进化树)

幻灯片3

案例分析

Baker KS, Mather AE, The extant World War 1 dysentery bacillus NCTC1: a genomic analysis. Lancet. 2014 ;384(9955):1691-7.

研究背景

细菌性痢疾是第一次世界大战的原发性腹泻病,但依旧在军事行动中爆发,并且在发展中国家每年因细菌性痢疾死亡的人高达成百上千。本文的目的是获得志贺氏菌的分离菌NCTC1的高质量参考基因组和抗菌药物。

材料和方法

材料:贺氏菌的分离菌NCTC1

1) 构建20 Kb的大片段文库,PacBio RS II测序(250X);

2) 构建450bp的小片段文库,Illumina MiSeq测序(PE300,150X);

3) 测序完成后将二者的reads结合完成混合组装。

结果

1、得到完整的 NCTC1 环状基因组图,基因组大小为 4,526,576bp,GC含量高达 51%;

幻灯片5

NCTC1基因组完成图

2、研究结果发现 NCTC1 属于 S.flexneri的 2a谱系,两者具有相同的特点和核心基因组;

3、和大部分 S.flexneri 2a 谱系一样,NCTC1对青霉素和红霉素具有抗性,随着时间的推移, S.flexneri 2a 谱系上积累的基因岛主要与微生物抗性、毒力以及血清型的转化相关联,随着基因岛的逐渐增多,与耐药性和耐毒性也存在很大的相关性。

幻灯片6

痢疾杆菌比较基因组学分析

样品要求

幻灯片4