用“实例”说话!贝瑞基因邀您见证UDI“保真”建库如何出奇制胜

自从

UDI建库打卡过后

贝瑞主流测序业务早已按耐不住内心的躁动

纷纷投向了UDI建库

至今已乐不思蜀地运行了两个多月

从此

“外来物种”基本就要告别了

数据污染也要成为难得一见的反常现象了

BUT

你以为这就是全部了

No No No

还有一波实际案例在暗流涌动

那么

这个暑假仍在科研的童鞋们

你们准备好贝瑞数据的洗礼了吗

 

 

案例一

WES UDI建库数据污染“短兵相接”

与人全基因组相比,全外显子组测序覆盖深度更深,数据准确度更高,更加经济高效,所以常用于寻找单基因病、复杂疾病等遗传病和癌症等致病基因和易感基因的研究。

基于外显子组测序的广泛应用,我们对一组人WES文库进行UDI建库测序,然后分别通过i7和i5单端index、UDI双端index进行数据拆分,进而评估UDI对数据污染问题的改善效果。首先,我们将三种不同拆分方式所得数据与人参考基因组进行比对,比对结果(见表1)显示,UDI建库拆分数据与人参考基因组的mapping率平均达到了99.95%,几乎可以全部比对,远远超过了任一单index拆分数据的mapping率。

表1 人WES UDI文库中不同数据拆分方法的Mapping 率

 

然后,我们对于单独使用i7端或i5端index单独拆分数据中,比对不到人基因组的reads做blast分析,发现有35-70% reads无法比对到任何物种,余下30-65% reads均来自同lane其他文库,从而可确认为同lane间发生的index串扰。

表2 Unmapped reads 做blast分析结果示例

 

既然拆分条件更严格了,那么必定伴随着一定的数据量损失。所以,为了给您一颗定心丸,我们又继续统计了三种拆分方式所得的数据量。结果(表3)显示,UDI拆分在双端index都完美匹配的情况下,仅仅会平均损失约3.5%的reads,而单独使用i7端或i5端index拆分多出的这平均3.5%的reads,几乎都是同lane其他物种的串扰。也就是说,我们以可忽略的数据量损失,就能避免数据污染问题,可以说是很值了!

表3  人WES UDI文库不同数据拆分方法所得reads对比

 

 

案例二

UDI加持,PCR-free文库“所向披靡”无惧index串扰

血浆游离DNA,即cfDNA(cell-free DNA),是血浆中游离存在的DNA,主要来源于正常细胞、异常细胞(如肿瘤细胞)和外部(如病毒DNA)。其中来源于肿瘤细胞的部分称为血液循环肿瘤DNA,即ctDNA(circulating tumor DNA)。cfDNA为非侵入式取样,更易获得,可多次取样,尤其适用于难取到的肿瘤组织研究,可用于癌症早期诊断、用药和监测。基于此热点,我们对cfDNA不同建库方式导致的数据污染情况进行了分析。

 

1. PCR-free文库传统单端index建库

首先,我们来看下数据污染问题最严重的PCR-free文库。上一篇中我们介绍了PCR-free文库由于连接头后没有PCR扩增步骤,而是直接纯化出库,导致PCR-free文库当中的接头残留量相对较高,从而更容易受到数据串扰的影响(详细内容请看链接测序数据离奇污染?看贝瑞基因抽丝剥茧,UDI“保真”建库一招制敌)。为了让各位看官眼见为实,我们特意测试了cfDNA的PCR-free文库,并且是传统单端index建库的案例,整条lane中文库的物种构成详见如下表4。

表4 PCR-free文库单lane中测序端物种构成

 

然后我们将cfDNA WGS测序结果拆分的数据进行比对,结果(表5)发现,4个样本数据都发生了严重的数据污染,平均仅有48.47%的数据可比对到人的参考基因组。而unmapped reads经Nt库blast,发现除约20%的reads无法比对外,其余reads均比对到了同lane中的其他物种,表明同lane间发生了严重的数据串扰。

表5 人PCR-free文库测序数据比对到各物种的比例

 

2.PCR文库传统单端index建库

相对于PCR-free文库,PCR文库多了一步PCR扩增步骤,所受index串扰就会相对较小。本次,我们仍然拿实际案例来说话。如下表6为PCR文库单lane中测序端物种构成,并且为传统单端index建库。

表6  PCR文库单lane中测序端物种构成

 

数据下机后,我们依然选取了人类样本(cfDNA WGS)的数据拆分比例进行分析。结果(表7)显示,4个样本比对到人参考基因组的比例,相对于PCR-free文库有了很大的提升,平均占84.44%。这相对于PCR-free文库的48.47%,已经是一个显著的进步。但是!看unmapped reads的blast结果,我们仍然能够看到同lane其他物种数据的串扰!

表7 人PCR文库测序数据比对到各物种的比例

 

3.PCR-free文库UDI建库

虽然PCR文库相对于PCR-free文库已经是抵抗数据污染的强者,但是在UDI建库面前还是不能匹及。为了体现UDI建库的神级表现,我们选取最弱的PCR-free文库来进行拯救。同样的建库测序后,发现PCR-free文库经过UDI建库的保驾护航,比对到人参考基因组的数据占比平均值都提升到了94.49%,相对于之前的48.47%,已经达到了质的飞越。同时,将unmapped reads经Nt库blast,未发现reads比对到同lane其他物种,表明几乎无串扰发生!

表8  人类样本PCR-free UDI文库测序数据比对到参考基因组的比例

 

看了这么多表格,您是不是有点晕晕乎乎了。注意,要划重点啦!

1、UDI建库能够以可忽略的数据损失,避免数据污染问题,使得拆分的数据几乎可以全部比对到参考基因组。

2、加入UDI之后,即使是最易产生数据污染的PCR-free文库,拆分后的有效数据比例也之前的48.47%提升到94.49%,有效避免index串扰问题。

目前贝瑞基因已稳定运行两个多月的UDI“保真”建库测序服务,后续也将不断的推行至更多的测序项目中,为每一位科研工作者的每一份样本提供“保真”建库测序服务,同时,也会尽力协助自建库项目的前期UDI接头替换,切实解决index串扰问题!

 

详情咨询请联系贝瑞基因当地销售或致电010-84409702/或发电子邮件至邮箱sequence@berrygenomics.com。关注“贝瑞基因科技服务”微信公众号,获取最新资讯。

 

0 回复

发表评论

想要加入讨论?
欢迎自由加入!

发表评论

电子邮件地址不会被公开。 必填项已用*标注