WGS,WES,RNA-Seq与ChIP-seq之间的异同

转自:https://www.plob.org/article/10918.html

1 基础概念

平均测序深度:

指定区域内得到的所有碱基数目与该区域的长度的比值,如果是全基因组,就是整个测序的碱基数目除以基因组的大小。比如人类的基因组大小是3G(30亿个碱基),我的全基因组测序共8.9亿条150bp的reads,那么全基因组范围的平均测序深度就是8.9亿150/30亿~45X,这个概念很重要!*

覆盖度:

指测序获得的序列占整个基因组(或者指定区域)的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98 %,那么还有2%的序列区域是没有通过测序获得的。
(你想实际测到的占你想测的区域比例。)
由于我们研究目的不一样,通常我们不需要覆盖到全基因组,所以就有了各种针对性的组学技术,也就是我们需要明白的!

2 理概念

理解了上面的测序深度和覆盖度的概念,我们就可以根据它们来区分WGS,WES,RNA-seq组与ChIP-seq,简单地说就是搞清楚这些组学要测什么,而且测多深即可。

全外显子(Whole-exome sequencing):

首先外显子组(Exome)是指真核生物基因组中全部外显子区域的总和,包含了蛋白质合成最直接的信息。外显子 组测序(Exome-seq)是利用设计好的探针试剂盒将坐标已知的全基因组外显子区域的DNA捕捉并富集后,进行高通量测序的基因组分析方法。 对于人类基因组来说,外显子区域大概占到基因组的1%,大概在30M左右。

一般全外显子测序的测序深度为50X~200X,具体深度依研究目的而定,其个体之间的变异小(在VCF文件上记录着少许差异,一点点)。

转录组测序(RNA-seq):

首先转录组是指在相同环境(或生理条件)下的在一个细胞、或一群细胞中所能转录出的所有RNA的总和,包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及非编码RNA。转录组测序(RNA-seq)是将提取所要研究的特定类型的RNA,将其反转录成cDNA,利用高通量测序技术获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。对于已知参考基因组的物种,所获得大部分序列是已知的,同时会有一些新的转录本会被检测到,几乎可以忽略;甚至处于不同状态的人,其转录组数据有所不同。因此其主要的研究点——研究随着时空的变化、组织的变化、样本的变化,转录本发生改变。

染色质免疫共沉淀测序(ChIP-seq):

主要用于蛋白质与DNA相互作用研究,采用特异抗体对目的蛋白进行免疫沉淀,分离与目的蛋白结合的基因组DNA片段,对其进行纯化和文库构建,再通过高通量测序的方法,在全基因组范围内寻找目的蛋白的DNA结合位点,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA片段信息。(与外显子测序不一样,不是通过设计好的探针来捕获序列的,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获序列的,蛋白结合在哪里就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的。)因此其主要研究点——研究用不同组蛋白、转录因子等不同蛋白来做不同的实验,找出互作的DNA序列的不同。

3 明差异

测序范围的区别:

全外显子测序测的是所有的能被探针捕获到的外显子区域,在IGV上面能看到reads都是覆盖到外显子及其侧翼区域。所以分析要点就是哪些已知的外显子覆盖度不够好,是探针捕获失败还是样本本身变异呢?外显子的哪些区域跟参考基因组序列不一样呢?
转录组测序测的是能被转录的区域,不需要是已知的外显子,而且reads是可以跨越外显子比对的!所以分析要点是哪些外显子被连接起来了?每个外显子都被覆盖了吗?
ChIP-seq测的是目标蛋白结合的DNA序列,取决于目标蛋白的结合能力,所以它的分析要点就是这些DNA序列在基因组的位置。

测序深度的区别:

全外显子测序的测序深度在大部分区域都是均匀的(反应捕获效果,或者拷贝数变异);
转录组测序一定是不均匀的,以外显子为单位的不均匀(反应表达量差异);
染色质免疫共沉淀测序的测序深度也是不均匀的,以每个碱基为单位的不均匀(反应蛋白结合位点);

4 看图说话

首先从全局的角度来看看这4者的差异

如下图所示:

我只显示了STAT3基因区域的reads覆盖情况。

最上面的是ChIP-seq数据,首先,测序深度都不高,而且测序深度极度的不稳定,深浅不一;其次,整个STAT3基因区域似乎都有覆盖到。

第二层是RNA-seq数据,可以看到只有exon对应的区域是有reads覆盖的,非常exon和intron的间隔非常明显,因为是PE测序,还可以看到不同的exon被同一个read跨越了intron连接起来了。至于测序深度,STAT3基因的大部分exon都是等深度的,但是STAT3基因与其它基因的测序深度就不一样了,这个图没办法显示那么多。

<ins class="adsbygoogle adsbygoogle-noablate" style="display: block; margin: auto; background-color: transparent;" data-adsbygoogle-status="done" data-ad-client="ca-pub-4854890118725886" data-ad-format="auto"><ins id="aswift_6_expand" style="display:inline-table;border:none;height:180px;margin:0;padding:0;position:relative;visibility:visible;width:718px;background-color:transparent;"><ins id="aswift_6_anchor" style="display:block;border:none;height:180px;margin:0;padding:0;position:relative;visibility:visible;width:718px;background-color:transparent;"><iframe name="aswift_6" width="718" height="180" id="aswift_6" frameborder="0" marginwidth="0" marginheight="0" scrolling="no" vspace="0" hspace="0" allowfullscreen="true" style="left:0;position:absolute;top:0;width:718px;height:180px;" allowtransparency="true" onload="var i=this.id,s=window.google_iframe_oncopy,H=s&&s.handlers,h=H&&H[i],w=this.contentWindow,d;try{d=w.document}catch(e){}if(h&&d&&(!d.body||!d.body.firstChild)){if(h.call){setTimeout(h,0)}else if(h.match){try{h=s.upd(h,i)}catch(e){}w.location.replace(h)}}"></iframe></ins></ins></ins>

第三层是WES测序,可以看到也是主要覆盖exon区域,但是跟intron区别是没那么整齐的分割线了,因为exon是探针捕获富集的,那么会把exon的侧翼区域也部分捕获,测序深度会由exon往intron递减。(下图是放大比较WES和RNA-seq)

最后是WGS测序,理论是它应该是全基因组覆盖,而且测序深度非常稳定,但是实际上,测序深度还部分由GC含量,扩增随机性影响。

但是它肯定不能像ChIP-seq数据那些很明显形成一些峰,下面可以看比较差异。

写在最后

上面的WGS,WES,RNA-seq组与ChIP-seq之间的异同我曾经在生信菜鸟团QQ群里面讲解过,以QQ群视频的形式,而且还录制了视频,大家可以在公众号后台回复"组学"就可以获取啦!

其实还有关于这几个组学数据分析的异同点, 暂时还没有时间来整理:

(1)使用范围有所不同。外显子组测序只能对已知基因组序列信息的物种进行测序,而转录组测序没有这样的限制。转录组可以对Non-coding RNA等进行测序,而外显子组测序仅限于外显子区域;
(2)转录组可以反映特定时刻、特定组织该物种的基因表达情况,而外显子组测序不具备此能力。但是,因为部分基因低表达或组织特异表达,转录组难以获得物种全部外显子的信息,而外显子组测序不受表达情况影响,可均一地获得外显子区域序列信息;
(3)从转录组获得的遗传信息可能受到转录后加工的影响而导致与基因组不符,而外显子测序无此影响。 染色质免疫共沉淀的测序范围是不确定的、未知的,研究不同蛋白质,其所捕获DNA序列区域是不同的;

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容