01高通量测序-RNA-Seq简介

RNA-Seq简介

举个例子,现在我们有一群正常的神经细胞,一群突变的神经细胞,突变细胞的行为与正常细胞不同。我们想知道是什么遗传机制造成了这种差异,这意味着我们想要观察基因表达的差异。每一个细胞有一堆染色体(chromosomes),每一个染色体上有一堆基因,有一些基因是活跃的,有的是不活跃的,高通量测序告诉我们哪些基因是活跃的,以及转录了多少。我们可以使用RNA-Seq去检测正常细胞和突变的细胞中的基因表达。然后我们就可以比较这两种细胞类型,在突变细胞中找出它们的不同之处。

image-20201231152706135.png

RNA-Seq分三个主要的步骤:

  1. 准备一个测序文库

  2. 测序

  3. 数据分析

1.准备一个测序文库

注意:我使用Illumina协议(protocol)和测序仪(sequencer)作为我的例子,因为他们是常用的,但记住,有其他协议和测序仪是不同的。

第一步:分离RNA

第二步:将RNA打断成小片段

我们这样做是因为RNA转录本可以有数千个碱基长,但测序机只能对较短的片段(200-300 bp)进行测序。

第三步:将RNA片段转化为双链DNA。

双链DNA比RNA更稳定,易于扩增和修饰(modified)。

第四步:添加测序接头(adaptors)。

接头做两件事:

  1. 允许测序仪识别片段。

  2. 允许你同时测序不同的样品,因为不同的样品可以使用不同的接头

注意:这个步骤并不是100%有效的

第五步:PCR扩增

只有具有测序接头的片段被放大;他们是丰富的。

第六步:QC

  1. 验证文库浓度

  2. 验证文库片段长度

image-20201231154643206.png

2.测序

想象一下我们要测序的DNA片段,它是垂直的,因为它在测序仪里就是这样的。实际上,大约有4亿个片段垂直排列在一个网格中。我只是给你看4个片段,网格(grid),我们叫做流动池(flow cell),这台机器有荧光探针,不同颜色的探针结合不同的核苷酸(nucleotide)。探针连接到每个序列的第一个碱基上。一旦探针连接好,机器就会从上面给流动池拍照。这幅图告诉机器左下角的第一个碱基是“A”,右下角为‘’G‘’,后方还有两个‘’A‘’。然后机器会洗掉探针的颜色,然后探针被绑定到每个片段中的下一个碱基上,重复以上步骤。这个过程不断重复,直到机器确定每个核苷酸序列。

image-20201231162137605.png

有时,探针的亮度不高,机器也不确定自己判断的是正确的颜色,质量分数(Quality scores)是输出的一部分,反映了机器对碱基识别的自信程度,在这种情况下,褪色的点会得到低质量得分。

image-20201231162717197.png

你可能会得到低质量分数的另一个原因是,在同一区域有许多相同颜色的探针,这被称为“低多样性”,单一颜色的过多会使识别单个序列变得困难,颜色会模糊在一起。

每个测序“read”包含4行数据。第一行(总是以@'开始)是序列的唯一ID。第二行包含序列片段的碱基。第三行总是一个“+”字符。第四行包含序列片段中每个碱基的质量得分。

image-20201231163158888.png

现在我们了解了原始数据以及它是如何生成的,我们需要:

1.过滤掉垃圾reads

  • reads含有低质量的碱基

  • read显然是化学反应的产物(接头序列)

2.将高质量的reads与基因组比对

  • 匹配read片段的基因组片段将决定一个位置(染色体和位置)在基因组中。

3.计算每个基因的reads

  • 一旦我们知道染色体和位置,我们可以看到它是否在一个基因的坐标(或其他一些有趣的特征)。

  • 在你计算每个基因的读数之后,你会得到一个像这样的数字矩阵

image-20201231164416687.png

在分析之前我们做的最后一件事是标准化数据。这是因为每个样本都有不同的reads,这是由于一个样本可能有更多低质量的reads,或者另一个样本可能在流动池上的浓度稍高。举个例子,样本1有635reads,样本2有1270reads。这并不意味着样本2中的基因转录量是样本1的两倍。相反,这意味着样品2有较少的低质量reads,可能比样品1在流动池上有更多的点。然而,从reads来看,样本2的基因转录量似乎是样本1的两倍。因此,我们需要调整每个基因的read,以反映分配给每个样本的reads的差异。最简单的方法就是用每个基因的reads除以每个样本的总reads。然而,还有许多更复杂的方法可以做到这一点。

image-20201231165742728.png

3.数据分析

第一步:任何数据分析的第一步是相同的,绘制数据

我们需要一张有20,000个轴的图表来绘制原始数据,所以我们使用PCA(主成分分析)或者类似的方法来绘制这些数据。PCA减少了显示数据重要方面所需的轴数。这是一个在神经细胞上做的RNA-seq实验的PCA图。“wt”样本是“正常的”。“ko”样本是研究人员突变的样本。“ko”样品在角落里形成了一个漂亮的小簇。“wt”样本都在左侧,但分布在y轴上。这些图的绘制方式,最重要的区别是在x轴上,在y轴的区别不重要,这意味着“wt”和“ko”样本之间的差异最大,然而,当我们做进一步分析时,我们可能希望排除“wt2”。

image-20201231170642215.png

总结:

  1. 告诉我们是否可以期待发现有趣的差异。

  2. 告诉我们是否应该从下游分析中排除一些样品。

第二步:鉴定“正常”和“突变”样本之间的差异表达基因

这通常使用edgeRDESeq2来完成,结果通常使用这种图表来显示。

image-20201231171240995.png
  • 如果你知道你在寻找什么,你就可以看看实验是否验证了你的假设。

  • 如果你不知道你在寻找什么,你可以看到某些通路富集在正常或突变基因集。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容