用一个题目理解rnaseq

这个题目是转载别人的,原出处没能找到,原作者看到可以联系删除。

当时在做这个转录组分析之前不太了解这个到底是什么,但是跟着流程完成了,也得到了结果,但是还是有很多问题不太明白。看到下面这个问题后稍微有了一些自己的理解。

用一个题目理解rna-seq

假设有一个物种非常的小,仅仅只有三个基因: A, B, C,并且这三个基因都转录本长度分别为10bp, 100bp, 1000bp. 你想通过两个不同的条件下研究该物种,分别是野生型(WT)和热激后(HWEAT)。
由于神秘力量,你知道在WT条件下,基因A的表达量是基因B的表达量的两倍,你还知道在WT和HEAT两个条件中只有一个基因发生了变化(其他基因不变),并且该变化能用目前研究手段中检测到。
你为了找那个在WT和HEAT里不同的基因,非常激动的去做了一次没有重复的RNA-seq实验。由于你很激动,所以不小心把样本混在了一起,而且混了比HEAT处理多一倍WT的DNA量。不过好消息是样本还是能够分开的,毕竟加了barcode。最终结果就是你测了2倍的WT DNA和一倍的HEAT。
问题:你需要准确的用read覆盖情况来表征根据上述给的条件。数字不重要,你可以随便写,重点是这些数字能够表征基因的表达情况。请用实际的数字来替代下面的问号部分

问题

思考题:当你觉得你选择的数字能够回答上面的问题,那么再来想想下面的题目,如果你能回答所有问题,那么那就理解RNA-seq是如何工作的啦。

  • 由于你在仪器里放了两倍WT材料,你是如何区分出你的样本?
  • 每个条件下,每个基因的CPM是多少?
  • 每个条件下,每个基因的RPKM是多少?
  • 每个条件下,每个基因的TPM是多少?
  • 你怎么知道基因在WT样本中,基因A的表达量真的是基因B表达量的两倍?
  • 你能知道WT和HEAT处理中表达量发生变化的基因嘛?
  • 当前面的3X2的位置的“?”都有了正确的值,这个问题也是可解决的嘛?
    然后,你可以再想想:
  • 你需要测多少的read,才能让CPM有一个不错的数值?
  • 你需要测多少的read,才能让RPKM有一个不错的数值?
  • 你需要测多少的read,才能让TPM有一个不错的数值?
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 通过一个小任务来帮助理解转录组测序的点滴首先,设想手头有一个物种的三个基因ABC,它们的长度分别是10bp、100...
    刘小泽阅读 5,352评论 1 34
  • 一篇RNA-seq分析流程的综述,全面而详细!深度好文,可用来反复阅读。初学者用于把握RNA-seq真个流程及各个...
    小白要变大神阅读 7,856评论 0 21
  • 知识的学习没有一蹴而就,没有捷近,扎实的学习是唯一的捷近。 一篇RNA-seq分析流程的综述,全面而详细!深度好文...
    dandanwu90阅读 49,303评论 5 152
  • 欢迎关注oddxix RNA-seq是高通量测序中最常见的一种应用,本期视频介绍其:1.方法原理2.生物信息分析 ...
    oddxix阅读 4,821评论 1 44
  • 这本是三年多之前我发在公众号上的一篇旧文,一些偶然的机会,发现不少朋友也在讨论这个问题,因此我重新做了梳理并发出来...
    黄树嘉阅读 12,364评论 6 54