生信星球转录组培训第一期Day1--善良土豆

盼星星,盼月亮,期望有个人带我进入转录组的世界,在此由衷的感谢花花和小泽(生信星球创始情侣)带我开始遨游

只有7天的学习时间,告诫自己请珍惜!!!!

1.啥是转录组?

中心法则---来自维基百科

中心法则:
从一个基因到相应蛋白质的信息流的途径。 遗传信息贮存在DNA中,DNA被复制传给子代细胞,信息被拷贝或由DNA转录成RNA,然后RNA翻译成多肽。 不过,由于逆转录酶的反应,也可以以RNA为模板合成DNA。DNA是基因组主要研究对象,而RNA就是转录组研究对象

-基因组Genome:它是一个细胞或者一个生物的完整序列,包括基因与基因间区。
-RNA种类:可编码蛋白的为mRNA;其他的是非编码RNA(non-coding RNA, ncRNA)【包括rRNA (核糖体RNA,ribosomal RNA)、tRNA (转运RNA,transfer RNA)、snRNA (小核RNA,small nuclear RNA)、snoRNA (核仁小RNA,small nucleolar RNA)、microRNA (小非编码RNA,miRNA)和lncRNA (长非编码RNA,long non coding RNA)等。

A:按照质量区分;B:按照数量区分

如果我们关心的是mRNA,而测序时选择了全部的RNA进行测序,那么测序结果中包含的大部分结果都将是rRNA和tRNA。因此这个就需要利用实验手段将mRNA进行分离(Ploy A),或者去除比例最大的rRNA、tRNA。

综上,转录组(Transcriptome)广义上表示mRNA、rRNA、tRNA、非编码RNA,狭义上表示所有的mRNA。它要研究的问题就是:同一基因不同器官/组织中,它们包含的DNA可能是一样的,但是转录出来的RNA却差异很大,寻找差异基因;另外同一基因在不同条件下的表达不同,比如有的基因在盐碱条件下会表达增高,以促进植物适应盐碱环境的生存。

2.转录组干啥了?

推荐文章一篇:https://www.nature.com/articles/nmeth.2735

转录组干啥了

转录组重建工作,就好像是把被碎纸机粉碎的杂志又一本本地重新拼接起来。

有很多杂志(即RNA)每一期都“印刷”了很多本,其中有一些可能还有存货,还有一些留在报刊亭里,可是有一些却早就被“卖光”了。在过去,经销商们只会关注销量最好的杂志,而这种杂志每一本都非常贵,所以你可能也就买得起几本而已(喻指RNA研究技术和相关产品非常少,而且价格昂贵,科研人员只能对比较重要、热门的几种RNA进行研究)。可是现在,由于测序技术,以及相关技术的飞速发展,你可以把报刊亭里的所有杂志全都买回去,而且价格还不贵。唯一的区别就是经销商卖给你的并不是一本本的杂志,而是先把所有的杂志全都放进碎纸机里,然后把一大堆碎纸条卖给你。幸运的是,在这个虚拟的世界里,还有那么一大帮热心的社会改良家来帮忙整理碎纸条(tape-wielding dogooders,这帮人就是我们现实生活中的计算机程序开发人员),帮助我们将碎纸条还原成一本本的杂志。还有一群像RGASP这样的统计狂热分子也跑来凑热闹,他们组织了一场比赛,看看哪些人整理碎纸条的效率最高,准确率最高,能够又快又好地还原出杂志的本来面目。这个整理、拼接碎纸条的工作就是“转录子重建(transcript reconstruction)”工作,这也是Steijger等人的文章里最关注的工作。而转录子重建工作的重点内容之一就是将RNA测序得到的片段信息与该RNA来源细胞的基因组对应起来,这就是Engström等人的文章里最关注的工作。

3.关于测序

目前二代测序主要采用Illumina平台
参考:https://www.illumina.com/systems/sequencing-platforms.html

4.转录组分析有什么流程?

没有唯一的流程,找到适合自己样本的分析流程!!


分析流程

参考文献:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-0881-8 A survey of best practices for RNA-seq data analysi

基于参考基因组比对:因为基因组包含了基因间区、内含子区域,因此比对时选取的比对软件就要具有"跨越式拼接”特性,比如STAR、Hisat2;
基于参考转录组比对:Bowtie、BWA;
无参考基因情况:需要拼接Trinity:利用测序reads从头组装拼接出参考unigene,再将每个样本的reads比对到参考unigene上,计算表达量;
对于大部分没有参考基因组或者基因组注释不好的物种,无参方法是比较理想的解决途径,但是比有参要消耗更多的内存、运行时间。

有参分析流程

参考:http://www.mi.fu-berlin.de/wiki/pub/ABI/GenomicsLecture12Materials/rnaseq1.pdf

接下来刷文献去~

每日一导


DAY1
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sang...
    翠湖心影阅读 21,541评论 2 81
  • 通过一个小任务来帮助理解转录组测序的点滴首先,设想手头有一个物种的三个基因ABC,它们的长度分别是10bp、100...
    刘小泽阅读 5,372评论 1 34
  • 这是在微博上看到的一篇文章,深有感触,于是转发过来。 人生最难跨过的一关,是自己那一关。唯一能够阻...
    小M姑娘阅读 446评论 0 1
  • 女儿半期考试的成绩出来了,还可以,语文94.数学79.,位列班上前三,我小小欣喜的同时心里也有些担忧。 女儿数学一...
    baiyan春来江水绿如蓝阅读 166评论 0 1
  • 无事此静坐, 突然会想起 一些很久以前的人和事。 想着那时候 别样的心情, 面对着与现在不同的人 ,应该跟现在是 ...
    雨如花飞阅读 366评论 0 4