系列笔记基于达澈生物讲座视频,从中初步学习了解生信分析中常遇到的组学分析技术。
ChIP-seq和 CUT&Tag、CUT&RUN讲座视频笔记 - 简书
ATAC-seq讲座视频笔记 - 简书
CLIP、RIP-seq讲座视频笔记 - 简书
Ribo-seq讲座视频笔记 - 简书
RIC-seq讲座视频学习 - 简书
(eccDNA)circle-seq讲座视频学习 - 简书
1、核糖体ribosome
参考https://www.nature.com/scitable/topicpage/ribosomes-transcription-and-translation-14120660/
-
简单来说,核糖体是mRNA翻译蛋白质的场所;
其中翻译遵循的规律是mRNA单链上每三个核苷酸称之为一个密码子,对应一种氨基酸。
-
大致翻译步骤(参考下图)
(1) 当核糖体接触、识别到mRNA的启动子(AUG),翻译开始;
(2) tRNA将对应氨基酸运到密码子附近;
(3, 4, and 5) 氨基酸结合,tRNA位移,往复循环;
(6) 当遇到终止密码子时,翻译结束。核糖体脱落,并形成一条肽链。
-
关于核糖体主要由rRNA与蛋白质组成,通常认为是由两个亚基结构。翻译时把mRNA“夹在中间”
特殊的几种翻译情况
- 非编码RNA(lncRNA)
(1)70%DNA可转录RNA;3%DNA转录可编码的mRNA;
(2)不翻译的原因有很多例如无法出细胞核、无法接触翻译机器....- 部分翻译
一般指从非AUG启动子区域开始翻译- 过度翻译
一般指circRNA的情况,蛋白氨基酸数量远大于对应原始编码链长度
2、ribo-seq
- 指ribosome-seq,于2009年在science发表,是翻译组学的一种方法;
- 对在某一时刻下,捕捉到所有核糖体正在翻译的,所结合的mRNA序列(片段);
2.1 实验步骤
主要参考2009年在science文献,之后的方法也大同小异
- (1) robustly generate ribosome-protected mRNA fragments (“footprints”) whose sequences indicate the position of active ribosomes;
这一步是ribo-seq的关键,通过添加翻译抑制剂,使核糖体停止翻译,并在该状态下“绑”在mRNA上;然后对mRNA降解消化,核糖体mRNA符合物受到保护而“富集”。
如下图,ribo-seq的关键就是产生ribosome-protected mRNA fragments(RPFs)。图右是常规RNA-seq测序的input对照
-
(2)convert these RNA footprints into a library of DNA molecules in a form that is suitable for deep sequencing with minimal distortion;
简单来说就是将RPFs制备DNA测序文库;
- (3)measure the abundance of different footprints in this library by means of deep sequencing.
最后进行二代测序
2.2 数据特征
- 由于ribo-seq相当于是核糖体捕捉的mRNA片段测序,所以测序比对结果上有许多不同于传统RNA-seq之处
(1)read length distribution
-
大部分的RPFs长度集中在28~30nt长度
如下图上下为核糖体的60S、40S亚基,中间代表处于核糖体内被保护的mRNA序列。
-
在线粒体与叶绿体中翻译的RPFs长度分布略有不同。
(2)read located annotation
-
大部分RPFs还是位于CDS区;
-
还有相当一部分处于5'-UTR区。这与观察的RPFs片段5'端核苷酸分布是一致的。
即如下图5′ ends of the footprint fragments started abruptly 12 to 13 nt upstream of the start codon, ended 18 nt upstream from the stop codon.
原因不难理解,可参看上面第三张图(40s、60s),即核糖体内翻译密码子的位置是固定的(P site、A site)
(3)三密码子周期性
- 对于任意一个密码子,frame 0/1/2分别代表5'→3'的三个核苷酸
-
而从RPFs片段5'端第一个碱基的分布可以看出明显的3nt周期性。
-
即大部分是落在每个密码子的frame0位置;而反映在分布图中,则是每三个位置出现一个峰,也进一步验证了三核苷酸密码子的翻译准则。
2.3 应用范围
- 上面2.2只是初步展示了ribo-seq的数据特征,还有很多更深入的探索,例如ORF有关的Translation Efficiency (TE)计算等,可以参看相关ribo-seq应用文献。
-
Ribo-seq的应用范围,如下图可涵盖四个方面
(1)应用于翻译探究机制
(2)深化转录组分析
(3)用于解释转录组与蛋白组结果的不一致
(4)可以深化非编码RNA的测序分析
最后推荐两篇文献,一篇是2009年第一次提出ribo-seq;另一篇是2017年对于riboseq的综述;笔记中的例图基本都来自这两篇文献。
- Genome-Wide Analysis in Vivo of Translation with Nucleotide Resolution Using Ribosome Profiling
- Beyond Read-Counts:Ribo-seq Data Analysis to Understand the Functions of the Transcriptome
需要这两篇文献的朋友可以在评论区留言邮箱,我看到后会发给大家的。