circRNA差异分析工具: DEBKS

独特的环状结构让二代测序较短的读长限制了对其鉴定以及定量,目前仅仅依靠其反向剪切序列;另外,环状RNA的表达总是与来源基因(host gene)线性RNA的表达纠缠不清,让我们很难区分差异是来源于反向剪切还是只是来源基因的副产物。
对此,许多软件在识别上下功夫,比如DCC、CIRCexplorer、CIRI等等,然后用DESeq2或edgeR进行差异分析;而另一些软件在定量上使劲,对环状 RNA 的定量不仅仅使用反向剪切序列(BSJ),而且考虑到来源基因线性分子表达的影响,使用BS ratio进行定量,例如DCC、CIRI2、CIRIquant以及CLEAR。当然这种定量就不适合用于DESeq2或edgeR,一般可以用DCC::CircTest或CIRIquant等软件进行差异分析。

DEBKS介绍

最近北大基础医学院杨恩策团队提出了环状RNA差异分析的新方法DEBKS,对BS ratio进行了优化(公式及图解如下)。

image.png

image.png

对此,DEBKS设计了4个模块(见下面的流程图)

  1. merge,整合不同样品的环状RNA
  2. count,对来源基因的线性RNA进行定量
  3. anno,评估环状RNA长度
  4. dec,检测差异表达环状RNA

以及两个差异表达模式

  1. paired,配对的样品
  2. unpaired,非配对的样品
image.png

性能评估

作为一款工具,我们需要首先对其性能进行评估。

作者首先用了两套公共数据集检测了DEBKS识别差异环状RNA的检出率并用RT-qPCR进行了验证;随后,用模拟数据对DEBKS以及其他软件进行了评估,评估内容包括

  1. 重复样品表达一致性检验
  2. AUC,真阳性率以及假阳性率
  3. 差异表达基因检测敏感性
  4. 来源基因表达对差异环状RNA的影响

通过比较,DEBKS具有更优秀的性能并且更少受来源基因表达的影响。

局限性

由于需要包含线性剪切位点的表达(LJC),因此,DEBKS只能应用于既包含环状 RNA又包含线性RNA的测序,例如rRNA-depleted RNA-seq或exome capture RNA-seq。

另外,基因间区的环状RNA由于缺乏线性分子的表达,因此无法用DEBKS评估。

结束语

虽说目前差异分析几乎被edgeR/DESeq包揽,然而面对复杂多样的生物学情景以及日益增长的多组学信息,分析工具的多样性和特异性是非常有必要的。

环状RNA研究越发蓬勃,然而专门的工具却仍旧匮乏,另外,有些工具走着走着就丢了。虽然DEBKS在文章中提到表现比较优秀,然而能不能成为环状RNA研究的利刃,仍需要大量真实数据去检验。

参考资料:

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容