全长转录组 | Espresso

今天介绍一款利用比对后的长读长RNA-seq数据鉴定定量转录本异构体(isoform)的软件工具 -- ESPRESSO。其输出的结果文件可以后续对接rMATS-long,进行差异可变剪切的分析。

2023年01月20日,美国费城儿童医院/宾夕法尼亚大学的邢毅教授团队 (图1),在Science Advances上发表了题为 ESPRESSO: Robust discovery and quantification of transcript isoforms from error-prone long-read RNA-seq data 的研究论文。该研究开发了一款新的,用于处理比对后的长读长RNA测序数据的方法,能够有效提高剪接区域识别和转录本异构体(isoform)定量的准确性。

图1. 邢毅教授实验室成员

长读长RNA测序(RNA-seq)在表征转录组变异全长转录本异构体(isoform)方面具有巨大潜力,但当前长读长测序平台相对较高的错误率是一个主要挑战。我们开发了一种名为 ESPRESSO 的算法工具,用于从易出错的长读长数据中“鲁棒”(robust)地发现和定量转录本异构体。ESPRESSO 综合考虑了与一个基因比对上的所有长读长序列,并利用单个读长的错误特征来提高剪接位点的识别和相应转录本异构体的发现。在合成的RNA样本和人类RNA样本中,ESPRESSO 不仅在转录本异构体发现方面,还在转录本异构体定量方面优于多种现有的工具。我们总共生成并分析了约11亿条ONT测序平台的RNA-seq序列,覆盖了30个人类组织样本和三种人类细胞系。ESPRESSO 及其配套数据集为研究真核生物转录组的RNA谱提供了有用的资源(图2)。

图2. ESSPRESSO文章摘要

一、软件介绍

二、软件安装

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容