转录组分析中的技术重复或生物学重复检查

一: 首先准备两个文件:

1. 基因表达的counts.matrix 文件(即上一步生成的isoforms.counts.matrix 与genes.counts.matrix )


2. 生物学重复的表文件


记住samples.txt中的名字需要和matrix中的名字一致,否则没办法识别。

二: 调用PtR脚本

$PtR  #调用PtR脚本

--matrix isoforms.counts.matrix  #指定给定的matrix

 --samples samples.txt  #样品重复信息

 --log2  #做一个对数处理

 --min_rowSums 10  #过滤数据指标

 --compare_replicates  #输出的图像参数

同理做genes.counts.matrix,最终会生成许多pdf文件。


最后结果就是关于一个处理中生物学重复之间的相关性的几个图,放在一个PDF上的.



几个图的意思还没大懂,请指教!

三:下面进行跨样本间的相关性检测与作图

$PtR

--matrix isoforms.counts.matrix \

--min_rowSums 10 \ 

--samples samples.txt \ 

--log2 \ #数据转换参数 

--CPM \ #数据转换参数 

--sample_cor_matrix #输出样品相关性矩阵图

这个代码做出来的结果是不同样本间的数据一致性热图


四:最后一个结果是通过PCA分析对样品重复关系进行检测。

$PtR

--matrix isoform.counts.matrix \

--samples samples.txt \

--log2 \

--min_rowSums 10 \

--CPM \

--center_rows \

--prin_comp 3

输出结果为PCA分析图 (pdf)


同理做genes.counts.matrix。

到此结束!

欢迎交流,909474045@qq.com

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容