在简书看到的其他人的分享,我这里记录一下,简书对应的主页是
https://www.jianshu.com/p/94896e4cbb05
对应的github主页是 https://github.com/Dukunbioinfo/pipeline-for-lncRNAs
这个github主页还有其他关于转录组数据处理的内容,比如常用的一些R语言的脚本
https://github.com/Dukunbioinfo/R-scripts-for-RNA-seq
一些python脚本
https://github.com/Dukunbioinfo/RNA-seq
还有一个gtf文件的处理工具
https://github.com/Dukunbioinfo/in-house-gtftools
可以操作 stringtie 软件的输出结果,一个很有用的功能是根据gtf文件中的class code来提取想要的内容
安装方法
解压缩
unzip in-house-gtftools-master.zip
进入压缩得到的文件夹
cd in-house-gtftools-master/
安装用到的命令是
g++ *.cpp -o inhouseGTFtools
当前目录下回得到一个绿色的可执行文件
根据class code提取想要的内容
用我自己的数据试一下
~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode u -i merged.combined.gtf > u.gtf
~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode o -i merged.combined.gtf > o.gtf
~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode x -i merged.combined.gtf > x.gtf
之前自己做这个事情是利用python的pyGTF模块自己写脚本,有了这个工具就方便了很多
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!