根据基因组fa文件和gff文件提取cds并翻译成pep

cds文件:注释信息里的蛋白编码序列
pep文件:cds对应序列翻译成的氨基酸序列
从NCBI上下载基因组时,有的并没有上传cds文件和pep文件,此时该怎么办呢?


(1)利用脚本

①根据注释文件提取转录本:
生信笔记系列之序列提取--根据GTF提取转录本
从NCBI基因组数据中获得cds,pep和geneID对应表- 薛猫_柳叶 ...
②将cds转换成pep:
从cds到pep

(2)利用cufflinks中的gffread工具

GTF/GFF格式gffread入门使用

# conda上安装cufflinks,使用之前激活环境
source /data1/spider/liupiao/miniconda3/bin/activate
# 提取cds
gffread in.gff3 -g ref.fa -x cds.fa
# 获得pep
gffread in.gff3 -g ref.fa -y pep.fa
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容