启动子分析(顺式作用元件预测)(一)

在基因家族分析和候选基因的确定过程中,我们都会遇到需要查看promoter区域顺式作用元件的时候。所以今天就给大家分享一下,什么对启动子进行分析和结果的展示

1、提取基因promoter区域

一般提取基因上游1000~2000bp作为基因的promoter区域进行预测

#提取目标基因的gff文件

grep -f genes.id  genome.gff3 > genes.gff3

#gff3文件格式转gtf格式

gffread -T -o  genes.gtf  genes.gff3
#提取基因上游上游序列

seqkit subseq --gtf genes.gtf \

    --feature transcript \ #提取transcript上游

    --up-stream 2000 \#提取长度

    --id-ncbi \ #输出格式

    --only-flank\ #不包括feature本身序列

    --gtf-tag transcript_id \ #输出结果添加转录本id

    genome.fasta > genes.upstream.fasta

2、对提取的promoter序列在在线网站plantCARE中进行预测

plantCARE:https://bioinformatics.psb.ugent.be/webtools/plantcare/html/

image

将 genes.upstream.fasta提交至网站,等待后从邮箱下载结果

image

一个名为plantCARE_output_PlantCARE_******.tab的文件为结果文件,也是后续我们要处理,并进行展示的文件。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容