在基因家族分析和候选基因的确定过程中,我们都会遇到需要查看promoter区域顺式作用元件的时候。所以今天就给大家分享一下,什么对启动子进行分析和结果的展示
1、提取基因promoter区域
一般提取基因上游1000~2000bp作为基因的promoter区域进行预测
#提取目标基因的gff文件
grep -f genes.id genome.gff3 > genes.gff3
#gff3文件格式转gtf格式
gffread -T -o genes.gtf genes.gff3
#提取基因上游上游序列
seqkit subseq --gtf genes.gtf \
--feature transcript \ #提取transcript上游
--up-stream 2000 \#提取长度
--id-ncbi \ #输出格式
--only-flank\ #不包括feature本身序列
--gtf-tag transcript_id \ #输出结果添加转录本id
genome.fasta > genes.upstream.fasta
2、对提取的promoter序列在在线网站plantCARE中进行预测
plantCARE:https://bioinformatics.psb.ugent.be/webtools/plantcare/html/
将 genes.upstream.fasta提交至网站,等待后从邮箱下载结果
一个名为plantCARE_output_PlantCARE_******.tab的文件为结果文件,也是后续我们要处理,并进行展示的文件。