登录注册写文章

有参转录组实战8-基因功能注释_GO_KEGG_swissprot_pfam_TFDB_iTAK

啊辉的科研

有参转录组实战8-基因功能注释_GO_KEGG_swissprot_pfam_TFDB_iTAK

#进行功能注释时，我们只用到蛋白文件，就是上一期提取序列的文件“Ptri.protein.fa”。

#使用命令“grep -c ">" Ptri.protein.fa”统计下“>”的个数，发现有52400个。

#新建文件夹“swissprot”

wget https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz

gunzip -c uniprot_sprot.fasta.gz >uniprot_sprot.fasta#解压

conda install diamond#安装

diamond makedb --in uniprot_sprot.fasta --db uniprot_sprot.fasta#建索引

nohup diamond blastp -d uniprot_sprot.fasta -q Ptri.protein.fa --max-target-seqs 1 --outfmt 6 --evalue 1e-5 > blastp.out &#注释

#查看文件blatp.out，十二列解释看表头

#新建文件夹“pfam”

wget http://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam34.0/Pfam-A.hmm.gz#下载

gunzip -c Pfam-A.hmm.gz > Pfam-A.hmm#解压

conda install hmmer#安装

hmmpress Pfam-A.hmm#构索引

nohup hmmscan --domtblout pfam.domtblout Pfam-A.hmm

Ptri.protein.fa &#注释

#查看文件pfam.domtblout

#Plant TFDB网站预测转录因子http://planttfdb.gao-lab.org/prediction.php

#预测了3835个转录因子。自己下载整理。

#iTAK预测转录因子、调控因子、激酶http://itak.feilab.net/cgi-bin/itak/online_itak.cgi

#接着GO注释和KEGG注释。以下重点参考https://zhuanlan.zhihu.com/p/475588763教程。

#http://eggnog-mapper.embl.de/

#打开邮箱

#开始工作

#等约半小时，打开链接下载结果

#只要这一个

#使用TBtools的这个功能

#放入注释文件

#得到几个txt文件，后面的富集会用到。

#最后自己用excel整理下，可以得到基因的各种注释信息。

#赛博朋克边缘行者

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

基因功能注释
基因功能注释，简单来说，即是根据已有的蛋白库，对从基因组上提取到的蛋白序列进行比对，从而获得相应的信息。这里整理...
队长的生物实验室阅读 8,468评论 0赞 7
「生信」基因组功能注释后的基因筛选
目录写在前面功能注释数据库介绍方法一: 以KEGG的注释结果为主, 筛选出每个品种包含的特异通路及基因方法二: 利...
bioinfo_boy阅读 13,159评论 2赞 37
数据库 | 基因组注释
导读从网上收集的一些数据库信息，方便学习查看： VFDB PHI TCDB Swiss Prot Pfam GO...
胡童远阅读 12,355评论 0赞 9
如何对基因组序列进行注释
基因组组装完成后，或者是完成了草图，就不可避免遇到一个问题，需要对基因组序列进行注释。注释之前首先得构建基因模型，...
xuzhougeng阅读 51,769评论 14赞 185
采用Trinotate对拼接结果进行注释
一：开始之前需要准备三个东西：第一：安装软件 1.Trinity[http://trinityrnaseq.gi...
多啦A梦的时光机_648d阅读 4,642评论 1赞 7

1赞2赞

赞赏

手机看全文