基因家族流程:基因家族分析(一)
基因家族流程:基因家族分析(二)
====================================================================================================================================
蛋白性质和序列分析(都是在线网站分析)
1 蛋白性质(protein properties)
1)氨基酸数量、等电点和相对分子质量预测:
http://web.expasy.org/compute_pi/
将所有的蛋白序列整理成以下形式,批量计算。
ps:CDS长度批量计算可以利用序列比对工具。
其他网站:
https://web.expasy.org/protparam/
https://web.expasy.org/protscale/
2 亚细胞定位预测(Subcellular localization):
· 文件准备:蛋白序列,上传即可。
在线工具:
· CELLO:http://cello.life.nctu.edu.tw/
· WoLF PSORT: https://wolfpsort.hgc.jp/
· Cell-PLoc 2.0 :http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/
· TargetP:http://www.cbs.dtu.dk/services/TargetP/
2 基因结构分析(gene structure analysis)
1)在线网站GSDS2.0(Gene Structure Display Server 2.0):http://gsds.cbi.pku.edu.cn/
2)数据准备:gene&CDS序列或者gff3或者bed格式;可调整输出的顺序(outorder),修改label为Exon,可添加结构域存在区段。参看。
3)基因结构常见统计信息:自己excel或写程序统计
· The number of intron and exon.
· The splicing intron pattern inculding 0,1,2 phase.
· The marked region. For example kinase domain.
· sequence length.
· UTR
3 保守结构域和模体分析(conserved motif and motif annotate)
1 )保守domain:上传蛋白序列即可
phmmer search | HMMER:上传序列,确定domain(链接到Pfam)
Pfam search:google浏览器可以使用,有的浏览器打不开
SMART
NCBI Batch CD- search.:上传序列(包含多个数据库,结果可能不一样)
2) motif分析:上传蛋白序列即可,可调整模体数量
MEME suite:http://meme-suite.org/tools/meme
注意:蛋白序列文件要求输出顺序时,输入文件中顺序要调整好
3)Motif注释(不同网站结果有点不一致,大致参考)
ScanProsite: (https://prosite.expasy.org/scanprosite/)
BoxShade Server:https://embnet.vital-it.ch/software/BOX_form.html
注意:
基因结构,保守模体和保守结构域都可以用TBtools绘制。
再一次感谢CJ~