PTM/Processing 提供蛋白质翻译后修饰或翻译后加工的相关信息。
expression 提供了基因在mrna 水平上的表达信息,或者在细胞中蛋白质水平上的表达信息,或者在不同器官组织中的表达信息。
interaction 提供了蛋白质之间相互作用的信息。
structure 提供蛋白质二级和三级结构信息。
family domains 提供蛋白质及结构域信息。
sequence 序列信息,,,异构体,可下载
PDB文件,文本文件,3D结构
Pfam 数据库是一个蛋白质结构域家族的集合。识别出蛋白质中的结构域对于了解蛋白质的功能有重要意义。search来匹配结构域。
CATH重要的蛋白质结构分类数据库。蛋白质被分为四种,C A T B 。
SCOP也是蛋白质结构分类数据库,但SCOP注重蛋白质进化方面的分类。(搜索PDB结构)
专用数据库,KEGG 简称京都基因组百科全书。代谢通路。每个点代表一个化合物,连线代表反应。
序列比对,,,替换记分矩阵(Substitution Matrix): 反应残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。分为DNA替换记分矩阵和蛋白质替换记分矩阵。
比较序列相似度:打点法:对角线及对角线的平行线都是相似序列。。。在线打点器可能需要安装java
序列比对法:Needleman-Wunsch算法。
在线双序列比对, EMBL-EBI
输入fast格式文件。gap open(gap开头) gap extend(gap 延长)一般设置开头分高,延长分低。这种设置的缘由是在连续的序列里,打开一个口子的代价大。
如果有不同的预期,如下两种情况:
1,要比对的序列相似,期中一条结构已知,比对,
2,绝大部分相似,但期中一个的功能区序列缺失了。
全局比对中比对不好的在局部比对中被省略。(有时,序列并不同源,只是有相似的功能区,这时最好用局部序列比对。)
BLAST(Basic Local Alignment Search Tool):快速在数据库中寻找相似序列。用一条序列,与数据库中所有的序列一一进行双序列比对,寻找相似序列。
BLAST 原理是找片段对。
Blastx 将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库(因为并不知从那个碱基开始翻译,索性把三种情况都试一遍,因为核算序列有可能是互补链,所以有6种,而不是3种)。这样做的原因是核酸序列库和蛋白质序列库并不全面,或者有时需要的本来就是蛋白质序列。
blast虽然速度快,但牺牲了精确度,不会落下高度相似的序列,但相似度低的会被落下。这时可以选择PSI BLAST(标黄的搜索是新搜到的序列,下一轮搜索会作为比对序列来搜索。)
PHI-BLAST 用正则表达式来搜索。
smartblast 精确,懒人专用,直接输入序列。
多序列比对:找功能区,见电脑储存图片
多序列比对结果,一列全部相同底下一个*,若大致相似,有相似的,亲疏水性,大小相似则: 有不想似的则. 若完全不同则无。
在EMBL-EBI 的Clustal Omega 里比对完后,点Result Summary 选择Percent identity Matrix 可以查看各个序列间的相似度。
TCOFFEE 多序列比对。
jalview 比对结果修饰(重点)http:/www.jalview.org
多序列比对,寻找重要位点,保守区域。
序列标识图
MEME 帮助我们寻找序列中的特定片段,也可以对找到的特定片段搜索数据库。
PRINTS 蛋白质指纹图谱数据库。(蛋白质重要基序,可以查看3维结构。)重点。可以搜索相似蛋白。
研究进化,最确凿的证据,生物化石,解剖
分子进化。
系统发生树,有根,无根
构建系统发生树需要两个软件对比。
MEGA 要构建更好的系统发生树,必须学会至少3个参数的设置:test of phylogeny :
No. of bootstrap Replication(步长检验):(检验次数) 在每个节点出都会有一个百分数,指定次数次计算所得出的系统发生树中,有百分之多少棵树中有这一节点。一般绝大多数节点上的数值大于百分之70的树才可信。
Substitution Model(计算遗传距离时使用的计算模型)
Gaps/Missing Date Treatment (删除多序列比对中含有空位的链)
Original Tree 是原始检验中其中的一棵树(树枝长度可以精确代表遗传距离。), Bootstrap consensus tree 是合并后的结果。
蛋白质结构预测与分析。
一级结构,氨基酸序列
二级结构,周期性的结构构象:DSSP文件
PDB网站获取蛋白质二级结构,输入PDB ID
预测蛋白质二级结构网站:PSIPRED
三级结构,整条多肽链的三维空间结构
四级结构,多个亚基形成的复合体结构
今天用licorice whole genome关键词搜索NCBI数据库,搜到了abrus precatorius,貌似是什么相思豆,土甘草,不管了,搜不到甘草的全基因组。用关键词 self-incompatibility搜了自交不亲和基因。