毕业论文

PTM/Processing 提供蛋白质翻译后修饰或翻译后加工的相关信息。

expression 提供了基因在mrna  水平上的表达信息,或者在细胞中蛋白质水平上的表达信息,或者在不同器官组织中的表达信息。

interaction 提供了蛋白质之间相互作用的信息。

structure 提供蛋白质二级和三级结构信息。

family domains 提供蛋白质及结构域信息。

sequence 序列信息,,,异构体,可下载


PDB文件,文本文件,3D结构

Pfam 数据库是一个蛋白质结构域家族的集合。识别出蛋白质中的结构域对于了解蛋白质的功能有重要意义。search来匹配结构域。

CATH重要的蛋白质结构分类数据库。蛋白质被分为四种,C A T B 。

SCOP也是蛋白质结构分类数据库,但SCOP注重蛋白质进化方面的分类。(搜索PDB结构)

专用数据库,KEGG 简称京都基因组百科全书。代谢通路。每个点代表一个化合物,连线代表反应。


序列比对,,,替换记分矩阵(Substitution Matrix): 反应残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。分为DNA替换记分矩阵和蛋白质替换记分矩阵。

比较序列相似度:打点法:对角线及对角线的平行线都是相似序列。。。在线打点器可能需要安装java


序列比对法:Needleman-Wunsch算法。

在线双序列比对,  EMBL-EBI 

输入fast格式文件。gap open(gap开头)  gap extend(gap 延长)一般设置开头分高,延长分低。这种设置的缘由是在连续的序列里,打开一个口子的代价大。

如果有不同的预期,如下两种情况:

1,要比对的序列相似,期中一条结构已知,比对,

2,绝大部分相似,但期中一个的功能区序列缺失了。

全局比对中比对不好的在局部比对中被省略。(有时,序列并不同源,只是有相似的功能区,这时最好用局部序列比对。)


BLAST(Basic Local Alignment Search Tool):快速在数据库中寻找相似序列。用一条序列,与数据库中所有的序列一一进行双序列比对,寻找相似序列。

BLAST 原理是找片段对。

Blastx 将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库(因为并不知从那个碱基开始翻译,索性把三种情况都试一遍,因为核算序列有可能是互补链,所以有6种,而不是3种)。这样做的原因是核酸序列库和蛋白质序列库并不全面,或者有时需要的本来就是蛋白质序列。

blast虽然速度快,但牺牲了精确度,不会落下高度相似的序列,但相似度低的会被落下。这时可以选择PSI BLAST(标黄的搜索是新搜到的序列,下一轮搜索会作为比对序列来搜索。)


PHI-BLAST 用正则表达式来搜索。

smartblast 精确,懒人专用,直接输入序列。

多序列比对:找功能区,见电脑储存图片

多序列比对结果,一列全部相同底下一个*,若大致相似,有相似的,亲疏水性,大小相似则:  有不想似的则.  若完全不同则无。

在EMBL-EBI 的Clustal Omega 里比对完后,点Result Summary 选择Percent identity Matrix 可以查看各个序列间的相似度。

TCOFFEE  多序列比对。

jalview  比对结果修饰(重点)http:/www.jalview.org

多序列比对,寻找重要位点,保守区域。

序列标识图


MEME 帮助我们寻找序列中的特定片段,也可以对找到的特定片段搜索数据库。

PRINTS 蛋白质指纹图谱数据库。(蛋白质重要基序,可以查看3维结构。)重点。可以搜索相似蛋白。

研究进化,最确凿的证据,生物化石,解剖

分子进化。

系统发生树,有根,无根

构建系统发生树需要两个软件对比。

MEGA  要构建更好的系统发生树,必须学会至少3个参数的设置:test of phylogeny :

No. of bootstrap Replication(步长检验):(检验次数)  在每个节点出都会有一个百分数,指定次数次计算所得出的系统发生树中,有百分之多少棵树中有这一节点。一般绝大多数节点上的数值大于百分之70的树才可信。

Substitution Model(计算遗传距离时使用的计算模型) 

Gaps/Missing Date Treatment (删除多序列比对中含有空位的链)

Original Tree 是原始检验中其中的一棵树(树枝长度可以精确代表遗传距离。), Bootstrap consensus tree 是合并后的结果。



蛋白质结构预测与分析。


一级结构,氨基酸序列

二级结构,周期性的结构构象:DSSP文件

PDB网站获取蛋白质二级结构,输入PDB ID

预测蛋白质二级结构网站:PSIPRED

三级结构,整条多肽链的三维空间结构

四级结构,多个亚基形成的复合体结构


今天用licorice whole genome关键词搜索NCBI数据库,搜到了abrus precatorius,貌似是什么相思豆,土甘草,不管了,搜不到甘草的全基因组。用关键词                          self-incompatibility搜了自交不亲和基因。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 《道德经》中说:“自见,故明;不自是,故彰;不自伐,故有功;不自矜,故长。”
    温暖如初666阅读 133评论 0 1
  • 在学习、工作、生活中,很多朋友都问过我如何面对工作压力。其实作为一个职场年轻人,我也在默默地摸索中。在工作场合、以...
    设计师Yoyo阅读 1,205评论 3 16
  • 草根公务员小秘书一枚,30出头,四岁熊孩子妈妈。 公考遴选,县市省升级打怪,面试心得有一套。 秘书本职,材料写作好...
    小武秘阅读 318评论 0 2
  • 在你的行业/职业赛道里最希望对标的人物是谁?为什么? 这个问题是最近所有每日一问里我遇到的最难的一个问题。为什么?...
    笨熊也要喵阅读 243评论 0 0