蛋白质序列比对与蛋白质二级结构预测

#什么是蛋白质二级结构?

按照结构层次划分,蛋白质结构可以分为一级结构、二级结构、三级结构、四级结构:


蛋白质结构层次比较

蛋白质二级结构(secondary structure of protein)是指多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。 [1] 蛋白质二级结构的主要形式包括α-螺旋β-折叠β-转角、Ω环和无规卷曲。 [1] 由于蛋白质的分子量较大,因此,一个蛋白质分子的不同肽段可含有不同形式的二级结构。 [1] 维持二级结构的主要作用力为氢键。 [2] 一种蛋白质的二级结构并非单纯的α螺旋或β折叠结构,而是这些不同类型构象的组合,只是不同蛋白质各占多少不同而已。 [1]


蛋白质二级结构示意图

(来源百度百科https://baike.baidu.com/item/%E8%9B%8B%E7%99%BD%E8%B4%A8%E4%BA%8C%E7%BA%A7%E7%BB%93%E6%9E%84/1479025

##使用ClustalX,SWISS-MODEL,PDB,ESPript3.0对蛋白比对文件进行美化并预测二级结构

#SWISS-MODEL(https://swissmodel.expasy.org/)获得拟比对蛋白的同源蛋白PDB文件(针对拟比对蛋白中不存在具有PDB文件的蛋白的情况,如果拟比对蛋白中存在蛋白具有已知PDB文件的话,可直接去PDB网站下载)

操作顺序如下:Start Modelling-Upload Target Sequence File-Search For Templates- Modelling-Upload Target Sequence File-Search For Templates-获得同源蛋白列表-选择同源性最高的蛋白(同源性大于35%)并点击相关条目-获得PDB号(SMTL ID)-去PDB数据库下载PDB文件或者直接在当前页面进行下载PDB文件

同源蛋白list


同源性最高蛋白

#在PDB数据库(https://www.rcsb.org/)下载同源蛋白的PDB文件

操作顺序如下:Search-输入PDB号-Download Files-下载FASTA和PDB文件

拟下载PDB文件的蛋白

#ESPript3.0(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)美化蛋白比对文件并添加二级结构

操作顺序如下:蛋白序列比对文件.aln文件(包括上述提供PDB文件的蛋白序列,ClustalX比对获得)上传-下载的同源蛋白结构文件.pdb 文件上传-可设置其他参数进行个性化设置,这里不展开讲解-SUBMIT


上传页面

重点提示:

点击SUBMIT报错( " Fatal error: secondary structure elements are certainly misplaced ".)的话,可以在报错后,在提交页面根据Defining groups的Guidence中的顺序把PDB文件来自的蛋白序列放在第一位,然后重新提交(见F.A.Q. - ESPript 3 (ibcp.fr);其他常见问题也可在此查询)


Defining groups框

然后文件就新鲜出炉啦~


美化后的添加蛋白质二级结构的蛋白质序列比对文件
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容