单个基因的生物信息学分析(2)-蛋白质结构域预测

本期的主题仍然属于《单个基因的生物信息学分析》,主要讲解介绍一下单个蛋白质结构域分析。

网站链接如下:InterPro

打开主页面显示如图1,注意的是,一次只能进行一个蛋白序列的预测,且长度不超过40000个氨基酸残基。


图1

这里选择示例序列,run一下。

图2是结果部分,有三个部分,

图3

export 选项可以把比对结果以图片的形式展现出来,可以看到该序列包含的family, domain, homologous superfamily, conserved site, unintegrated

图4

以及该序列涉及到的GO调控通路。图5.

图5


图6显示了entries,包含了这些结构域在不同数据库的收录情况,其中我们看一下在pfam数据库。

图6

有6个在pfam数据库。我们将示例数据在pfam数据库进行验证,

pfam数据库链接Pfam: Search Pfam

图7

可以看到pfam数据库也包括6个相同的家族,表明我们的分析结果可靠性。

图8

因此,在进行蛋白结构域预测的时候,可以考虑使用interproscan和pfam同时进行分析,这样可信度更高。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。