本期的主题仍然属于《单个基因的生物信息学分析》,主要讲解介绍一下单个蛋白质结构域分析。
网站链接如下:InterPro
打开主页面显示如图1,注意的是,一次只能进行一个蛋白序列的预测,且长度不超过40000个氨基酸残基。
这里选择示例序列,run一下。
图2是结果部分,有三个部分,
export 选项可以把比对结果以图片的形式展现出来,可以看到该序列包含的family, domain, homologous superfamily, conserved site, unintegrated
以及该序列涉及到的GO调控通路。图5.
图6显示了entries,包含了这些结构域在不同数据库的收录情况,其中我们看一下在pfam数据库。
有6个在pfam数据库。我们将示例数据在pfam数据库进行验证,
pfam数据库链接Pfam: Search Pfam
可以看到pfam数据库也包括6个相同的家族,表明我们的分析结果可靠性。
因此,在进行蛋白结构域预测的时候,可以考虑使用interproscan和pfam同时进行分析,这样可信度更高。