最近通过Sanger测序扩了一些序列,然后通过BLAST进行比对,后面如何处理这些序列虽然不是啥难事,但实验室老师问了我一些BLAST结果的信息当时没回答上来,觉得还是不能就这么迷迷糊糊的过去了,再整理一下BLAST的结果。
1. Basic BLAST 包含 5 个常用的 Blast:
BLASTP 是蛋白序列到蛋白库中的一种查询;
BLASTX 是核酸序列到蛋白库中的一种查;
BLASTN 是核酸序列到核酸库中的一种查询;
TBLASTN 是蛋白序列到核酸库中的一种查询。与 BLASTX 相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。
TBLASTX 是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6 条可能的蛋白序列)。
Specialized BLAST:是一些特殊目的的 Blast,如 Primer-BLAST、IgBLAST。
2. BLAST比对基本过程:
BLAST比对的基本过程是它首先找出查询序列和目标序列间所有匹配程度超过一定阈值的片段对,然后对片段对根据给定的相似性阈值进行延伸,得到一定长度的相似性片段,最后给出高分值片段对。
3. BLAST结果的描述区域。
我用Guc的样本ITS2序列进行了blast,
Score: 序列比对过程中计算的得分值,得分越高,序列匹配结果越好;
E值:表示随机匹配的可能性。E值越小,序列越相似,E值接近0或为0时,基本上就是完全匹配了。E值越大,随机匹配的可能性也就越大;
Identities:序列相似性,匹配上的碱基数占总序列长的百分数。如图所示:比对上的序列长度为1959bp, 我的序列长度为1585bp,其中1581个碱基匹配上了,
我是序列和比对到序列比起来,两端都少了一些碱基。此外有两个Gaps ,如下图:
Query: 自己的序列;
Sbjct:比对上的序列;
下一步把这些序列都下载下来,看看这些gap是不是稳定存在。
本文使用 文章同步助手 同步