多序列比对及相关工具

参考:https://www.bilibili.com/video/BV13t411372E?p=50

多序列比对,multiple alignment,是对两条以上的生物序列进行全局比对。

多序列比对的主要用途

1.确认:一个未知的序列是否属于某个家族;

2.建立:系统发生树,查看物种间或者序列间的关系;

3.模式识别:一些特别保守的序列片段往往对应重要的功能区域,通过多序列比对,可以找到这些保守片段;

4.已知推未知:把已知有特殊功能的序列片段通过多序列比对做成模型,然后根据该模型推测未知的序列片段是否也具有该功能;

5.其他:预测蛋白质/RNA 二级结构等等。

多序列比对工具

目前市面上的多序列比对工具都不是很完美,因为多序列比对的复杂度和双序列比对不是一个数量级的。你可以想象二维打分矩阵,但n维,是不是就太复杂了?

因此多序列比对算法,牺牲了准确度,以提升速度。

多序列比对注意事项

对序列的要求

  1. 序列的数量不能太多。一般10-15条,最好别超过50条。
  2. 序列的亲缘关系不能太远。两两之间序列相似度低于30%的一组序列,进行多序列比对的结果没有意义,甚至无法进行比对。
  3. 序列的亲缘关系不能太近。两两之间序列相似度高于90%的一组序列,进行再多的比对也是等于比对一条。
  4. 序列长度不能太短。多序列比对只支持差不多长的序列。
  5. 序列不能包含重复域。如果序列中包含过多的重复片段,序列比对的程序可能会报错。

对序列命名的要求

  1. 名字里不能有空格,可以用“_”代替空格。
  2. 不要用特殊字符,比如中文、@、#、¥、%等等。
  3. 名字的长度不要超过15个字符。
  4. 一组序列里,不要有重名的序列。
  5. 如果不按上述几点命名,多序列比对工具会自动地修改序列,以符合规范。

多序列比对工具

EMBL 的网页工具

embl 真是提供了太多的工具以供使用。


cluster omega

  • 这熟悉的界面~ 我们接着用参考序列


  • 我们直接使用默认值即可


  • submit 就好

  • 比对结果



    ps:一般来说,设置的aligned 排列规则可能会导致输出结果的序列顺序发生改变。

  • 显示序列颜色



    红色表示为保守序列

  • 同样也有对应符号的特殊含义


通过解读这些符号,我们可以了解保守区域的位置——一般来说是*: 比较密集的地方。

  • 查看结果总结


了解序列间关系

  • Percent Identity Matrix


第一列和第一行是一样的。其实我们只要看对角线一侧的结果就可以了,因为它们都是一样顺序对比的,结果也是对称的。
这个矩阵可以告诉我们所有矩阵两两之间的序列一致度。

  • Phylogenetic Tree 系统发生树


其实这个树本名应该叫guide tree,只是embl 在制作时,将结果发送给了做系统发生树的软件,所以形成了相同的构造。(并没有进行距离校正)因而不同作为系统发生树。
ps:现在的版本已经将guide tree 与Phylogenetic Tree 分隔开了。


Tcoffee

和clustal 系列算法上类似,但准确度上比clustal 系列略高,并且计算耗时上也略高。

另外,tcoffee 有很多变形,也意味着它有更多的功能。许多网站都提供tcoffee 的使用工具。


http://tcoffee.crg.cat/

  • Tcoffee 对于不同类型的序列,也提供了更进一步的比对工具。(其实是更多种类的咖啡)

Expresso 为序列加入结构信息,使结果更加准确。
M-coffee 把多个序列比对结果整合一个。
PSI/TM-coffee 专为穿膜蛋白打造。
PSI-coffee 专为远源序列打造。


expresso,蛋白质多序列比对


继续使用网站的示例序列。

  • 可以通过各种方式给入结构信息

如果有现成的结构文件(PDB),也可以直接上传。

也可以使用模版或通过系统自动查找


ps:一般计算需要比较久的时间,因此最好留个邮箱。


从结果来看,通过颜色反映对比结果的好坏。越好越红,越蓝越坏

而对比单纯地用T-coffee的话,expresso 也能给出更为精准的结果。


多序列比对保存格式

无论是cluster omega 还是tcoffee ,都提供了多种序列比对的保存格式。


选择合适的保存格式

多序列比对结果的编辑工具

Jalview

http://www.jalview.org/

在embl 的Multiple Sequence Alignment工具下,result 中也提供了jalview,可以快速启动。但需要注意的是,但这个在线版本功能不全。

软件版本的jalview 提供了更为全面的功能,且关联了非常多的数据库。


jalview 的软件界面

可以非常清晰地看到,jalview 有很多的功能。包括彩色显示,以及蛋白质结构,系统发生树等。



我们可以导入通过clustal omega 形成的.clustal 文件(多序列比对的结果)。

保守区、质量区、共有序列(所有序列出现频率最高的字母,如果是两个或两个以上字母,则显示+)


上色


color 下有很多种颜色供我们选择。
percentage identity 可以和 conservation 下的结果相匹配,会用深浅不同的蓝色表示。

通过调整by conservation,调整颜色出现的阈值。


  • 还可以根据clustal 结果上色,和clustal 比对网页中的颜色结果是相同的。


表格中表示了不同氨基酸有不同的颜色方案。

编辑序列

调整界面显示及图片导出

通过-format-wrap ,实现换行。


如果觉得字体太小,还可以通过format-font,进行调整。

如果我们只想要序列比对部分,不想要柱状图的注释。可以通过view-show annotation 取消。


我们还可以通过 calculate-sort 给比对中的序列排序。


还可以通过 calculate-pairwise alignment 为它们做双序列比对。

还可以通过选中不同的序列,通过 calculate-calculate tree 为它们做系统进化树。


还可以通过web service 为选中的某个序列做蛋白质二级结构预测。

弄好了一切,那就把图片导出来给大伙看看吧!


其他多序列比对美化工具

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352