[ZT] 常用在线序列比对工具

文章来源:企鹅号 - 卡嘿哟

从早期序列比对工具Needleman-Wunsch、Smith-Waterman到后来的Clustal算法,以及近几年的Muscle、MAFFT序列比对算法。算法在向更快、更精确、能处理更多数据这些方向进行缓慢而有力的发展。常用的在线序列比对工具主要由EMBL-EBI提供,包括但不限于Needle, Water, Clustal Omega, Muscle, Mafft, T-coffee等,以及NCBI提供的blast2seq工具;常用的序列相似性搜索工具有NCBI提供的BLAST、UCSC提供的BLAT等。EMBL-EBI与NCBI同时期也开发了一套序列相似性搜索工具FASTA,然后最终没能流行起来。BLAST一家独大,BLAT依赖UCSC占据一点小市场,FASTA的亲爹同时提供了FASTA及BLAST服务,可能现在说FASTA人们只会想到FASTA文件格式吧。EMBL-EBI提供大量的对比工具在线服务,并不代表其拥有这些工具的所有权。

按工具功能大致可以分为3类:配对序列比对工具多序列比对工具以及序列相似性搜索工具

image

配对序列比对是用来研究两条序列(核酸序列或者蛋白序列)之间功能、结构或者进化关系。

多序列比对工具当然也支持配对序列比对,不过更多的是用来比对3条及以上序列,研究序列之间是否同源以及序列间的进化关系。

序列相似性搜索工具主要是在一个序列数据库中查找一条序列,找出与查询序列最相似的序列。

配对序列比对工具

工具集网址:

https://www.ebi.ac.uk/Tools/psa/

这些可能是史前比对工具了,现在估计没有什么人在用了,可能也没人听过还有这样的工具存在。但是他大爷毕竟是他大爷,如果想比对两条序列全局情况,Needle仍是不错的选择,至于Smith-Waterman算法,在许多二代比对算法里仍可见,比如bwa-sw算法,Minimap2计算overlap时使用的也是Smith-Waterman算法;Smith-Waterman也拥有CUDA版本程序。

Needle比对工具

以Needle工具为例进行一下简单的演示,其提供了核酸及蛋白比对两个版本,比对不同类型的序列需要选择不同的工具。Needle是全局比对工具,将两条序列全部内部进行比对并展示。

1. 打开Needle核酸比对工具页面

https://www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html

2. 输入两条需要比对的序列

一个文本框里输入一条FASTA记录,其他参数不需要调整。

image

3. 查看结果

Needle的结果看起来是非常友好的,类似于NCBI BLAST显示结果,

image

多序列比对工具

工具集网址:

https://www.ebi.ac.uk/Tools/msa/

该主页提供了多款多序列比对工具,其中Clustal Omega结果形式是全局比对形式,但是算法还是局部比对算法,不建议在分子进化树分析过程使用Clustal相关程序,因为其速度及准确度均逊色于下述的MAFFT及MUSCLE。

下表列出了常用的多序列比对工具,在平时学习或者工作中建议使用MAFFT或者MUSCLE进行多序列比对。

MAFFT比对工具

MAFFT是2002年开发的一款快速的局部/全局多序列比对工具,与之相对的是2004年开发的MUSCLE多序列比对工具,在网页使用过程中,两者差异不明显,但是MUSCLE在比对数百条、数千条序列时,速度较慢,这时候使用MAFFT效果会好一点。

1. 打开MAFFT主页

https://www.ebi.ac.uk/Tools/msa/mafft/

image

2. 输入自己想要进行比对的多序列

支持2条以上序列比对,目前EMBL-EBI提供的网页版本MAFFT最大支持500条序列且文件大小不超过1MB(差不多1,000,000bp的碱基)。如果自己提交的文件较大,可以在提交时勾选Be notified by email。这样在比对完成时,EMBL-EBI会邮件通知你比对结果。

image

3. 查看结果

提交任务,过一段时间后就可以查看到比对结果了。其中Phylogenetic Tree可以查看分子进化树。

image

不同序列比对工具对比

其他工具使用方式与MAFFT一致,相对于ClustalW/Clustal Omega,MAFFT及MUSCLE比对结果无计数。但是MAFFT及MUSCLE在处理INDEL时,效果比ClustalW/Clustal Omega要好。

image

相同两条序列不同软件比对结果

可以很明显的看出各种工具对INDEL的处理,这主要是不同工具使用算法不同有关。Clustal,Water及blast2seq,在遇到Gap及Gap持续延长时,比对分值线性下降,而其他几种算法在遇到Gap及Gap持续延长时,比对分值会下降但不会低于0,不会线性下降。

序列相似性搜索工具

工具集网址:

https://www.ebi.ac.uk/Tools/sss

EMBL-EBI提供了FASTA及BLAST两款序列相似性搜索工具,不过序列相似性工具还是使用NCBI的BLAST以及UCSC的BLAT比较好。

NCBI BLAST

BLAST是目前最常用的生信工具之一,NCBI围绕BLAST开发了大量的周边工具,比如引物设计及特异性验证工具Primer-BLAST。

1.打开BLAST主页

https://blast.ncbi.nlm.nih.gov/Blast.cgi

其提供了4款BLAST子工具,常用的是核酸BLAST以及蛋白BLAST,点击核酸BLAST进入工具内部。

2. 选择适合的参数进行搜索

image

3. 搜索结果查看

有疑问可以点击整个页面右上角的HELP,进行个人自助。

image

4. 图形化浏览比对结果

这里又可以使用NCBI强大的基因组浏览功能了,可以添加自己想要的track进行数据关联展示,可惜好多人不太喜欢这个功能。

image

UCSC BLAT

1.打开BLAT主页

https://genome.ucsc.edu/cgi-bin/hgBlat

2. 选择合适参数进行序列搜索

image

3. 搜索结果查看

详细结果支持两种查看方式:基因组浏览器以及文本形式。基因组浏览器形式可以查看全局比对情况,以及匹配区域在基因组中的位置、注释等情况,文本形式可以详细的查看比对结果。

4. 基因组浏览器查看比对结果

image

5. 文本形式比对结果

image

BLAT更多体现的是一个定位功能,将查询序列定位到目标基因组上,而BLAST更加的是搜索功能,从序列数据库中搜索出与查询序列接近的目标序列。

总结:

对于链相反的序列比对建议使用blast2seq;

对于序列相似,想要查看序列全局比对的建议使用needle及MAFFT;

对于多条序列比对,建议使用MAFFTT;

实在特别想要Clustal计数形式结果,建议使用Clustal Omega或者Needle;

想做多条序列分子进化树,建议MAFFT;

未知序列搜索,想要研究序列功能可以使用blast,速度稍慢,但搜索库数据量大;

某一物种未知序列定位,建议使用blat,速度快。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容