回顾 | 系统进化树构建的常见方法

构建进化树的方法主要分为

  1. 距离矩阵法(含 UPGMA、ME、NJ等)
  2. 最大简约法(MP)
  3. 极大似然法(ML)
  4. 贝叶斯法(Bayesian)

基于距离的进化树构建方法

常用的距离法构建系统树:

  1. 不加权算术平均对方法(Unweighted Pair-Group Method using Arithmetic average, UPGMA)
  2. 最小进化距离法(Mnimal Evolution Method)
  3. 邻接法(Neighbor-Joining Method, NJ)

这一系列方法主要考量参数是:

  1. 如何计算距离,节点间的距离;cluster之间的距离;校正的距离
  2. 如何聚类?

UPGMA 法

本质上是“自下而上”或者说“聚合”的层次聚类(hclust)法,且距离的计算采用“平均距离法”。一般绘制热图,常见的表达模式聚类方法也是 hclust,往往默认“最长距离法”。两者只是cluster之间距离的计算方式不同。当所有分支的突变率相同,UPGMA效果较好。

最小进化法(ME)

寻找某一进化树的拓扑结构,使得全树枝长总和最短。逻辑上需要对每一个拓扑结构进行评估,当序列增加时,计算量暴增。



这个与后续提到的最大简约法(MP)的最大区别是:(1)ME法直接基于一个距离矩阵,计算的是最终进化树枝长总和最小;(2)MP法直接基于序列,计算的最终是在当前拓扑结构下,所有序列需要发生突变的位点的总和最少。

邻接法(NJ)

与UPGMA几乎相反,UPGMA约等于层次聚类的聚合法;而NJ法从拓扑结构的变化上来看,与层次聚类的分离法比较像。当然还是有比较大的区别。层次聚类的分离实现考量的是分离后两个cluster的内部距离总和最小。NJ法考量的是分离出来的两个leaf node的校正距离最小。这一校正距离综合考量了每个leaf node以及cluster的距离。在距离计算上的实现,逻辑上比层次聚类的分离法要简单一些。简单实现了一下,似乎还是跟UPGMA法类似,NJ法计算逻辑其实还是跟层次聚类的聚合法比较像。最大的区别,仍然是距离的计算。但是,在不少资料中翻阅,图示上似乎不是这个画法。
简单摘菜已报道文稿的NJ法实现逻辑,代码就不摆了。写完之后,感觉跟写TBtools的热图聚类逻辑类似,效率上还是不太行。估计还是要想想办法重构代码。感兴趣的朋友也可以参考Nei老爷子的论文(同样重磅的还有他的NG86算法,计算dnds的....可以说是目前最常用方法之一)。简单来说,就是都挺准,但又容易实现,且很快,着实大神级别。



百度的时候发现国内有不少关于NJ法的小改进,当然都是很多年前。我猛然发现,对于经典算法的实现阐述,新的算法改进论文写得更清晰。当然可能是 typeset 的问题。毕竟现在的印刷和公式编辑都比以前方便得多。



(注:dlk 应是笔误,应为 dik)

最大简约法

距离法的主要特点是距离实质是序列两两之间的距离,在进化树构建的构建的过程中,逻辑上不存在距离重新计算,直接导入一个距离矩阵即可建树。最大简约法考量的距离具体到每条序列的每个位点。拓扑结果改变时,序列两两间两位点的所需的突变次数同样变化。最大简约法遍历所有拓扑结构,并寻求全局位点突变次数最小的一个。

极大似然法

Emmm,突然不想写了。极大似然法确实没时间捋明白,还没做过代码实现。大体认知,拿着进化模型来看不同拓扑结构(进化树)出现的可能性。可能性越大也就越准确。当然,这里的问题就还是哪个模型合适,这个还是要算一算的。拿错模型的话....
ML法跟MP法逻辑上都是要遍历所有树,当然,一般情况下....还是用 UPGMA 或者 NJ 建个树,作为起始树,然后改吧改吧,看看结果是不是更优,直到似乎找不到更优,就认为当前最优。于是,出现局部最优,逻辑合理。

贝叶斯法

至今未用过.... 明明是干一个事情,一定要把方法搞得越复杂越好,参数越多,模型就流弊。当我们把固定参数变成分布,ML就变成bayesian....

写在最后

Emmm.... 今天,就水一文。昨天海边玩累了,今天干活也没力气,只能准备准备课件。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352

推荐阅读更多精彩内容