linux脚本 | 去除系统发育树的支长和节点信息

介绍

系统发育树文件通常带有支长和节点信息,如遗传距离、位点数、支持率、分化时间等等,生成这样的信息一般是通过软件基于序列信息计算得到的。而在某些情况,我们需要删除这些信息,将其还原成一个不带有支长和节点信息的纯粹拓扑结构树文件。当分支过多无法手动删除时,可以使用以下脚本完成:
原树文件:

cat TREE.tre
(AB3039501:0.1407725357,((((((((AY4585951:0.1852444343,((KT8787191:0.0766471312,NC_0394111:0.0629126169)71.8/76:0.0212697120,NC_0200441:0.0738918614)100/100:0.0885191625)100/100:0.0828170616,NC_0323171:0.3396258972)99.8/100:0.0417881180,((JX5648861:0.3478457331,(MG0207721:0.2975091274,MG0207811:0.1848243312)100/100:0.0550933889)97.8/62:0.0237904467,((MG0207651:0.5194304916,MZ7510421:0.7398126943)98.5/56:0.0542524672,(NC_0187711:0.7497611531,NC_0323481:0.3138779842)94.4/60:0.0488882269)50/40:0.0237393404)100/100:0.0456730453)100/100:0.0522125255,NC_0323471:0.2425934555)100/100:0.0725292382,KT2858021:0.2341185025)99.9/100:0.0401796690,(KF7981951:0.2419142919,MF4962411:0.2327977799)61.7/62:0.0262765906)100/100:0.0487023558,AY4585961:0.1934500376)100/100:0.0465872157,SL454:0.1630815831)100/100:0.0443615170,MF5387871:0.0939151778);c
 cat TREE.tre | 
sed 's/,/[,/g' | 
sed 's/:/[:/g' | 
sed 's/)/[)/g'| 
awk -F, 'BEGIN{RS="["}{print }' | 
grep -v ":" | 
sed 's/)/)[/g' | 
awk -F, 'BEGIN{FS="["}{print $1}' | 
awk -F, 'BEGIN{ORS=" "}{print}' | 
sed 's/ //g'

去除支长和节点信息后的树文件:

(AB3039501,((((((((AY4585951,((KT8787191,NC_0394111),NC_0200441)),NC_0323171),((JX5648861,(MG0207721,MG0207811)),((MG0207651,MZ7510421),(NC_0187711,NC_0323481)))),NC_0323471),KT2858021),(KF7981951,MF4962411)),AY4585961),SL454),MF5387871)

注意:一般树文件后会有分号(英文符号“;”)结尾,跑完这个代码后,分号会丢失。分号在很多时候并非必要的,比如这个新的树文件仍然可以用FigTree打开。不过如果用以后续分析时,要注意格式中是否需要开头或结尾的符号,可以手动添加。
最终的树形态:

clean_TREE.tre.jpg

无根树

该树形特点即所有树的支长是相同的。这种树属于无根树,该树仅反应系统发育树中各个支系的拓扑关系,但不表征相对遗传距离,分歧时间以及共同祖先。作为系统发育关系的示意图展示就可以使用不带有支长信息的无根树,另外,一些软件分析时也会要求提供只含有拓扑结构的先验树。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,284评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,115评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,614评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,671评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,699评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,562评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,309评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,223评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,668评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,859评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,981评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,705评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,310评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,904评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,023评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,146评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,933评论 2 355

推荐阅读更多精彩内容