利用ParaAT快速进行kaks批量运算

ParaAT是中科院基因组所的张章教授课题组开发的工具,它整合了计算ka/ks所需的一整套分析,包括:

  1. 蛋白序列比对(可选 clustalw2 | t_coffee | mafft | muscle)
  2. 根据蛋白比对结果回译成codon对应的核酸比对结果(Back-translated nucleotide alignments guided by amino acid alignments are more reliable and accurate than direct nucleotide alignments)
  3. 计算kaks值(KaKs_Calculator实现)
    常用的kaks计算软件如paml和kakscalculator需要准备的文件和指令都比较复杂,上手困难且容易出现问题,使用ParaAT能自动批量准备所需要的计算文件,十分便捷。

1.下载和安装

ParaAT2.0下载

ParaAT下载地址为:https://ngdc.cncb.ac.cn/tools/paraat
“ParaAT.pl”是运行的脚本,下载解压后就可以直接使用。可以把解压后的路径加入环境变量,或者用脚本所在的绝对路径来运行。

依赖工具下载
  1. 蛋白比对工具:如clustalw2、mafft、muscle等
  2. Kaks_Calculator(https://ngdc.cncb.ac.cn/tools/kaks

2. 输入文件准备

1.同源基因列表,格式如下
image.png

每一列列代表不同的样品,每一行表示为同源基因。

2.fasta格式的氨基酸序列文件和核苷酸序列文件,(两个文件中对应的序列以及同源基因列表中的对应基因ID要完全相同)
3.多线程运行文件

该脚本运行需要一个单独文件来设置运行的线程数,默认文件名为proc,直接新建一个proc文件在里面输入一个数字来指定使用的线程数。
这三种文件的样本在安装包中有,分别是:test.homologs, test.pep, test.cds, proc,可以分别打开参考一下。

3.运行ParaAT

准备好文件之后运行非常简单,常用命令如下

ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -f axt -g -k -o result_dir #proc文件必须与输出位置在同一个目录下,不然会报错

之后就可以在result_dir里面提取kaks结果了

参数:

-h, 指定同源基因列表文件
-n, 指定核酸序列文件
-a, 指定蛋白序列文件
-p, 指定多线程文件
-m, 指定比对工具
-g, 去除比对有gap的密码子
-k, 用KaKs_Calculator 计算kaks值
-o, 输出结果的目录
-f, 输出比对文件的格式

注:
如果需要用PAML,Hyphy等工具分析kaks时,ParaAT也可以生成这些工具所需的输入格式(-f 参数)
如果是细菌的序列,需要设置成细菌对应的Genetic Code used (-c 11)。其他物种同理,默认的是The Standard Code (-c 1)

运行之后发现使用ParaAT计算kaks速度非常慢,查阅资料发现Kaks_calculator 默认会将所有的就算方法得到的结果取平均值,大大减低了计算速度,所以先使用ParaAT获得Kaks_calculator需要的文件再选定方法进行计算

for i in  `cat ./list/list00`
do 
     ParaAT.pl -h ./blastp/${i}.select.id -n ./cds/${i}_new.cds -a ./pep/${i}_new.pep -p proc -m muscle -f axt -g  -o ./axt/${i}
done
 #proc文件必须与输出位置在同一个目录下,不然会报错
for a in `cat list/list00`
do 
    mkdir ./kaks/${a}
    for i in `ls  ./axt/${a}`
    do
        KaKs_Calculator -i ./axt/${a}/${i} -o ./kaks/${a}/${i}.kaks -m YN
    done
done

这样就能获得需要的kaks数据。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,976评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,249评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,449评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,433评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,460评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,132评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,721评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,641评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,180评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,267评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,408评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,076评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,767评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,255评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,386评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,764评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,413评论 2 358

推荐阅读更多精彩内容