命令行中tassel的使用

  • tassel需要Java环境

  • downloads tassel_5

cd 
wget -c https://bitbucket.org/tasseladmin/tassel-5-standalone/get/5f8d2852556a.zip
zip 5f8d2852556a.zip
mv tasseladmin-tassel-5-standalone-5f8d2852556a/ tassel/
  • 添加到环境变量中
echo export "PATH=/tassel/tassel:$PATH" >>.bashrc
  • 命令行的tassel有很多的plugin,可以使用下面的命令查看包含了那些plugin
run_pipeline.pl -ListPlugins
  • 而如果想要查看plugin的信息,可以使用下面的命令
run_pipeline.pl -<plugin_name> 
  • 比如查看listplugin的帮助信息
run_pipeline.pl -ListPlugins
  • 命令行的tassel可以使用pipeline同时来运行多条命令,但是需要注意的是,每调用一次plugin,在加完参数后都需要在加上 -endPlugin
run_pipeline.pl -importGuess maize.hmp.txt -KinshipPlugin -method Centered_IBS -endPlugin -ExportPlugin -saveAs maize_kinship.txt -format SqrMatrix
  • 多个管道可以交叉进行
管道可以由多个管道组成
要正确使用-fork 和-combine(-fork<id> 指明了需要执行的命令以及顺序 )
-combine只有在合并多个plugins输出的文件时才使用,作为接下来的plugin的出入
每一个fork都有一个id
Output from a Sub-Pipeline can be used as Input to a another Sub-Pipeline by referencing with the flag -input. (i.e. -input1)
Each Sub-Pipeline (i.e. -fork) runs in it’s own CPU Process (i.e. Thread)
  • 上述的举例
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> <plugin> -endPlugin -fork3 <plugin> <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> -input1 <plugin> -endPlugin -fork3 <plugin> -input1 <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -endPlugin -fork2 <plugin> <plugin> -endPlugin -combine3 -input1 -input2 <plugin> <plugin> <plugin>
run_pipeline.pl -fork1 <plugin> <plugin> -fork2 <pluginA> <pluginB> -input1
run_pipeline.pl -fork1 -importGuess mdp_genotype.hmp.txt -FilterSiteBuilderPlugin -siteMinAlleleFreq 0.01 -endPlugin -fork2 -importGuess mdp_phenotype.txt -excludeLastTrait -combine3 -input1 -input2 -intersect -FixedEffectLMPlugin -endPlugin -export glm_output
  • 改变内存大小
run_pipeline.pl -Xms512m -Xmx10g ...

我自己分析使用正常的代码

  • 将vcf文件转换为phy文件,一遍可以构建进化树,然后使用PhyML 构建进化树,但是需要注意的是,这个vcf文件应该只包含SNP信息,不能有indel信息,因为INDEL位点在转换为phy文件时,会变成-或者0,这个0在phylip软件运行时识别不了会报错,也可以把0转换为-。因为这个使用的是全基因组的变异信息,所以INDEL位点实际上影响不是太大,但为了结果的准确性,最好还是使用SNP信息
run_pipeline.pl -Xmx6G -importGuess zheng58_group_genotypegvcf_noother.vcf -ExportPlugin -saveAs zheng58_group.phy -format Phylip_Inter 
#第一次在运行这个命令是报错了,然后我将B73_V4_ctg、Pt和Mt这些开头的都去掉就没问题了
PhyML-3.1_linux64 -i zheng58_group.phy -d generic -b 1000 -m HKY85 -f m -v e -a e -o tlr

参考

Tassel 5.0 Pipeline (Command Line Interface)
Tassel 5 Pipeline Tutorial

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,742评论 19 139
  • .bat脚本基本命令语法 目录 批处理的常见命令(未列举的命令还比较多,请查阅帮助信息) 1、REM 和 :: 2...
    庆庆庆庆庆阅读 8,545评论 1 19
  • Spring Boot 参考指南 介绍 转载自:https://www.gitbook.com/book/qbgb...
    毛宇鹏阅读 47,291评论 6 342

友情链接更多精彩内容