流程github 主页
https://github.com/wjian8/psvcp_v1.01
对应论文
A pangenome analysis pipeline provides insights into functional gene identification in rice
依赖软件 除了mummer4.0以外都可以用conda安装
mummer安装遇到的报错
运行如下命令
./configure --prefix=/home/myan/biotools/mummer-4.0.0beta
报错信息
error: Compiler does not support std::this_thread::sleep_for
查了一下这个报错信息,说可能是和gcc g++的版本有关,我在我的虚拟环境下运行了了如下命令
conda install gxx
然后再运行如下命令就没有报错了
./configure --prefix=/home/myan/biotools/mummer-4.0.0beta
依赖软件除了github主页写的,还有biopython 和 mosdepth
试着运行示例数据的时候还遇到了报错
The following objects are masked from ‘package:parallel’:
clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
clusterExport, clusterMap, clusterSplit, makeCluster, parApply,
parCapply, parLapply, parRapply, parSapply, splitIndices,
stopCluster
Error in .set(h, keys = file_name, values = read.table(file = paste(depthfile_dir, :
could not find function ".set"
这部分是R脚本里的报错,.set是hash这个R包里的函数,自己之前是用conda install r-hash安装的这个R包 查了一下安装的版本是3.0.1,自己在笔记本电脑上用install.packages('hash')
安装这个R包,安装的版本是2.2.6.2 可能是R包的版本对不上,最新版R包里可能没有.set()这个函数,在linux系统下直接用install.packages('hash')
这个命令来安装这个R包
还有一个问题是 使用conda 安装Assemblytics这个软件的时候会自动安装一个3点几版本的mummer
我把手动安装的4.0版本的mummer添加到的环境变量,重新链接服务器再次运行这个流程,优先调用的还是conda环境下的3点几版本的mummer, 还得source ~/.bashrc 才会优先调用自己手动安装的mummer4.0 这个暂时有些搞不明白
(这里如果先安装mummer4,添加到环境变量,然后再conda安装Assemblytics应该就不会有这个问题了)
运行流程
python /mnt/sdc/chloro/biotools/psvcp_v1.01-main/psvcp.py ConstructPanAndCallPAV ../example7/genome_gff_dir_example ../example7/genome_list -fqd ../example7/fq_dir_example -o population_hmp
没有遇到报错
最后也没有看到所有流程都运行完的提示
最终的输出结果
结果文件对应的谁是谁还得好好研究
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!