引言
pong可用于admixture结果可视化
官方网址:GitHub - ramachandran-lab/pong: Fast analysis and visualization of latent clusters in population genetic data提供了非常详细的安装和使用方法。
结果预览:
安装
准备
1.首先需要带GUI的操作系统,因为最终会需要在浏览器(Chrome,Firefox,Safari可以,IE不行)中打开,官网提供了Windows、Mac的教程。
2.其次需要python3(3.6及以上)的环境才能安装最新版,python2 可以使用早一点的版本。
开始是直接安装python3.8,https://www.jianshu.com/p/c13c63ad8ed9,但是总是会在运行pong时,报关于bz2的错,最终也没解决。
建议使用Anaconda准备python环境,很方便https://zhuanlan.zhihu.com/p/32925500
安装
conda install bzip2 #安装bz2包(可选步骤)
pip3 install pong #安装最新版pong
pip install pong==1.4.9 #安装1.4.9版本的pong,支持python2.7版本
conda list #确认列表中存在pong和bzip2
如果安装pong提示权限不足
sudo pip install pong #需输入密码
如果还是不行,尝试使用root
使用
准备文件
1.接受各种Q矩阵输入,具体的运算可参考https://www.jianshu.com/p/6668aee4681d
2.filemap :一个三列的文件,制表符分割
第一列自定义编号:字母开头,后接任意的字母、数字、下划线、连字符(不能太长)。还可以用#加描述进行注释。
第二列k值:至少要有一个和k值对应的Q文件
第三列Q文件:包含路径和文件名,如果Q文件在当前目录下,则不需要加路径。可以添加多个目录下的文件,但不能包含“#”
3.ind2pop(可选文件,建议加上):单列的文件,包含个体的种群标签。行数和Q文件行数应一致。
4.filename(可选文件,需在3的基础上添加) :可以为一列或两列文件,第一列是与ind2pop文件中种群对应的种群名。结果图从左到右的种群顺序,对应该文件从上到下的顺序,不加该文件则使用默认算法排序(看不懂)。结果图横坐标会显示对应的第二列(如果有)内容。
5.color(可选文件,当Kmax大于26时,是必须的):单列文件,接受所有通用的颜色格式(十六进制编码、RGB等),最好不要使用白色,行数必须大于Kmax,但是只有前Kmax行的颜色才会被使用。
运行
pong -m filemap -i ind2pop -n filename -l color
可选参数:
-c number #跳过Q文件每一行的前几列,默认是0,主要取决于Q文件的格式
-col_delim "," #默认是空白分隔符,用于解析Q文件
-o #设置输出目录,默认是创建一个pong_output_datetime的目录。使用该参数会创建一个目录,若目录已存在,则提供选择输出到已有目录下或覆盖
-f #与-o 同时使用,强制覆盖已有目录
-v #产生更详细的输出文件和额外的输出目录,详见官方手册7.3节
此外,还有更多的高级参数,但一般是用不上
输出
1.两个文件:params_used.txt包含运行的主要参数,result_summary.txt包含运行的主要模式。若使用-v 则会有更多的输出文件
2.一个网址,提示用户在浏览器打开,即上文的结果预览
特点:
1.将鼠标指到群体上时,展示隶属关系(≥ 0.5%)
2.单击某一颜色,将只显示该颜色,其他颜色变为白色
3.shift+单击种群或单击种群标签,高亮显示该种群。
4.鼠标置于图中,使用滚轮以鼠标为中心进行缩放。
5.可选多种格式下载全部图或单个k值图
参考文献:
Aaron A. Behr, Katherine Z. Liu, Gracie Liu-Fang, Priyanka Nakka, Sohini Ramachandran. pong: fast analysis and visualization of latent clusters in population genetic data. Bioinformatics, Volume 32, Issue 18, 15 September 2016, Pages 2817-2823, https://doi.org/10.1093/bioinformatics/btw327