安装好HIBLUP后,我们可以参考HIBLUP的教程进行测试Tutorials – HIBLUP。直接在下载页面下载TestData.zip,下载完成后移动到hiblup_test中解压。在TestData文件夹中有以下文件:
其中genotype.bed\genotype.bim\genotype.fam三个文件是PLINK定义的基因型文件,pedigree.txt和phenotype.txt顾名思义,分别是系谱文件和表型文件。
根据HIBLUP教程,我们先计算一下等位基因频率,打开Ubuntu,命令行输入cd desktop/hiblup_test/将工作目录切换到hiblup_test文件夹。输入./bin/hiblup --bfile ./TestData/genotype --freq --out test 运行HIBLUP。--bfile后面指定输入基因型文件的前缀,--freq表示计算等位基因频率,--out后面输入结果文件的前缀。命令行运行效果如下:
运行完成后,我们在当前工作目录(hiblup_test)下获得了test.log和test.freq两个文件,test.log记录了本次程序运行的相关信息,test.freq包含了等位基因频率运算的结果,可以用记事本打开。
接下来计算关系矩阵,先基于系谱进行计算:
> ./bin/hiblup --make-xrm --pedigree TestData/pedigree.txt --add --add-inv --out test
--make-xrm表示生成关系矩阵,--pedigree指定了生成矩阵需要的系谱文件,--add --add-inv表示生成A矩阵和对应的逆矩阵,运算结果包括了两个矩阵,四个矩阵文件和一个log文件,.bin后缀的是二进制文件,.id后缀的文件包含了个体号,与.bin文件对应。
基于基因型计算系谱矩阵:
> ./bin/hiblup --make-xrm --bfile ./TestData/genotype --add --dom --out test_g
--add --dom 表示计算A矩阵和D矩阵运算结果同上。这些矩阵将在后续的遗传学分析中输入。
还有一些参数如--step设置单次读取的SNP数量,--snp-weight设置snp的权重,--extract和--exclude可以选取部分snp进行运算,--alpha设置构建H矩阵时系谱所占的权重,另外,环境随机效应矩阵也可以用--make-xrm生成。
因为HIBLUP产生的矩阵文件都是二进制文件,无法直接读取,也不能被其他遗传分析软件使用,所以HIBLUP还有一个参数--trans-xrm,可以转换矩阵文件的格式。
> ./bin/hiblup --trans-xrm --xrm test.PA --out test
--trans-xrm表示运行转换程序,--xrm后面跟的是矩阵文件的前缀,包含了.id文件和.bin文件。运行结果包括test.txt和test.id.txt文件,这里有一个小问题,test.id.txt文件为UTF-8格式,test.txt文件格式为US-ASCII,如果系统语言是中文,记事本打开US-ASCII格式的文件会乱码。推荐大家安装glogg,非常适合查看大型的文本文档。
使用--triangle参数可以改变矩阵的输出格式(行、列、值)。
同时指定--xrm-txt和--xrm-id也可以将文本格式的矩阵转换为二进制格式。
——2022年2月17日 21点52分——