环境:Linux version 5.4.119-20.0009.20 (mockbuild@builder1.x86.opencloudos.tech) (gcc version 8.5.0 20210514 (Red Hat 8.5.0-15) (GCC)) #1 SMP Mon Jan 9 13:11:31 CST 2023
1.安装JAVA
https://www.oracle.com/java/technologies/downloads/
下滑选择JDK 8下载:
JDK 8安装包下载.png
服务器新建文件夹:
mkdir java18
cd ./java18
安装包上传到服务器java18文件夹中,解压缩
tar -zxvf jdk-8u391-linux-x64.tar.gz -C /home/usr/java18/
修改环境配置
#非root用户
vim ~/.bashrc
#在最后添加以下内容,路径改为安装包路径
export JAVA_HOME=/home/usr/java18/jdk1.8.0_391
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
# “esc” :wq 保存退出
#source ~/.bashrc更新配置
#java -version查看是否安装成功
image.png
2.下载beagle安装包
https://faculty.washington.edu/browning/beagle/beagle.html
下载beagle安装包.png
上传到服务器即可使用
java -jar beagle.22Jul22.46e.jar
image.png
3.数据预处理
#读取文件
df_bim=pd.read_csv(r"./20230222-YY1821-5112id-auto-qc.bim",header=None,sep="\s+")
#去除重复位点
df_bim=df_bim.drop_duplicates(keep="first",subset=[0,3])
#取常染色体
df_bim=df_bim[(df_bim[0]>0)&(df_bim[0]<19)]
df_bim[[1]].to_csv(r"./autoxy47440.txt",header=None,index=None)
plink --bfile 20230222-YY1821-5112id-auto-qc --extract autoxy47440.txt --out 20230222-YY1821-5112id-auto --recode vcf
4.参考群
java -jar beagle.22Jul22.46e.jar gt=20230222-YY1821-5112id-auto.vcf out=20230222-YY1821-5112id-auto-f
输出文件:20230222-YY1821-5112id-auto-f.vcf.gz
5.填充群
java -jar beagle.22Jul22.46e.jar ref=20230222-YY1821-5112id-auto-f.vcf.gz gt=randomauto1k_904.vcf out=randomauto_904-f
这里的参考群一定要预先质控填充过,即Ref=的vcf文件中等位基因分隔符为“|”,而不是“/”