操作步骤

当前工作路径

/home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/test1

###1.新建文件夹
mkdir F6_test
###2.进入文件夹
cd F6_test
###3.命令1重命名
sed 's/##contig=<ID=1/##contig=<ID=chr2/' ../offspring_genotypes_renamed1.vcf | sed 's/^1\t/chr2\t/' > offspring_genotypes_renamed_chr2.vcf
###4.复制脚本
cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi3/F2_test/subset_random_28.sh ./
###5.运行脚本
./subset_random_28.sh -i offspring_genotypes_renamed_chr2.vcf -o pick_401_480 -r 401-480 -g 4 -e 8 -s 10
###6.命令2
bcftools query -l ../merged1.vcf.gz | shuf -n 12 > keep.txt
###7.命令3
bcftools view -S keep.txt -Oz -o output.vcf.gz ../merged1.vcf.gz && bcftools index -f output.vcf.gz
###8.命令4
bcftools merge  output.vcf.gz pick_401_480.vcf.gz -Oz -o merged1.vcf.gz
###9.解压文件
gunzip merged1.vcf.gz

###1.新建文件夹
mkdir HDR
###2.进入文件夹
cd HDR
###3.复制脚本
cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/HDR/* ./
###4.统计个体编号
bcftools query -l ../merged1.vcf >sample.id
###5.你会发现sample.id文件中一共40个个体编号，需要将所有的编号复制下来存放到我给你的1.xlsx文件中，粘贴到第二列
vi sample.id ###只粘贴vi sample.id并按回车，后续操作问我
###6.运行命令
sh run_analysis.sh
###7.j进入结果文件
cd results
###8.统计每个文件中的数据到04.HDR1.xlsx文件中,到这一步需要问我

###退出文件夹
cd ../../
###1.新建文件夹
mkdir Proh
###2.进入文件夹
cd Proh
###3.复制脚本
cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/Proh/1.sh ./

cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/Proh/run.sh ./

cp ../merged1.vcf ./
###4.运行脚本
sh 1.sh
###5.运行run.sh 脚本，运行20次，这里问我
nohup bash run.sh ROH.hom modified_vcf_renamed.vcf xxx & ###这里的xxx代表你的1.xlsx文件中第二列的编号
###5.统计数据，将数据统计到04.Proh1.xlsx文件中（这里需要问我）
less ROH_analysis_327_20251016_162927_26436/02.intersection_ROH/combine_ROH/ped/ROH/final_result.txt

### 退出文件夹
cd ../
###1.新建文件夹
mkdir GRLI
###2.进入文件夹中
cd GRLI
###3.复制脚本
cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/GRLI/* ./
###4.复制文件
cp ../merged1.vcf ./
###5.复制sample.id文件
cp ../HDR/sample.id ./
###6.运行命令
sh variant_filter_pipeline.sh -i merged1.vcf -o output_prefix
###7.运行脚本
snakemake -s Snakefile -c 20
###8.统计数据复制到04.GRLI1.xlsx文件中（这里要问我）

###退出文件夹
cd ../
###1.新建文件夹
mkdir deepKin
###3.运行命令
bgzip offspring_genotypes_renamed_chr2.vcf
tabix -p vcf offspring_genotypes_renamed_chr2.vcf.gz
bcftools merge output.vcf.gz offspring_genotypes_renamed_chr2.vcf.gz -Oz -o merged.vcf.gz
###4.进入文件夹
cd deepKin
###5.运行命令
plink --vcf ../merged.vcf.gz --make-bed --const-fid --out SCT
plink --bfile SCT --recode --out SCT
###6.完成告诉我

统计数据到04.deepKin1.xlsx文件中

###退出文件夹
cd ../
###1.新建文件夹
mkdir test1
###2.进入文件夹
cd test1
###3.复制
cp ../merged1.vcf ./
###4.压缩
bgzip merged1.vcf
###5.复制脚本
cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/test1/step* ./

cp /home/DL_2/CUTech/comput_2/Tech_No1/group4/yjc/workspace/SCT_data/test/13.119_SCT_ind/01.40_test/1.test/02.genome_modle/05.PCA/test_F/fenzhi1/F2_test/test1/F3_test/test1/F4_test/test1/F5_test/test1/slim_read.py ./

###6.运行命令
bcftools query -f '%CHROM\t%POS\t%REF\t%ALT[\t%GT]\n'  merged1.vcf.gz > genotypes_raw.txt
###7.个体编号数据
bcftools query -l merged1.vcf.gz > sample_ids.txt
###8.运行脚本
python slim_read.py
###9.修改step1.breeding_simulation.slim脚本
vi step1.breeding_simulation.slim
###10.这里问我
###11.运行命令
nohup slim step1.breeding_simulation.slim &
###12.退出文件夹
cd ../
###13.新建文件夹
mkdir test2
###14.进入文件夹
cd test2
###复制脚本
cp ../test1/step* ./
cp ../test1/slim_genotypes.txt ./
###运行命令
nohup slim step1.breeding_simulation.slim &
###12.退出文件夹
cd ../
###15.新建文件夹
mkdir test3
######14.进入文件夹
cd test3
###复制脚本
cp ../test2/* ./
###运行命令
nohup slim step1.breeding_simulation.slim &


至此一个流程结束，开始第二分支（这里问我）

推荐阅读更多精彩内容