Identity by Descent (IBD) :同源相同片段,是在两个及以上个体存在来源于同一祖先的、未发生重组的、完全相同的DNA片段,这样的片段即为IBD片段,详情可参考IBD分析
更新libstdc++.so.6库,更新到版本libstdc++.so.6.0.24
cp libstdc++.so.6.0.24 /usr/lib64/
rm -rf libstdc++.so.6
ln -s libstdc++.so.6.0.24 libstdc++.so.6
软件下载安装
germline软件:
wget http://gusevlab.org/projects/germline/release/germline-1-5-3.tar.gz
tar -zxvf germline-1-5-3.tar.gz
germline分析前需要做基因型填充phasing,软件推荐使用beagle,版本不能太高,可以安装beagle.3.0.4:
cd germline-1-5-3/phasing_pipeline
wget https://faculty.washington.edu/browning/beagle/recent.versions/beagle_3.0.4_05May09.zip
unzip beagle_3.0.4_05May09.zip
chmod 755 beagle.3.0.4/beagle.jar
ln -s beagle.3.0.4/beagle.jar ./
IBD分析
(1) 将vcf转换成plink格式
vcftools --vcf all.vcf --plink --out test
(2) 基因型填充
germline-1-5-3/phasing_pipeline路径下有个run.sh,将里边的HEAP参数调大,要不java会报错,小编修改为HEAP=20,然后修改Run BEAGLE,修改为如下:
java -Xmx${HEAP}G -Djava.io.tmpdir=/share/nas1/tmp -jar $BEAGLE
PATH/germline-1-5-3/phasing_pipeline/run.sh test.ped test.map test #基因型填充执行脚本,会得到填充好的test.phased.map跟test.phased.ped
(3)germline分析
/share/nas1/solftware/germline-1-5-3/bin/germline -input test.phased.ped test.phased.map -min_m 2 -output test
IBD分析结果实例如下
前两列为两个个体名称,第3列为染色体号,第4跟第5列为IBD区间,该软件详细参数以及结果文件示意见germline usage