plink转化文件格式

想使用一组已经是bed bim fam,在R语言中进行操作。
bed文件是一个二进制文件,看不到
bim文件总共有六行,包含了snp(variants)的具体信息,也就是geno信息

1.第一列是染色体信息
2.第二列是snp的名字
3.第三列是摩尔距离,文件中说可以用0,没关系
4.第四列是物理距离
5.第五列是次要等位基因
6.第六列是主要等位基因

fam文件记录个体信息,类似pheno信息

#转化为ped,map文件
plink --bfile 1-Stoort --recode --out 1-Stoort
#转化为0,1,2文件,信息在.raw文件中
plink --bfile 1-Stoort --recodeA --out 1-Stoort

我们通过R语言提取fam文件的一定列数。再用plink将bed,bim等文件补齐,也就是对应抽取fam文件的相对应文件。

plink --bfile 1-Stoort --keep new.txt --make-bed --out new
plink --bfile 1-Stt --keep new.txt --chr 1 --make-bed --out new_200_chr1#如果只想要第六个染色体的信息
#去掉连锁不平衡的snp位点
plink --bfile new --indep-pairwise 100 10  0.1
#保存下来筛选过后的信息
plink --bfile new_200_chr1 --extract plink.prune.in --make-bed --out prunedata

recode生成的raw文件有:FID IID PAT MAT SEX PHENOTYPE snp1 snp2 .....的信息

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容