Plink提取部分SNPs数据

一、提取某个染色体上的SNPs
plink --file data --chr 6
二、提取一个范围内的SNPs

(从一个rs到另一个rs,必须在同一条染色体上)

plink --bfile mydata --from rs273744 --to rs89883

另,根据染色体上的位置提取

plink --bfile mydata --chr 2 --from-kb 5000 --to-kb 10000
三、提取某个SNP上下20Kb的SNPs
plink --bfile mydata --snp rs652423 --window 20
四、同时提取多个范围的的SNPs及单个SNPs

(SNP名称或者范围内不能有空格)

plink --bfile mydata --snps rs273744-rs89883,rs12345-rs67890,rs999,rs222
五、提取指定的SNPs
5.1 把SNP名称整理成单列的mysnps.txt文件

e.g.
rs123
rs12345
rs123456

plink --file data --extract mysnps.txt
5.2把染色体、范围、基因名(这个可以随便写)整理成myrange.txt文件

e.g.【行名不要】
CHR BP1(起始位置) BP2 (终止位置) LABEL(基因名or随便写)
1 123 456 ABC
12 5465 3456 DFG

plink --file data --extract myrange.txt --range

输出plink格式时,后面都需要加上 --make-bed --out result

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。