SMC++进行有效种群分析

本文为CSDN博主「生信菜鸟1号」的原创文章,原文链接:https://blog.csdn.net/weixin_45694863/article/details/126801831

SMC++是一个用于从全基因组序列数据中估计种群大小历史的程序,其可以进行多个样本的分析,v1.15.4 以后smc++不支持conda了,改为docker运行。
1.SMC++安装
SMC++可以作为Docker image直接运行,其安装方法也及其简单,就是运行一遍,当docker找不到SMC++image时自动下载,需要一定时间。

#简直不要太简单
sudo apt-get install -y python3-dev libgmp-dev libmpfr-dev libgsl0-dev #下载依赖库,我忘记用docker安装需不需要这些库了,但是下载了也没啥问题。
sudo docker run --rm -v $PWD:/mnt terhorst/smcpp:latest #下载
sudo docker images  #看一下docker有哪些image

如下如,MSC++ image下载完毕


image.png

看一下具体参数

sudo docker run --rm -v $PWD:/mnt terhorst/smcpp:latest -h

有效种群大小主要用到vcf2msc,eastimate,plot


image.png

2.输入文件
SMC++的输入文件可以是vcf文件,非常棒。首先需要得到你分析的群体的vcf文件

vcftoosl --vcf xxx.vcf --recode --keep poplation.txt --out smc #population中时你的群体样本
bgzip smc.recode.vcf    #压缩
tabix smc.recode.vcf.gz #为vcf构建tbi索引

之后就是格式转换,vcf转smc格式,用到了vcf2msc


image.png
for i in {1..19}
do
      sudo docker run --rm -v $PWD:/mnt terhorst/smcpp:latest vcf2smc ./smc.recode.vcf.gz ./data/chr${i}.smc.gz $i S:S1,S2,S4,S5,S6,S7,S9
done

#输入vcf文件,输出smc.gz文件,$i为染色体,样本的排列是 population name:sample1,sample2,sample3
#值得注意的是mask文件,在MSMC2中需要,在MSC++也可以添加

3.分析


image.png
sudo docker run --rm -v $PWD:/mnt terhorst/smcpp:latest  estimate --spline cubic --knots 15 --timepoints 1000 1000000  --cores 20  -o ./data/estimate-1/ 2e-8 ./data/*.smc.gz
#–spline 线条类型 cubic为平滑曲线吧
#–knots 节点,就是绘图曲线的点数
#–timepoints 时间范围,单位为多少代,如1000 1000000 为1000代到1000000代
#cores 计算核数
#2e-8为突变率

4.绘图

sudo docker run --rm -v $PWD:/mnt terhorst/smcpp:latest  plot ./plot-IN-6e-9.pdf ./data/estimate-1/*.final.json -g 1 --ylim 0 100000000 -c
#.final.json为最终模型
#-c --csv 输出绘图文件,利用该文件在R中绘图,具体自己发挥
#-g 代数,如人为25,鼠为1
#–ylim Y轴范围
#–xlim X轴范围

总结:smc++不仅能多个文件分析,速度还快,还支持vcf文件,非常好。
stairway plot 分析
————————————————

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,099评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,828评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,540评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,848评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,971评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,132评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,193评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,934评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,376评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,687评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,846评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,537评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,175评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,887评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,134评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,674评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,741评论 2 351

推荐阅读更多精彩内容