QTLseq数据分析,鼠标点点,复现 Nature Plant 番茄论文结果

写在前面

快一年了,写了重测序三兄弟插件,几乎所有用户都可以用 TBtools 轻松完成 BSAseq 数据分析。当然,我自己基本也没怎么折腾过,毕竟当时只是为了上个课。前几天将家人送回老家后,开始进入浑浑噩噩的状态。大体是每天也不知道干啥或者不干啥,尽管确实也在干活。索性,就还是简单整理一下一些插件功能,也再测试测试看看。于是决定,干脆先重现一下一些论文分析结果。比如这篇 Nature Plant 论文,定位了番茄分支数目的决定位点论文(分支越多,果实越多嘛,很好理解)。




于是下载了数据

SRR8307487  suppressed_A
SRR8307489  branched_A

于是我下载了基因组和测序数据



看起来不错,数据挺大的。可以开干,整体步骤如下:

  1. 读段回帖
  2. 比对结果排序
  3. 标记PCR重复

1.读段回帖

首先,需要测序得到的reads比对到基因组上,使用 TBtools 的 「BWA-mem2 插件」即可。具体界面如下:



过了大概 24 小时,第一个样品比对结束了,并产生了一个 10Gb 的 BAM 文件。这里似乎速度比较慢。有点怀疑数据是否是有接头。回头我可以跑一个 FastQC 看看。当然,逻辑上没啥问题,毕竟一共是 32Gb+ 的reads。




整体时间差不多。也要考量本地电脑 6 个线程确实慢。手上我的CPU也是 2016年的。

2. 比对结果排序


这一步很快,大体20分钟不到。


3. 标记PCR重复

重测序数据分析,最大的问题就是PCR重复会影响SNP的检测,所以需要标记出来



这一步也很快


4. 检测基因组变异 Call SNPs

开始检测变异



点击开始,然后报错



调整后,重新 Start,于是开始跑

我们用的是 bcftools,速度还是很快的


5. 过滤低质量 SNP

几乎所有变异检测的软件或流程出来的结果都是需要过滤的。因为每个人认为可靠的 SNP 的标准是不同的。比如有些人觉得测序深度要10X,有些人觉得5X就足够了。在TBtools的这个Pipeline中,我们直接用默认的。逻辑上对BSAseq影响不大。



这一步逻辑上非常快。事实上,整体流程瓶颈还是在比对。等待几分钟即可。


6. 进行QTL位点检测

使用相对简单,不过还是有两三个参数要手动给一下,具体在设置输入的 VCF 文件时,会有预览窗口,通过预览文本窗口的信息,就可以直接复制黏贴设置,整体如下


不会很久,不过一般也要几分钟

复现结果如下

与原文结果比较

注意:图片美化上自然还有很多办法....;所以结果挺好
具体输出的表格信息也可以看一下定位的区间

尴尬了,区间没对应上。当然,第一反应是他没有问题,同时咱们的流程也没问题。

随后查看了下 2019年05月,过去三年多了,基因组版本更新了,现在我们用的是新版本。看看原来的注释在我们用的版本的注释几何?

结果没问题,偏离一点点。当然了。精准的结果我们完全可以通过指定某个染色体,重新跑一次,结合 deltaSNP 和 G’value 来看。此外,我们其实只用了论文中的一部分数据,每个混池都只选了10+个材料,完全可以再下载两组数据,合并好然后跑一下。另外还注意到,原文作者对群体做了分层,

OK,复现结果。我相信,只要合并数据,完全就可以解决这个问题,感兴趣的朋友可以试试

SRR8307487  suppressed_A
SRR8307488  suppressed_B
# 下面两组
SRR8307489  branched_A
SRR8307490  branched_B

如果你复现了,有结果了,欢迎投稿,有稿酬

写在最后

至于为什么要来复现这个图稿,自然我仍然希望 TBtools的「插件模式」可以给更多朋友打开数据分析大门,自己动手,丰衣足食。逻辑上现在只要你有群体,其实可能2000块钱不到,就可以搞定两个F2或者F1群体的混池测序,为何不试试呢?也没多少钱。
最后,大伙用系列插件时,请引用Wrapper对应的原软件,上述包括但不仅限于:

bwa-mem2, samtools, bcftools, qtlseqr

至于 TBtools 最近我们观测的最高引用频率是 每天在Web of Science 被引 10 次,所以是否引用,大伙可以看心情。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351