混合(Pooling)样本测序研究

1.混合测序基础

测序成本虽然下降了,但对于植物育种应用研究来说还是很高,动不动就上百群体,小小植物个体价值又低,测完了很可能后面就用不到了。这时,混合样本测序是一种省钱的好办法。

混池测序(Pool-seq)相对于GWAS或其他精细定位策略而言,其实是一个初定位产品,其结果很有可能是跟性状相关的候选区域。

概念:
混合样本测序一般是选择表型极端或目标性状差异的个体混合,构建一个文库进行测序。

原理:
假设每个样本被测到的概率相等,通过测序reads数计算等位基因频率。如果基因与研究性状有关,那么理想情况下,表型差异显著的混合样本中,该基因等位基因频率差异显著。

image.png

不足:

  • 大群体的等位基因频率才能代表该群体真实的情况,选择少量样本可能带来选样误差;
  • 各样本测序量不均一引入新的偏差。
    但研究表明,在大样本量混合且提高测序深度的情况下,混合样本能够准确评估等位基因频率。

影响因素及建议:

  • 群体类型:群体类型决定研究背景是否纯,影响定位的精确性。混合样本测序最好是只有目标性状存在差异,其他性状一致,即遗传背景纯,一般永久群体>临时群体>自然群体。

  • 混合样本量:多态性高的群体(如F2),推荐混合样本量>100;多态性低的群体(如BCF),推荐混合样本量>20;且作图群体选择比例<25%。

  • 亲本选择:两个亲本尽量性状差异单一,杂合位点少。

  • 混合样本的均一性:样本量小的时候影响大,样本量大影响小。

  • 表型:表型统计不准确,或由多个微效基因控制,会引起定位效果不佳。

  • 参考基因组:基因组组装好坏,基因组注释情况,物种连锁不平衡强易导致候选区域过大。建议采用组装到染色体水平的参考基因组。

  • 测序错误:混合样本测序比较难通过算法区分是测序错误还是稀有变异,测序深度高能有效降低影响。

  • 测序数据量:测序数据量推荐50X以上,测序深度高有利于检测到多态的SNP位点。

  • 比对:混合样本无法校正比对错误,CNV会影响等位基因频率统计。

2. 点突变检测

对于隐形纯合点突变,效果较好。


image.png

MutMap和MutMap+是利用SNP-index算法,需要参考基因组,如果目标位点位于参考基因组没有组装上的gap区,或是参考基因组不具有的序列中,利用MutMap检测方法就不能有效检测到目标突变位点。

MutMap-Gap方法结合了MutMap和de novo组装。先通过MutMap分析SNP-index peak区,发现找不到跟突变性状相关的基因,再将之前比对不上参考基因组的野生型亲本unmapped reads和MutMap分析中SNP-index peak区域的野生型亲本比对上的reads一起进行de novo组装,获得潜在的新基因,并以此为参考再计算SNP-index,检测目标突变位点。

3. BSA

BSA(Bulked segregant analysis,混合分组分析),利用目标性状存在极端表型差异的两个亲本构建分离群体,在子代分离群体中,选取两组表型差异极端的个体分别构建混合池 ,结合高通量测序技术对混合样本测序,比较两组群体在多态位点(SNP)的等位基因频率(AF)是否具有显著差异,定位与目标性状相关联的位点并对其进行注释,研究控制目标性状的基因及其分子机制。

SNP-index是主流的BSA定位算法。其原理是构建子代分离群体,经过挑选极端性状构建混池后对SNP进行检测,对各混池进行等位基因频率分析,并与其中一个亲本进行比较。与此亲本不同的基因型所占的比例,即为该位点的SNP-index。

image.png

(注意这里的reference并不是变异检测的参考基因组,而是构建群体所使用的亲本,所以SNP-index计算高度依赖于亲本测序数据。)

两个混池相减(上图右)得到了△SNP-index的结果,即两个混池之间SNP基因型频率的差异。理论上说,不与性状相关的位点,△SNP-index的值应当在0左右,代表混池之间不存在差异;而QTL及其相连锁位置的SNP,△SNP-index值应当呈现较高的数值。

△SNP index会存在因统计偏差造成的假阳性位点,可以通过计算滑窗内所有SNP的△SNP-index,来消除其影响,得到真正QTL所在的基因组区域。

其他算法如欧几里得距离(ED),Gradedpool-seq(Ridit检验)等。

这里的BSA是指狭义上的QTL-seq,针对有主效基因的数量性状。实际上上面的质量性状/点突变性状、InDel-seq(InDel突变性状)以及下面的BSR,都属于BSA的范畴,原理相似。此外还有QTG-seq。相应的Pipeline可参考:http://genome-e.ibrc.or.jp/home/bioinformatics-team/mutmap

4. BSR

BSR(Bulked segregant RNA sequencing)同样依据分组混合的原理,在RNA水平上进行高通量测序并定位候选基因,即BSA+RNAseq。BSR的混池同样选取分离群体中的极端性状单株,混池用的单株数会比BSA多一些(大多大于30),提取RNA进行混池,再进行转录组测序,mapping参考基因组后同样进行变异分析,确定候选区间。BSR的优势在于不仅提供变异信息,还能提供候选区域中基因的表达信息。

BSR的劣势:RNAseq只能检测表达基因上的SNP,检测的SNP数量少,一般只适用于高频的SNP。同时由于存在RNA编辑等问题,RNA层面检测的SNP和DNA层面也是有差别的,所以只有当DNA层面无法实现(复杂基因组)或DNA测序成本过高(超大基因组)等情况下可选择BSR,否则还是优先选择BSA。

5. 混合样本GWAS分析

Pool –GWAS也是一种省钱策略,但还是非常小众。
比如:GWAS study using DNA pooling strategy identifies association of variant rs4910623 in OR52B4 gene with anti-VEGF treatment response in age-related macular degeneration

Pool –GWAS研究复杂遗传背景的性状功效降低,对稀有变异的检测能力下降。

6. 混合样本驯化研究

同样,分析获得的驯化相关位点很多,如果想用类似的方法检测复杂性状相关位点,后续挖掘真正的功能位点的难度还是很大。

7. 小结

image.png

Ref:

华大科技公众号《混合样本测序,这些“坑”记得跳过!》《经典案例 | 我的研究适合“混合测序”吗?》
BSA专题——分析方法大汇总
美吉生物公众号《BSA的姊妹产品——BSR》
BSA的原理
没看过这些文章,请不要尝试BSA定位 | 群体研究
混池测序研究中如何不被这些问题困扰?

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容