在新一轮ROH分析之后,发现亲代对子代ROH片段的形成主要通过三种方式。
1.非亲ROH的增长
这其实相当于亲代基因组的随机排列组合,导致子代在亲代没有ROH的区域,出现新的ROH,我将其称之为ROH的增长。这仿佛是完全不可预测的,因为我们希望的是利用亲代的ROH数据来对后代进行预测,当亲代中都不存在的ROH出现在子代中,这超出了我们的预测能力。所以我们无法控制。这是一种随机事件。
2.亲代中ROH重新出现在子代中
我将其称为ROH的固定。我们在可视化图中发现很多父母都存在的ROH区域,部分又出现在子代中。这一部分是我们希望能够进行预测的。我想到的思路是,我们通过对亲代父母中的ROH取交集,看看哪些ROH是两者共有的。将这一部分共有ROH再与子代个体的ROH取交集,经过这两步,我们就能够得到亲代中共有的ROH有多少能固定在子代中。我们可以计算这一部分ROH在亲代共有ROH的占比是多少(可能需要计算ROH长度加和)。我预测,可能会有这样的规律,如果亲代的共有ROH更多,那么后代也会更多的固定亲代的ROH。那么我们或许可以在制定配对方案的时候利用这个参数,来减少ROH的固定。
3.亲代中共有的ROH不会再次出现在子代中
我将其称为ROH的破窗效应。我们在可视化结果中同时也发现很多区域父母有共同的ROH,但是子代中这一部分却没有ROH出现。如果我们假设,父母在这一段ROH是完全一样的,那么后代无论如何也会出现这一段ROH。但后代却没出现,这就表明父母ROH的纯合状态不一致。比如父亲的基因型可能是0/0,母亲的基因型可能是1/1。我们的整体目标就是为了减少ROH区域的产生,尤其不希望基因组中出现长的ROH。那么如果不同配对方案制定时,配对之间均存在这种共有的长段ROH时,我们或许可以提前预测,哪一组配对更有可能达到这种长片段的破窗效果。我需要做的就是明确为什么有的ROH片段会固定,而有的ROH片段会被破窗。查看这些区域的SNP位点变化规律,或许能找到答案。