这是2017年哈佛大学生物医学信息学教授Shamil R. Sunyaev发表在Science上的一篇文章。
背景
负选择是自然选择很重要的一种,通过剔除有害突变,保证物种不会无限制地积累有害突变,从而持续生存。在小麦中,大概一代会产生5个有效应的有害突变(具体数字有待进一步验证),玉米里面有害突变的累积速度大概是一代5~9个,这些积累的有害突变是如何影响物种的适合度的,是这篇文章探讨的主要问题。
在一些生长周期长的物种中,观察适合度是比较困难的,作者通过mutation burden来作为fitness的指标,用mutation burden的分布来研究有害突变的相互作用(独立的或者是上位性的)
什么是上位性?对于有害突变来说,
negative epistasis
也就是协同上位synergistically
的,positive epistasis
是互斥上位antagonistically
;对于有益突变来说,positive epistasis
是synergistically
,而negative epistasis
是antagonistically
。mutation burden如何计算呢?对于个体来说,指的就是携带有害突变的数目。
- L代表有害突变的数目,Xi是单个变异位点携带的derived allele(有害突变)的数目(对于二倍体来说,可能是0,1或者2)。
假设
如果有害突变是独立的(这里只关注低频的有害突变),那么群体内的突变负荷服从泊松分布(泊松分布的参数λ是单位时间内随机事件的平均发生次数,因为突变速率是恒定的,所以独立的突变的出现次数符合泊松分布),即群体内的突变负荷的方差等于平均数。并且,如果突变是独立的,群体内个体间的突变负荷方差(𝞂2 )等于各个位点的方差之和(Va)(独立条件下,总体方差等于加性位点方差之和)。
如果有害突变具有协同上位性,那么由于变异组合的影响很大,在群体里面倾向于保留单个变异,造成方差减小,𝞂2 < Va,有害突变之间倾向于是不连锁的。
结果
不同的数据集中都观测到了,LoF变异的𝞂2 < Va,推测其具有上位性。LoF是Nonsense和Slice之和。
随着选择系数的增加,𝞂2/Va下降,并且在选择压强下的missense突变也表现出了具有上位性,说明选择越强,上位性越强。
为了检验观测到的LoF变异的上位性的显著性,通过重新取样,比较具有和LoF相同等位基因频率的同义和非同义替换的𝞂2/Va,发现低频LoF突变是显著的呈现上位性的(人(P = 0.0003),果蝇 (P=9.43 × 10−6))
关于作者的假设,更直观的理解是
如果X和Y是独立的,那么它们的协方差就是0,如果它们有负的协方差,则和的方差小于方差的和,在生物学上的理解就是有害突变倾向于负相关,不连锁的状态,也就是文中作者解释的协同上位(如果共同存在将造成更大的适合度下降,从而被很快选择掉)。