2022年5月浙江大学生命科学学院陈军教授课题组在nature ecology & evolution在线发表了题为“Genome-wide analyses of introgression between two sympatric Asian oak species”的研究论文。该文章以两种同域分布的栎属植物(Quercus acutissima ; Q. variabilis)为研究材料,阐明了两种栎树在全基因组范围上的渐渗模式,并探究群体分化程度、生活环境相似性及重组率对渐渗的影响。同时发现渐渗可能引入适应性变异到基因的顺式调控元件中从而调控胁迫相关基因的表达。
研究背景
渐渗是指通过杂交和回交将少量基因组序列从一个亲本分类单元转移到另一个亲本分类单元。研究表明渐渗更容易发生在近缘物种中,并且大部分的渐渗片段都是中性或有害的,仅有极小一部分可以增加受体的适应性。在快速变化的生态环境下,渐渗引入的变异可能比物种既有变异和新变异更能帮助物种快速适应环境。生活在北半球的栎树大部分都是同域分布且可杂交的,这使得栎属植物成为研究渐渗和适应之间联系的理想材料。
1. 群体遗传分析
研究人员采样并测序了15个Q. acutissima居群共219个个体,10个Q. variabilis居群共48个个体 (Fig. 1a),测序数据比对到新组装的 Q. acutissima高质量基因组上。使用34,625个基因间区不连锁的SNPs进行系统发育分析发现两个物种聚为两支但发现少数个体存在遗传混合现象(Fig. 1b)。群体结构分析表明Q. acutissima内部群体结构复杂,存在很多Q. variabilis的祖先成分,但有几个居群基本没有遗传渗入,显示出很强的单一祖先成分。Q. variabilis群体结构相对较弱,并且仅有很少的Q. acutissima祖先成分渗入(Fig. 1c)。研究人员推断Q. variabilis可能是当地物种,而Q. acutissima可能是扩散迁入物种。研究人员紧接着将两物种分为七个谱系并加入了一个未定义谱系(包含三个其它栎树种)共八个谱系,使用fastsimcoal2对谱系间的基因流和群体历史进行分析。最优模型结果表明Q. acutissima种内基因流强于种间(Q. acutissima 和Q. variabilis),且未定义栎树谱系对TMS和ZJS种群都有很强的基因流贡献(Fig. 1d),所以为了避免第三物种基因流的影响,TMS和ZJS种群不用于后续分析。
2. 同域栎树基因流
研究人员基于 D-statistic 和 fd 统计值对同域栎树渐渗进行分析,结果表明10个Q. acutissima群体和其同域的Q. variabilis居群都有显著的基因流信号。TBS和DWX群体受渐渗影响的窗口数或渐渗水平最高,而PWX、LFS、 XRD、LVS 和 KYS居群受渐渗影响的窗口数最少(Fig. 2a)。研究人员又计算了f-分支统计量(f-branch statistic),结果表明渐渗时间都是近期的(不晚于2.15–1.85百万年)并且发生在种群特异分支上,而不是在共享的祖先分支上(Fig. 2b)。例如,DWX种群从种群共同祖先分化出来之后发生了Q. acutissima 到* Q. varibilis*最强的渐渗。研究人员继续研究fd和基因密度、重组率的关系,发现在九个群体中fd>0的窗口的fd和重组率成正相关,而fd和基因密度呈负相关。
研究人员进一步评估渐渗程度是否主要由地理或环境距离(IBD和IBE)决定,通过对共享渐渗区域比例(PSIG)进行Mantel和 partial Mantel 相关性检验,来衡量一个同域群体对与另一对群体之间存在相同渐渗区域的频率(Q. acutissima–Q.variabilis对)。虽然地理或环境距离在Mantel测试中对PSIG都有显著影响,但在partial Mantel测试中,研究人员没有发现地理距离或环境对PSIG的显著影响,这可能是由于地理距离和环境因素之间的高度相关性。由于前面分析结果已经证明渐渗会降低遗传分化,作者进一步利用partial Mantel检验来控制FST的效应以更准确评估环境对PSIG的影响,结果显示PSIG与环境距离呈显著负相关(Table 1 and Fig. 2c,d)。因此,在环境条件相似的地方更有可能观察到两个物种之间相同的基因组渗入区域。
3. 渐渗促进物种局部适应
研究人员通过研究同域渐渗影响的基因组区域是否与环境因素相关,从而探究渐渗是否促进物种局部适应。结果显示,总共有263,217个SNPs(占基因组的1.7%)与至少一个环境变量显著关联(降水~79,274个,太阳辐射~67,798个,温度~56,351个,风速~32,397),其中,有80,944个(30.7%)环境关联SNP在渐渗区域被检测到。研究发现Chr12中有9.2%的区域为适应性渐渗区域,高于其他染色体(2.2-7.4%)(Fig.3a),与之前发现Chr12渐渗片段比例最高相对应。研究人员还发现和不同环境因子关联的适应性渐渗SNP,其分布存在明显的染色体异质性,Chr10上29.7 ~ 34.9 Mb主要为适应降水的SNP,Chr11上24.8 ~ 27.4 Mb主要为适应温度和纬度的SNP,Chr12上13.4-21.5Mb富集到与降水和纬度变化相关的SNP(Fig.3b)。在Chr9、10、11和12的适应性渐渗区域内种群重组率被抑制,SNP数目与群体重组率呈负相关(Fig.3c,d,e),这可能是由于转座子扩张所介导的染色体倒位使得重组受到抑制。
4. 渐渗通过影响顺式调控元件影响基因表达
渐渗区域内共检测到与环境相关的4,284个基因,这些基因显著富集在信号传递相关通路,如非生物刺激、胁迫、激素、真菌和先天免疫反应(Fig.4c)。大多数环境关联的SNP仅与一个特定的环境因子关联,而基因可能响应多个环境因子(Fig. 4a,b)。研究人员还发现18.9%的环境关联SNPs位于非翻译区域、内含子和启动子等调控区域。适应性渐渗区域中81.9%的SNPs位于转座子区域和串联重复序列区域,这些转座子中98.9%位于基因的近端(5′或3′端侧翼2kb内)或内含子内,这表明顺式调控区域很可能是自然选择的目标区域。因此,研究人员从非编码区适应性渐渗SNP的两端的20个碱基序列中寻找顺式调控元件的基序。有66.7%(52,235)的SNP两端能找到已知的植物顺式调控DNA元件,这些调控元件中59.9%与受环境因素控制的基因有关,例如,与温度相关的726个SNPs位于低温诱导的顺式调控元件中;1,579个与纬度相关的SNPs分布在低温诱导的顺式调控元件或靠近光诱导/光调控/昼夜节律表达的基因中,与风速有关的1,662个SNP位于与花粉和/或花发育相关基因的顺式调控区域。
研究人员进一步通过比较渐渗区域基因差异表达进而探究基因表达和渐渗的关系,结果表明基因差异表达在异域和同域、种间和种内之间没有显著差异,然而渐渗区域基因差异表达总是显著低于基因组背景区域。接着研究人员比较了gr0(非渐渗区域),gr1(仅存在于一个同域对的渐渗区域),gr2(存在于两个或三个同域群体对共享的渐渗区域),gr3(存在于四个及以上同域群体对共享的渐渗区域)四种类型基因的差异表达,结果表明差异表达和渐渗共享程度之间存在负相关,也就是更频繁的渐渗区域内的基因在物种内部和物种之间具有更保守的表达谱 (Table 2)。
讨论
本研究致力于两种同域栎树之间的适应性渐渗分析,但由于栎树种间杂交十分复杂,暂时未能充分理解这些渐渗过程。特别是无法排除未指定物种(其他栎属物种,本次研究仅包括Q. chenii, Q. fabri 和 Q. serrata对目标物种的祖先成分和基因流的贡献造成的影响。因此,在栎属植物渐渗研究中,需要考虑多物种和种内多居群的问题。
原文链接: