Schimleck LR, Kube PD, Raymond CA (2004) Genetic improvement of kraft pulp yield in Eucalyptus nitens using cellulose content determined by near infrared spectroscopy. Can J For Res 34:2363–2370. doi: 10.1139/x04-119
摘要
在世界许多凉爽温带地区,桉树(Eucalyptus nitens (Deane & Maiden) Maiden (shining gum))广泛种植用于生产纸浆。提高纸浆产量可提高种植园利润,但传统评估耗时费力。纤维素含量与纸浆产量密切相关,已被用作林木育种方案的替代指标。然而,纤维素含量的直接测量仍然依赖于湿化学,限制了可处理的样品数量以及在树种育种计划中获得的后续增益。间接方法如近红外(NIR)光谱可以实现分析的样品数的大量增加。在本研究中,比较了使用使用湿化学测定的纤维素含量和通过基于不同取样强度的NIR校准进行预测的纤维素含量所获得的增益。基于NIR预测的纤维素含量的遗传增益高,使用直接测量纤维素可以获得很大比例的增益【这句什么意思?】。校准是稳健的,通常可以在各个站点之间可靠地使用。 NIR预测的纤维素是高度遗传的,其遗传性与纤维素的直接测量相当或优于纤维素。
介绍
在东南澳大利亚州,智利,南非和新西兰的凉爽温带地区,生长了桉树(Deane&Maiden)用于纸浆生产(Dean等,1990)。提高从该物种获得的纸浆的产量是增加种植园利润率的重要组成部分(Dean等人,1990; Borralho等人,1993; Greaves等人1997)。使用传统方法的评估需要将树木切碎,然后在高温和高压下在碱性溶液中煮熟以溶解木质素,使纤维素和半纤维素完整(Smook 1982)。这种方法是有限的,因为它是破坏性的(样本树需要砍伐),耗时且昂贵(Downes等人1997; Raymond和Schimleck 2002)。育种计划评估技术的一个重要要求是它们是非破坏性的,能够快速筛选大量样品。因此,这些传统的纸浆产量评估方法不太适合育种计划。
纤维素含量已被用于树种育种计划中。几项研究表明,它与牛皮纸浆产量密切相关(Dillner等,1970; duPlooy 1980; Wallis et al。,1996a,1996b; Kube and Raymond 2002)比其他方法便宜,并允许更多的样品(Wallis et al。,1996b; Kube et al。2001; Kube and Raymond,2002)。然而,直接测量纤维素含量的局限性在于它依赖于湿化学,这需要专门的实验室和熟练的实验室工作人员。因此,可以处理的样本数量受到这些实际限制,这又限制了在树种育种计划中可以获得的收益。
几项研究表明,近红外(NIR)光谱法可用于预测纤维素含量(Wright等,1990; Garbutt等1992; Clarke and Wessels 1995; Schimleck等,1997; Raymond和Schimleck,2002)和NIR可以大大增加加工样品的数量(Raymond和Schimleck,2002)。木材的近红外光谱带由木材组分中的化学键的振动产生,如纤维素和木质素。因此,乐队的变化反映了木材化学的变化。发生在NIR区域(700〜500nm)的光谱由在中红外(2500〜0000nm)观察到的O璈,N璈和C璈官能团的基本伸缩振动的泛音和组合带组成, (Barton 1989; Osborne等人,1993)。 NIR分析依赖于创建将大量样品的近红外光谱与其已知纤维素含量相关联的校准。然后校准基于其NIR光谱来预测其他样品的纤维素含量。虽然近红外光谱可用于测试大量的纤维素含量的样品,但估计的误差可能会比使用湿化学物质时的误差更大。考虑到这一点,重要的是确定更多样品的相对益处与较低的精度。
这项研究的目的是评估NIR作为衡量木材纤维素含量在E. nitens树育种计划中的工具。它建立在以前对E. nitens中纤维素含量和纸浆产量之间的关系的研究(Kube和Raymond 2002)以及在E. nitens中的纤维素含量的遗传变异(Kube等人,2001)。在本研究中,使用不同的采样强度和使用从不同位点采样的树开发和比较校准模型。然后,我们估计并比较了这些校准模型中每个纤维素含量的遗传增益与使用湿法化学方法测量的纤维素含量可获得的收益。
材料和方法
样品来源使用的遗传材料是开花授粉后代
来自维多利亚州中部高原的Toorongo高原的40个本地森林家庭。 1984年在澳大利亚塔斯马尼亚州北部的三个地点(拨号范围,气量范围和卡莫纳)建立了后代试验。现场详细情况见表1.试验设计是一个随机完整的块,每个站点16个重复,单个树地块间隔3米3米。通过在0.9米的高度采取12毫米树皮到树皮核心,在13岁时采集木材样本。在这个高度上的木材采样已被证明是全树纤维素含量和全树纸浆产量的可靠预测指标(Kube和Raymond,2002)。测定重复样本约25%的样品作为对准确性的一般检查。纤维素测定的标准误差约为0.3。发现测定是高度可重复的,并且在方差组分的分析中,重复测定效应小(总变异的4%)并且不显着。从每个家庭随机抽取约5棵树。使用盘式粉碎机将木芯还原成小碎片,然后在装有1mm筛的Wiley磨机中研磨。关于这项研究的更多细节在Kube et al。 (2001)和Kube和Raymond(2002)。
纤维素含量的测定粗纤维素含量(克纤维素?烘干
木材))用Wallis等人的方法测量(1997年)。将非纤维素化合物通过在二水合二甲醚和盐酸中在90℃的水浴中在摇床上消化1小时而溶解。通过过滤收集残余物,洗涤,干燥并称重,以确定粗纤维素的质量。
近红外光谱将木粉放置在大型NIRSystems样品中
杯(NR-7070)。在NIRSystems Inc. 5000型扫描分光光度计中,在保持在纺丝样品架中的样品的漫反射模式下测量NIR光谱。在1100〜500nm的波长范围内以2nm的间隔收集光谱。仪器参考是陶瓷标准。每个样本累积了五十次扫描,结果平均。在获得光谱后,将样品杯倒空,重新包装,得到一个重复的光谱。
表2.每个校准组的纤维素含量(克纤维素?克烘干木材)的统计总结?
使用仪器的NSAS?软件(NIRSystems,Inc. 1990)将重复光谱平均并转换为二阶导数。使用10nm的段宽度和20nm的间隙宽度进行转化。
纤维素校准从每个位点选择样品进行校准开发。在样品选择过程中,不使用与纤维素含量相关的信息(由湿化学测定)。两种方法用于选择样品。第一种方法涉及使用现有的北塔斯马尼亚牛皮纸浆产量校准来预测所有样品的牛皮纸浆产量。鉴于牛皮纸浆产量和纤维素之间的关系已知很强(Dillner等人,1970; duPlooy 1980; Wallis等人1996a,1996b; Kube和Raymond 2002),假设预测的牛皮纸浆产量的变化将代表纤维素含量的范围。
根据其预测产量对样品进行分选,从每个位点选择20,40和60个样品,以涵盖预测的牛皮纸浆产量的范围。每个样本被独立地选择,其中包括在每个校准集中的极值。极值被包括在校准组中。 WinISI II软件也用于选择样品进行校准(Infrasoft International 2000)。该软件使用一个邻域概念来识别光谱独特的校准样本。邻域被定义为样本附近的空间。为了校准目的,每个邻域只需要一个样本(即,不需要邻域内的其他样本)。样本与其邻居之间的距离被称为邻域H.为了选择用于校准的样本,识别具有最多邻居的样本。当其邻居(基于预定的H值)被消除时,样本被保留。然后识别具有最多邻居的下一个样本,并且该样本被保留,并且其邻居被消除。该过程一直持续到所有样品都被保留或消除(Infrasoft International 2000)。最初使用0.6的邻域H来选择校准样品,但是选择来自每组的大多数样品进行校准。当邻域H增加到1.2时,确定了与基于预测的牛皮纸浆产量所选择的尺寸相似的样品组。三十七个样本被选为Dial,59个为Gog,45个为Kamona。表2总结了每个站点的校准集。
所有校准都是使用NSAS软件(版本3.52)和二阶导数谱创建的。部分最小二乘法(PLS)回归用于具有四个交叉验证段和最多10个因子的校准。 NSAS软件通过确定每个因子的交叉验证的均方误差(MSECV)与最小MSECV的比值,推荐用于每个校准的最终数量的因素。当比率首先降到1.25以下时,那就是推荐因素的数量(NIRSystems 1990)。
校准统计在本研究中,校准适合度的测量
数据是标准误差(SEC)(Miller 1989; Workman 1992),由此给出
NC
(y $ i - yi)2
[1] SEC = i = 1(NC≤k≤1)
其中y i - yi)2
[2] SEP = i = 1(NP≥1)
其中NP是预测集中的样本数。测定系数(R2)也用于评估校准性能和校准性能
用于预测目的。
估计遗传增益估计遗传力及其标准误差
湿化学纤维素含量和NIR预测纤维素含量
其中h2是狭义的遗传; 2f,2f.s和2e分别是家庭,家庭的方差分量
按站点和错误; r是关系系数。
所使用的系数为0.4,假设自给率约为30%(Griffin和Cotterill 1988)。
表3.每个部位的纤维素校准总结。
通过拟合以下模型计算方差分量
[4] Y =?+ SITE + REP + FAM + FAM.SITE +
其中Y是每个性状的数据向量; ?是每个性状的平均值?站点是作为固定因素的网站效应; REP是作为固定因素拟合的场内复制效应; FAM是作为随机因素拟合的家庭效应; FAM.SITE是以随机因素拟合的逐站互动效应;并且是残差的向量。数据分析使用ASREML进行(Gilmour等,1999)。
通过计算个体树繁殖价值,选择前5%的树木,然后确定所选群体的平均值来估计遗传增益。通过拟合以下模型估算个体树种繁殖值:
[5] Y =?+ SITE + REP + TREE + FAM.SITE +
其中Y,? SITE,REP,FAM.SITE,如前所述,TREE是个体树繁殖值(加性遗传效应)。假定相关系数为0.4,则计算添加剂遗传效应。用ASREML计算这些育种值。
对五个变量中的每一个分别计算育种值:湿化学纤维素含量;基于每个位点20,40和60个校准样品的NIR预测的纤维素;和基于使用WinISI软件选择的校准样本的NIR预测。对于每个这些变量,测试了四个选择场景。首先,所有NIR预测均基于本地站点校准模型。第二,第三和第四种情况测试了三种不同的现场校准模型(即Dial,Gog和Kamona校准模型)。当使用场外校准模型时,我们限制了数据集以排除本地站点数据。例如,当使用拨号校准模型时,我们排除了拨号数据,仅包括来自Gog和Kamona的数据。
对于每个变量和每个选择情景,选择了最优育种(最高育种值)树。这是分开进行的,用于正面选择(选择后代)和向后选择(从父母中选择)。
对于前瞻性选择,选择前30棵树,代表人口的前5%。对于倒退选择,选出前六名父母,或父母的前15%。通过平均所选群体的育种值计算遗传增益,并且相对于通过使用湿化学纤维素测定评估和选择所有树可以获得的增益来表示。
结果与讨论
每个部位的纤维素校准为每个部位获得纤维素校准,然后
用于预测现场所有样品的纤维素含量。表3提供了每个校准的总结统计。
拨号校准强,特别是20样本校准(R2 = 0.92)。强R2和低SEC可能是基于其他拨号校准所得结果的样品选择的假象。 40和60s样本校准具有相似的统计,并且当用于预测所有Dial样品的纤维素含量时,两者都表现良好。相比之下,20样品校准表现不佳。基于WinISI选择的样本的拨号校准具有很强的校准统计(图1a),并且在应用于所有拨号样本时表现良好(图1b)。
所有Gog校准都推荐两个因素,R2为0.61〜0.77。 20样本校准尽管有很强的统计,但在用于预测所有Gog样品的纤维素含量时表现不佳。最佳预测结果由40个样品校准和WinISI选择的样品校准提供。这些校准的R2和SEP差于Dial。
Kamona校准一致地提供了三个站点的最强校准统计。校准R2的范围为0.91至0.99,海上测量范围为0.27至0.46。校准也提供了纤维素含量的最佳预测。通过WinISI选择的样本校准(图2a和b)给出最强的R2(0.87),可以获得每次校准的类似预测统计量。使用20样品Kamona校准预测的纤维素含量的R2和SEP与使用较大样品组获得的校准获得的相似,这与使用Dial和Gog校准不同。
结果表明,20个样本不足以充分描述大约180个样本集合中存在的变异。基于40个样本的校准就足够了。结果还表明,基于预测的牛皮纸浆产量或WinISI的样品选择提供了选择校准样品的有用方法。
一个地点(Gog)的校准明显比其他两个地点(Dial和Kamona)的校准差。对此没有明显的解释。纤维素数据的分析(参见Kube等人2001)并没有表明在Gog中湿化学纤维素含量估计不好,也没有出现任何大的基因型环境相互作用(这将表明不同的遗传反应在不同的网站)或任何理由怀疑Gog校准模型中使用的任何数据。
图1.使用WinISI(a)校准和(b)预测选择的样品获得的拨号校准结果。使用37个样品开发校准,并在168个样品上进行测试。实验纤维素由湿化学测定;通过近红外光谱测定NIR纤维素。 SEC,校准的标准误差; SEP;标准预测误差。
图2.使用WinISI选择的样品获得的Kamona校准结果,(a)校准和(b)预测。使用45个样品开发校准,并在188个样品上进行测试。实验纤维素由湿化学测定;通过近红外光谱测定NIR纤维素。 SEC,校准的标准误差; SEP;标准预测误差。
有趣的是,Gog的木材性质与其他两个位置的木材性质有所不同,其中基本密度和纤维素含量都明显更高(Kube等人,2001)。
遗传增益使用湿度估计纤维素含量的遗传力
化学数据和NIR预测的纤维素含量的遗传率如表4所示。随着校准模型的采样强度的增加,NIR遗传力增加。错误差异很小
每个校准模型之间的差异(平均值为0.87),遗传变化是加性遗传变异估计值增加的结果。这表明基于更多样本的校准模型能够更好地区分遗传变异。
NIR可以提供纤维素含量的潜在遗传增益的很大比例(表5),因此似乎是选择改良基因型的可靠方法。在每棵树上采用湿化学方法选择纤维素含量时,我们发现预测的变化范围为41.5%〜43.0%(偏离1.5个百分点)。使用时可以实现大约90%的增益
表4.使用不同的近红外(NIR)校准方法的纤维素含量(%)方差分量和遗传力(?标准误差)。
表5.使用正向选择策略,使用不同的近红外(NIR)校准方法获得纤维素含量(%)。
注:收益表示为通过评估每棵树所获得的收益的一个比例
对于使用湿化学方法的纤维素含量。 a WinISI使用的样本数量在Dial为37,Gog为59,在Kamona为45。
表6.使用反向选择策略,使用不同的NIR校准方法获得纤维素含量(%)。
注:收益表示为通过评估每棵树所获得的收益的一个比例
对于使用湿化学方法的纤维素含量。 a WinISI使用的样本数量在Dial为37,Gog为59,在Kamona为45。
NIR预测的纤维素。使用最好的近红外校准,预测变化范围为41.5%至42.8%(转变1.3个百分点)。
随着校准模型的采样强度的增加,遗传增益增加(表5)。使用本地现场校准模型,最小密集采样方法通过使用湿化学评估所有样品得到73%的增益。这个模型是从约10%的树木(每个站点20个)构建的。随着每个站点的样本数量的增加,收益稳步上升,大约90%的潜在收益可以实现。使用WinISI软件根据光谱特征选择样本增加了收益,并依赖于较少的样本来构建校准模型(该方法平均每个站点抽取47棵树)。
当使用场外校准模型时,NIR也能够提供良好的遗传学效益(表5)。在本研究中测试了三个非现场校准模型。其中两个,收益通常低于使用当地现场模式时的收益,其中约10%的潜在收益被丢失。然而,对于第三(Kamona)来说,收益相似或略高。这个数据表明,为了树木繁殖的目的,可以构建一个在一定范围的站点上应用的通用校准模型。
表5中的结果是基于正向选择的育种策略的收益。正向选择策略是从被测实际的树木中选出新的育种或部署种群。然而,大多数先进的树种育种策略都使用向前和向后的选择。反向选择策略是将来自已知父母的后代的信息相结合以选择最佳父母。反向选择策略更可靠,因为许多样本用于测试每个父母。然而,正向选择策略可以为精英父母的后代提供新的改进选择。
表6显示了基于反向选择的育种策略的NIR的收益。在反向选择策略下,NIR纤维素可以提供与纤维素直接测量相同的收益。使用WinISI构建的模型是最好的,但基于至少40个样本的任何模型提供了超过90%的收益。当使用WinISI选择的样品时,所有非现场模型都能够提供100%的收益。该数据表明,对于反向选择,NIR是选择纤维素含量的非常强大的方法,任何型号都可以自信地使用。
校准样品的选择本研究的一个重要方面是选择样品进行校准。使用两种方法,并且两者都不需要任何纤维素含量的任何先验知识。
第一种方法涉及预测来自每个位点的所有样品的牛皮纸浆产量,然后选择用于纤维素校准的代表性样品(每个位点20,40和60个样品)。该方法依赖于具有现有的NIR牛皮纸浆产量校准和纤维素含量与硫酸盐纸浆产量之间的强关系,这可以基于广泛用于纸浆生产的不同桉树种的几项研究的结果来确定(Dillner等人,1970 ; duPlooy 1980; Wallis等人1996a,1996b; Kube和Raymond 2002)。基于这种选择方法的纤维素校准是成功的,因为使用NIR预测的纤维素含量获得的遗传增益是最大可能增益的很大比例。
第二种方法涉及使用邻域概念来识别用于校准的光谱唯一样本,因此不需要现有的校准。使用其NIR光谱选择的样品获得的结果表明,该方法可以成功地用于鉴定校准样品。使用这种方法的遗传利益(最大可能增益的90%)超过了根据其预测的牛皮纸浆产量选择的样品获得的增益,遗传力估计也更强。将附加样品添加到纤维素校准物中的遗传增益的改善可能部分地是在预测组中包括更多校准集样品的结果。用于相应校准的样品被包括在每个预测组中。通常在NIR研究中,校准样本不包括在预测组中,但是在本研究中进行了这一操作,以确保将所有校准应用于相同大小和组成的测试组。
结论
NIR预测的纤维素含量似乎是树种育种的理想工具。它与牛皮纸浆产量密切相关,这在许多育种计划中具有很高的经济重要性。该研究发现纤维素含量的强校准,其他研究已经显示纤维素含量和牛皮纸浆产量之间的强关系,使用直接测量纤维素和NIR预测的纤维素。
NIR预测的纤维素也处于强烈的遗传控制之下,其遗传性与纤维素的直接测量相当或优于纤维素。基于NIR预测的纤维素含量的遗传增益很高,并且通过良好选择的校准,可以使用NIR预测获得使用直接测量纤维素可获得的大部分增益。
校准模型也显得非常强大,并且通过精心挑选的校准,模型可以跨站点可靠地使用。每个站点建立了40个或更多样本的良好模型。使用WinISI II软件选择样品增加了收益,并依靠较少的样品来建立校准。