N8. 北卡Isik教授编的教材《动植物育种遗传数据分析》读书笔记

Genetic Data Analysis for Plant and Animal Breeding

  • p.12
    !I (整数变量)
    !A (字母编码变量)
    树高等性状是响应变量,什么也不加

  • p.13
    命令执行文件 (.as)有特殊的格式要求:

  • 整体均值或截距不会自动拟合,如果需要的话应该用mu
  • units的意思会在第七章中介绍;如果固定和随机部分写在多行,应该用逗号,表示模型在后边继续。但是注意随机效应和残差方差结构间是没有逗号隔开的。
  • 这里也讲到巢式与非巢式的区别(Hierarchical (Nested) and Factorial):每个种源的母本是独特的,所以要嵌入种源。但是由于每个母本给的编码是独特的而且没有在其他种源中有重复,故而我们不需要在模型中用巢式代码了。
  • 如果命令执行文件和数据在同一个文件夹中,直接输入文件名就可以了;而如果不在一个文件夹中,则要用!FOLDER控制符给出数据所在的路径,比如!FOLDER V:\Book\Book1_Examples\data
  • 建模是一个循环往复的过程,所以最好开始跑一个简单的,看看输出结果有没有什么问题,然后往模型中一次加一个项目。
  • p.14数据定义部分。
  • 定义的标签要和数据文件中的一致,语法格式是空格+标签
  • 根据变量类型,因子变量用 *,!I,!A或水平的个数;协变量或响应变量空着或指定用1
  • 一行上可以放多个变量的定义。
  • 常用的标记类型:
    • *或n用于因子用顺序值编码,比如小区编码作1-12,可以用plot *或 plot 12。(如果用!I编码是有问题的!!)
    • !A指的是因子用字母编码,比如我们有20个地点编码作“NC11”, “FL09”, 等,应该用: Site !A。你可能会在!A后给出水平的个数,但这不是必需的,除非水平数大于1000。如果大于1000,在!A后列一个近似的个数(要大于100)。
    • !I 因子是用数字编码的,但不是顺序整数,比如区组编码作11, 24, 49, 80,这时我们应该用!I。和!A类似,超过1000个水平就要列出实际的水平数,比如block !I 1200。
    • !CSKIP c,用于跳过不需要分析的数据。
    • !LL c,ASReml自定义把水平名字超过16个字符的截短,但如果不想截短的话,要加上!LL c,但是无论加不加这个控制符,最多20个字符才长度。
    • !SORT,加在因子的后面,强制对因子按水平排序。
    • !FILTER v [ !SELECT n] [!EXCLUDE n] ,类似R中的subset()
  • p.19工作控制符。
  • !DOPATH n或DOPART n,多个模型时可以选择性地运行某一个。
  • !MAXIT n ,默认10个。log-likelihood值<0.002及单个方差变化小于1%,模型收敛。
  • !CONTINUE ,如果不收敛,接着最近一次的参数运行。
  • !DISPLAY n 画图。
  • !OUTFOLDER [folder path ] 结果输出到非工作路径。必须放在工作文件的首行。
  • p.22模型项目
  • 默认的随机效应和残差项的方差结构是idv(identical variance)
  • at(site).block,给每个地点的区组指定一个独特的方差组分。at(site,i).block 给某个地点的区组指定一个独特的方差组分。
  • p.41 Asreml中的循环。
  • 多性状,
!CYCLE height diameter volume
$I ~ mu !r block*female 
  • 多个模型,
!CYCLE 1:3
Title: Example of using CYCLE and DOPATH qualifiers
treeid !A female !I male *prov !I block !I plot !Iheight diameter volume
!OUTFOLDER V:\Book\Book1_Examples\dataPine_provenance.csv !SKIP 1 !DOPATH $I
!PATH 1 #no block effect
height ~ mu prov !r female
!PATH 2 #block effect
height ~ mu prov !r block female
!PATH 3 # block and plot effects
height ~ mu prov !r block*female
  • 多性状&多模型
!CYCLE height;1 height;2 height;3 diameter;1 diameter;2 diameter;3volume;1 volume;2 volume;3
Title: Example of CYCLE with two substitutions
treeid !A female !I male !Iprov !I block !I plot !Iheight diameter volume !*10
!FOLDER V:\Book\Book1_Examples\dataPine_provenance.csv !SKIP 1 !DOPATH $J
!PATH 1 #no block effect
$I ~ mu prov !r female
!PATH 2 #block effect
$I ~ mu prov !r block female
!PATH 3 #block and provenance effects
$I ~ mu prov !r block*female 

= 数据集小或者多性状模型,不容易收敛,用一些不同的方差-协方差初始值重复分析是一个好办法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容