Genetic Data Analysis for Plant and Animal Breeding
p.12
!I (整数变量)
!A (字母编码变量)
树高等性状是响应变量,什么也不加p.13
命令执行文件 (.as)有特殊的格式要求:
- 整体均值或截距不会自动拟合,如果需要的话应该用
mu
。 -
units
的意思会在第七章中介绍;如果固定和随机部分写在多行,应该用逗号,表示模型在后边继续。但是注意随机效应和残差方差结构间是没有逗号隔开的。 - 这里也讲到巢式与非巢式的区别(Hierarchical (Nested) and Factorial):每个种源的母本是独特的,所以要嵌入种源。但是由于每个母本给的编码是独特的而且没有在其他种源中有重复,故而我们不需要在模型中用巢式代码了。
- 如果命令执行文件和数据在同一个文件夹中,直接输入文件名就可以了;而如果不在一个文件夹中,则要用!FOLDER控制符给出数据所在的路径,比如
!FOLDER V:\Book\Book1_Examples\data
。 - 建模是一个循环往复的过程,所以最好开始跑一个简单的,看看输出结果有没有什么问题,然后往模型中一次加一个项目。
- p.14数据定义部分。
- 定义的标签要和数据文件中的一致,语法格式是
空格+标签
。 - 根据变量类型,因子变量用
*,!I,!A
或水平的个数;协变量或响应变量空着或指定用1
。 - 一行上可以放多个变量的定义。
- 常用的标记类型:
-
*或n
用于因子用顺序值编码,比如小区编码作1-12,可以用plot *或 plot 12。(如果用!I编码是有问题的!!) - !A指的是因子用字母编码,比如我们有20个地点编码作“NC11”, “FL09”, 等,应该用: Site !A。你可能会在!A后给出水平的个数,但这不是必需的,除非水平数大于1000。如果大于1000,在!A后列一个近似的个数(要大于100)。
- !I 因子是用数字编码的,但不是顺序整数,比如区组编码作11, 24, 49, 80,这时我们应该用!I。和!A类似,超过1000个水平就要列出实际的水平数,比如block !I 1200。
- !CSKIP c,用于跳过不需要分析的数据。
- !LL c,ASReml自定义把水平名字超过16个字符的截短,但如果不想截短的话,要加上!LL c,但是无论加不加这个控制符,最多20个字符才长度。
- !SORT,加在因子的后面,强制对因子按水平排序。
- !FILTER v [ !SELECT n] [!EXCLUDE n] ,类似
R
中的subset()
。
-
- p.19工作控制符。
- !DOPATH n或DOPART n,多个模型时可以选择性地运行某一个。
- !MAXIT n ,默认10个。log-likelihood值<0.002及单个方差变化小于1%,模型收敛。
- !CONTINUE ,如果不收敛,接着最近一次的参数运行。
- !DISPLAY n 画图。
- !OUTFOLDER [folder path ] 结果输出到非工作路径。必须放在工作文件的首行。
- p.22模型项目
- 默认的随机效应和残差项的方差结构是idv(identical variance)
- at(site).block,给每个地点的区组指定一个独特的方差组分。at(site,i).block 给某个地点的区组指定一个独特的方差组分。
- p.41 Asreml中的循环。
- 多性状,
!CYCLE height diameter volume
$I ~ mu !r block*female
- 多个模型,
!CYCLE 1:3
Title: Example of using CYCLE and DOPATH qualifiers
treeid !A female !I male *prov !I block !I plot !Iheight diameter volume
!OUTFOLDER V:\Book\Book1_Examples\dataPine_provenance.csv !SKIP 1 !DOPATH $I
!PATH 1 #no block effect
height ~ mu prov !r female
!PATH 2 #block effect
height ~ mu prov !r block female
!PATH 3 # block and plot effects
height ~ mu prov !r block*female
- 多性状&多模型
!CYCLE height;1 height;2 height;3 diameter;1 diameter;2 diameter;3volume;1 volume;2 volume;3
Title: Example of CYCLE with two substitutions
treeid !A female !I male !Iprov !I block !I plot !Iheight diameter volume !*10
!FOLDER V:\Book\Book1_Examples\dataPine_provenance.csv !SKIP 1 !DOPATH $J
!PATH 1 #no block effect
$I ~ mu prov !r female
!PATH 2 #block effect
$I ~ mu prov !r block female
!PATH 3 #block and provenance effects
$I ~ mu prov !r block*female
= 数据集小或者多性状模型,不容易收敛,用一些不同的方差-协方差初始值重复分析是一个好办法