本专辑为《植物数量遗传学》的读书笔记。并加入自己的理解。
表现型值与基因型值
定义
- 表现型与基因型:
表现型:个体的外在表现
基因型:内在遗传物质 - 表现型值与基因型值
表现型值:用 P 表示。对表现型的测量值。
基因型值:用 G 表示。个体基因型决定的值。 - 环境偏差:表现型值与基因型值之差包含了所有非遗传因素对性状表型值的影响,其主要内容是环境效应E和基因型与环境的交互效应()。误差(个体差异)
动植物性状表达三大重要组成部分:
G,E,G X E
数量性状表现型值的数据模式:
假设不存在基因型与环境的互作,即
则可以简化为:
基因型值的度量
对于简化的式子,求数学期望得:
上式中, 呈正态分布,因此期望为0,随机误差 的期望也为0,由此可得:
即:
- 对于由同一基因型所组成的群体:在大量测定的情况下,其表型值的平均就等于其基因型值。
- 对于由多种基因型组成的群体:表型值的平均等于平均的基因型值。
例2.1
表2-1所列为某F2群体内单株籽粒的含油量(%)性状值和分子标记数据。
表头 | 表头 | 含油量(%)| |
---|---|---|
1 | 2 | 6.25 |
2 | 2 | 7.50 |
3 | 1 | 4.00 |
4 | 0 | 2.75 |
5 | 1 | 6.00 |
6 | 0 | 3.00 |
... | ... | ... |
210 | 1 | 4.5 |
注:2、1、0 分别代表CC、Cc 和 cc 。
C为标记,位点为Q,根据以上信息估算基因型QQ、Qq、qq的基因型值。
解:根据表中的统计得知:2、1、0的分别有53、106和51株。
则:
简单用Python实现一下上面的计算
class QuantGenetic:
@classmethod
def get_g_val_from_population(cls, lst_val, lst_g): // 用户传入两个list,一个包含值,一个包含对应的基因型
tmp_val_g = dict() //存放不同基因型对应的值,key为基因型,val为一个包含该基因型数据的列表
for i in range(len(lst_g)):
g = lst_g[i]
if g not in tmp_val_g.keys():
tmp_val_g[g] = []
tmp_val_g[g].append(lst_val[i])
else:
tmp_val_g[g].append(lst_val[i])
res_dict = dict()
for k, v in tmp_val_g.items():
res_dict[k] = sum(v) / len(v)
return res_dict
度量基因型值的尺度
数量遗传采用统一的度量基因型的尺度(scale)。对于二倍体(2N)来说,假设有两个等位基因A1和A2。增效纯合子A1A1的基因型值为a,减效纯合子A2A2为-a,杂合子A1A2为d。则尺度入下图:
A2A2=====================A1A2=============A2A2
|-----------------------------|-------|------------------------|
a=====================0====d================ -a
杂合子的基因型值有显性度(degree决定),由表示
无显性:
正向部分显性:
负向部分显性:
完全显性:
正向超显性:
负向超显性: