材料选择与群体设计
材料选择的基本原则
a.遗传变异和表型变异丰富
b.群体结构分化不能过于明显(如亚种以上,发生生殖隔离是不能做GWAS的)
样本量
a.非稀有变异中,对中等变异解释率(10%左右)的位点的检测功效要达到80%以上时,需要的样本量在400左右
b.位点的效应越低,需要的样本量越大
群体类型
−种质资源材料
• 遗传变异丰富,可以同时对多个性状进行分析
• 群体结构复杂,稀有变异多,遗传信息丢失明显
−人工群体
• 背景单纯,检测功效高;可以放大稀有变异.(包括F2、半同胞家系、动物远交群体、NAM群体、MAGIC群体和ROAM等群体类型。)
• 遗传变异不够丰富,重组事件有限,定位精度可能较低
表型调查
精确的表型检测是关联分析的关键
GWAS对数量性状和质量性状都适用
• 数量性状:多基因控制,能够测量得到具体数值,符合正态分布;考虑到数量性状受环境影响大,建议将所有材料在同一环境下培育或养殖,或者用多年多点的数据分开分析后综合结果或取BLUP值作为性
状值进行关联分析。
• 质量性状:单基因控制,无法用具体数值衡量,可转换成0、1等表示,需注意每个群体选取近似的样本。
• 分级性状:表型分布类似质量性状,但实际受多基因控制(数量性状),如抗性性状,因此需要提供每一个个体精确的测量数据。
• 多指标性状:有多个指标可以同时度量时,找出代表原表型数据变异的主成分因子,作为关联分析的表型数据
标记开发与分型
• 实验室常用标记(SSR等)
• SNP芯片
• NGS开发SNP、small Indel、CNV、SV标记
纵深研究--基因克隆示例
材料----381份粳稻品种(热带和温带品种)
1、关于水稻谷粒大小的性状,GWAS定位到7号染色体,SNP峰值所在地方注释到11个基因;
2、对11个基因分别在稻穗、叶片和根系中做RT-PCR,只有第9个基因OsSPL13在稻穗中表达有差异;
3、OsSPL13基因蛋白表达的进一步验证;
4、分析OsSPL13基因在水稻大粒和小粒之间的序列差异,包括SNP位点和小的indel;
5、通过转基因找到影响OsSPL13基因表达相关的相关区域(5’UTR中的一个串联重复序列);
6、通过RNA干扰的方法将大粒品种GP579和小粒品种Dongjing中OsSPL13的表达量下调后会使水稻籽粒的长度和粒重都显著降低;
7、筛选到1个Dongjing来源的glw7突变体,粒长和粒重比野生型均明显降低;
8、通过chip-seq进行OsSPL13调节下游基因的验证(结果未示)SRS5和DEP1。