1. 闲扯两句
分享了挺多生物信息方面的技巧了,总结一下以后才发现同样的东西,别人玩出的花样简直不可思议,也更加明白了阅读文献的重要性。小刘哥《生物信息学习》以后也要加入一些文献解读的内容了。
2. 文章梳理
从选择文献开始,我就告诉自己要不时的询问自己三个问题 : what,why and how.
首先从文献选择开始:《Construction of a high-density genetic map using specific-locus amplified fragments in sorghum》 河北省农林科学院谷子研究所刘国庆老师课题组 2017 年一月份发表在 BMC Genomics 上的一篇文章,重点讲述了使用 SLAF 测序技术构建高粱高密度遗传图谱的故事。
选则这篇文献的原因,主要有以下几点:
- BMC Genomics 2016年的影响因子还是有3.73 (IF=3.7290) 的。这篇文章能发到上面还是做了一些亮点工作。
- 遗传图谱在群体遗传学研究中占据很重要的位置
- BMC Genomics 杂志版面好 (~~~)
文章挑选好后我们就一起梳理一下这篇文章的亮点,不过在梳理亮点前还是要先熟悉几个名词:
- 遗传图谱
遗传图谱主要是相对物理图谱而言的, 物理图谱是碱基在DNA上的线性排列,而遗传图谱(也称连锁图谱或者遗传连锁图)则是依据染色体交换与重组,以多态性的遗传标记为路标,以标记间的重组率为“图距”,确定不同多态性标记位点在每条连锁群上排列的顺序和遗传距离的线性连锁图谱。遗传图谱的图距单位为 cM 厘摩,1%交换值为 l cM,约相当于 1000 kb。
遗传图谱的建立有利于物种QTL定位,进行标记辅助育种,辅助基因组组装以及基因组的比较分析等方面。
高质量高密度的遗传图谱其意义还是非同一般的。 - SLAF-Seq
SLAF-Seq 是由百迈客公司在 2013 年提出的一种简化基因组方法,采用双酶切和双barcode 接头,使获得的片段在基因组上有更好的均一性。
了解了这两个主要概念后我们就真正开始梳理文章:
2.1 是什么?
这篇文章的结论是什么?从题目和摘要我们可以很明确的看出,研究人员使用SLAF-Seq 技术构建了一张高粱的高密度的遗传图谱,图谱距离达到了 2158.1 cM ,标记总数为 2246,平均遗传距离为 0.98 cM。
2.2 为什么?
为什么要用 SLAF-Seq 构建高粱的这样一张图谱呢?我们不得不说高粱在作物界的地位,也不得不说遗传图谱在群体遗传学中的意义,更不得不说 SLAF-Seq 在技术上的高效便捷。
作者针对这些问题也一一做了解答。
高粱,是五种常规作物之一,因其良好的特性,较强的适应性,成为了能源性作物方面的模式植物。
五常作物主要有玉米,小麦,水稻,大麦以及高粱
遗传图谱,在物种 QTL 定位,分子标记辅助育种中等占有重要地位,图谱的质量以及密度也始终与性状研究的准确性密切相关。
SLAF-Seq 技术,这也是百迈客在2013年研发出的一款明星产品,虽然无法媲美RAD,以及 GBS 的引用量,但在图谱构建方面确有其优势。
2.3 怎么样?
明白了是什么,为什么以后,我们就要看看怎么样了。
2.3.1 材料选择
首先是材料的选择(生命科学的研究中,材料的选择占据着很重要的地位,当初如果孟德尔没有选择豌豆,而选择了别的异花授粉植物的话,估计我们今天也就不需要为这么多的遗传知识头大了)。
两个表型差异明显的亲本:母本为一个甜高粱品种 Keter,父本为一个普通高粱品种 J204 (美国 J14859 高粱品种的一个变种)。
2.3.2 作图群体构建
考虑到两高粱品种在株高,适应性等表型方面的显著差异。研究人员通过亲本杂交,F1自交构建的 F2 性状分离群体,也就是 F2 临时作图群体。
2.3.3 标记的选择
SLAF-Seq 是以 SNP 标记为基础建立的技术。通过高通量测序技术检测特异性扩增片段SNP进而开发的生物标记。
2.3.4 数据分析的全面严谨
研究人员同样还应用生物信息学分析方法设置层层过滤标准,经过严谨分析,最终得到了这么一张高密度的遗传图谱。
2.4 SLAF-Seq 流程
讲了这多,还是来点干活,重点对 SLAF-Seq 技术做一个介绍,如图:
第一步,首先通过生信模拟计算生成大量的酶切标记。
第二步,通过双酶切手段,获得在基因组上分布均匀的片段。
第三步,电泳切胶加双接头并上机测序。
2.5 生物信息分析
第一步,基因分型主要参考了 SLAF—seq 文章的流程,如图:
第二步, 过滤掉质量序列后,将有明确 index信息的序列根据序列相似性进行聚类(序列具有95%相似度的为一个SLAF 标记)
第三步,筛选每个 SLAF 标记内 SNP 数目大于3的的片段
第四步,使用 最小等位基因频率(MAF) 来进一步筛选 SLAF 标记
第五步,通过进一步筛选二倍体 SLAF标签及进行过滤,将标签种类多余四种的过滤掉。
最后,过滤掉 覆盖深度少于 2.20 的 SLAF 标记
最终,作者得到了一张高密度的遗传图谱,具体信息如图:
文献解读就到这里,其实这两年百迈客公司在 SLAF-Seq 方面还挺高产,出了不少文章,感兴趣的朋友可以关注。
- Construction of a high-density genetic map and QTL mapping for pearl quality-related traits in Hyriopsis cumingii
- Rapid identification of QTLs underlying resistance to Cucumber
mosaic virus in pepper (Capsicum frutescens) - A re-sequencing-based ultra-dense genetic map reveals a gummy stem blight resistance-associated gene in Cucumis melo