题目:Haplotype-resolved genome analyses of a heterozygous diploid potato
作者:黄三文团队
杂志:Nature Genetic
文章链接:https://www.nature.com/articles/s41588-020-0699-x#Sec25
pipeline:https://github.com/zhouqiansolab/Merge-assemblies.
1. 组装思路:
v1版基因组:二代+10XG+遗传图谱+ONT
v2版基因组:Pacbio-CCS+遗传图谱
v3终版基因组:merge v1与v2,Hic挂载染色体。
2.转录组与甲基化
3.F2群体中的偏分离研究
3.1 25.7% of genomic regions (430.8 Mb) 为严重偏分离区段(卡方检验,P<0.001)
3.2 定位到的基因座都位于偏分离区域。
4.方法:(亮点)
4.1 F2群体测了大约1X
4.2 转录组每个样本3G
4.3 软件参数
二代组装:DISCOVAR
10xg 组装:Supernova
遗传图谱辅助组装流程图:(聚类用R中的hclust、未聚类的Contig用R中的cor补回基因组中)
4.4 连锁群内部的组装
首先,ONT数据用minimap2比对回scaffold;
其次,每一个连锁群内比上的ONT数据用Smartdeno进行组装,完全比对和少于两个错配的序列被用于组装。
最后,Racon与Pilon做polish,ARCS与LINKS pipeline用于10x辅助提升。
4.5 CSS组装
Canu组装、plion两轮纠错。
4.6 hic 辅助组装
Hicpro比对、ALLHIC辅助组装。
4.7 bac文库评估
blastr比对、Mummer(mummer show-snp)
4.8 基因组注释
常规的软件方法
4.9 单倍型比较与进化分析(比较基因组)
MCScanX、LASTZ、MUMmer的show-diff function用于SV检测、
PAV的定义:
snp和indel注释:Snpeff
检测有害突变:sorting intolerant from tolerant’ (SIFT) algorithm
4.10 转录组-基因表达定量:
Kallisto软件
所有组织中TPM和大于1的基因被认为是表达基因。
4.11 甲基化
常规方法
4.12 遗传图谱
snp划分为300kb的窗口,1个窗口作为1个位点。
IciMapping (v4.0)40 with the parameters: LOD≥3 and algorithm = nnTwOpt.
R/qti中的cim算法用于QTL分析,候选区间为LOD最高的bin及相邻的两个bin。
基于snp的QTL定位结果,用区间内的indel位点做了精细定位(indel位点引物设计做验证)
qPCR验证
4.13 统计检验
卡方检验:R中的chisq.test
等位基因间的表达差异:R中的binom.test