tip:昆虫,水生动物基因组杂合度较高。
植物基因组组装的挑战
gene family,tandem replicates,polyploid,genome size,high heterozygosity,clustered located repeat,high repeat content
Genome survey
图片发自简书App
kmer评估基因组大小和基因组杂合度
M=N*(L-K+1)/L
M:kmer peak;N:real sequencing depth;L:read length;K:kmer length
图片发自简书App
杂合度和重复度的评估
基因组注释之后将外源污染序列识别并去除(kmer低频区):比对
重复序列的特征:真核/原核
图片发自简书App
2019/4/30
基因组学分析与实践
基因组组装
resequencing genome
de novo assembly
de bruijin(k-mer)
图片发自简书App
动物基因组intron普遍偏长,可以采用unigene
基因组拼接评估:
图片发自简书App
depth VS coverage
基因结构及功能注释
蛋白,rna,软件预测三种都有的最准确
图片发自简书App
三代测序应用
图片发自简书App
泛基因组(pan genome)
图片发自简书App
图片发自简书App
图片发自简书App
优先保证样品纯度和质量
图片发自简书App
三代测序没有scaffold,单向测序。
图片发自简书App
图片发自简书App
图片发自简书App
图片发自简书App
DNA测序成本更低• 可应⽤于更加复杂的基因组• 解决⼤⽚段的结构难题• PCR-free,No GC-bias • 更⾼的N50、contigs数量更少、99.999%的准确率;
图片发自简书App