文献信息:
标题:Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice
中文:泛基因组分析揭示人工种植水稻与野生水稻基因组变异
杂志:nature genetics 2018
单位:上海师范大学
摘要:
水稻和芸苔中丰富的遗传多样性是水稻育种的主要来源。已经进行了大规模的重测序以发现水稻中的等位基因变体,但是通过将短序列读段直接定位到稻粳稻日本晴参考基因组上常常丢失了许多遗传变异信息。在这里,我们构建了一个O. sativa–O的全基因组数据集。 rufipogon物种通过深度测序和从头组装66个不同种质而复杂化。基因组间的比较确定了水稻基因组中的2300万个序列变体。该序列变异目录包括许多已知的数量性状核苷酸,将有助于查明构成复杂性状的新因果变异。特别是,我们使用此泛基因组数据系统地研究了整个编码基因,揭示了水稻种质间广泛存在和不存在变异。这种泛基因组资源将进一步促进水稻的进化和功能研究。
基本认知:
1 泛基因组是多个基因组的集合
2 泛基因组基因丢失少于单个基因组,更适合做参考
参考:pan-genome能干啥?
文章工具URL:
SOAPdenovo2, https://sourceforge.net/projects/soapdenovo2/files/SOAPdenovo2/;
GapCloser, http://soap.genomics.org.cn/about.html;
Fermi package, https://github.com/lh3/fermi;
REPLACE, ftp://ftp.sanger.ac.uk/pub/users/zn1/merge/replace/;
MUMmer, http://mummer.sourceforge.net/;
ClustalW, http://www.clustal.org/;
IRGSP build 4, http://rapdb.dna.affrc.go.jp/download/build4.html;
EMBOSS, http://emboss.sourceforge.net;
Bowtie2, http://bowtie-bio.sourceforge.net/bowtie2/index.shtml;
SAMtools, http://samtools.sourceforge.net/;
PHYLIP, http://evolution.genetics.washington.edu/phylip.html;
MEGA5, http://www.megasoftware.net/index.php;
China Rice Data Center, http://www.ricedata.cn/gene/;
RepeatMasker, http://www.repeatmasker.org/;
RAP-DB on IRGSP4, http://rapdb.dna.affrc.go.jp/download/build4.html;
RAP-DB on IRGSP-1.0, http://rapdb.dna.affrc.go.jp/download/irgsp1.html;
RGAP 7, http://rice.plantbiology.msu.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/;
SMALT, http://www.sanger.ac.uk/science/tools/smalt-0;
InterProScan, http://www.ebi.ac.uk/interpro/download.html.
泛基因组做了什么?
snp indel sv 频率和物种进化
几个基因中casual多态性变异在几个物种中的发生频率
一些基因中出现多个alleles,变异方式
发现新其他基因组中没有的,或者某物种特有的基因
不同基因在不同基因组中的Presence–absence varitaion (PAV)存在缺失变异