文献阅读(2):De novo identification of microbial contaminants in low microbial biomass microbiomes wit...

标题:De novo identification of microbial contaminants in low microbial biomass microbiomes with Squeegee
期刊:Nature communications
发表时间:2022-10-25

目的:

de novo去除宏基因组测序(metagenomic sequencing)过程中引入的污染

亮点:

De novo去除污染,无需额外其他信息,如阴性对照或者样品DNA浓度

原理:

基于假设:污染的物种在不同样品中会有相似的特征


Fig 1

污染鉴定考虑以下指标:

  • Prevalence Scoring: prevalence score针对不同样本类型加权,避免样本类型数量不同引入的偏差。score越高,物种在不同类型样本中更共享,更可能是污染
  • Metagenome Distance scoring:Mash计算不同样本之间的差异。值越大,差异越大。差异越大的样本共享的物种更可能是污染。
  • Breadth of Genome Coverage Scoring和Classification Error Detection:使用Bowtie2将reads比对回潜在的污染物种参考基因组,计算覆盖度和深度,判定物种是否真实存在于样本中。通常覆盖度越大,证明物种真实存在;如果大量的reads只覆盖一小部分基因组,一般为错误分类。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容