拼接序列为什么会出现短序列?

扩增子测序双末端序列拼接的时候,往往会出现短序列

stat <-qiimedata@refseq@ranges@width
plot(table(stat),xlab = "Length/bp",
     ylab = "Count")
flash.png
fastp.png

DADA2.png

这些小于400bp一下的序列是否属于我们想要的呢?

qiimedata@refseq[which(qiimedata@refseq@ranges@width%in%c(50,51,53,57,107,244,245,247,248,251))]

短序列93


image.png

短序列146


image.png

短序列294


image.png

过滤长度小于396的序列

qiimedata <- prune_taxa(qiimedata@refseq@ranges@width>=396,qiimedata)

过滤所以样本中总丰度小于1000的序列

qiimedata <- prune_taxa(rowSums(qiimedata@otu_table)>=1000, qiimedata)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容