一、OTU聚类
a)序列按照97%相似度(Identity)划分OTU,获得OTU表格,可以观测样品OTU分布情况;
b)主要步骤:
①去重复,去单序列获得OTU代表序列;
②将所有序列和OTU代表序列,按照97%相似度进行OTU划分;
减少不同样品间测序深度带来的差异 ?
【手段】原始数据×OTU丰度矩阵,在一定序列数水平下,经过n次重复,获得稀疏化样品×OTU丰度子矩阵,用于β多样性分析。
二、物种注释
a) OTU代表序列,采用RDP classifier算法与数据库进行比对,比对置信阈值70%~80%,获得分类学信息,汇总成OTU分类学表格。
三、OTU聚类与注释在论文中的描述
a)OTU聚类的表述:
例如:Operation Taxonomic Units(OTUs) were clustered with 97% similarity (3% cutoff) using XXX software(Version, website), and chimeric sequences were identified and removed.
b)物种注释的表述:
例如:The phylogenetic affiliation of each 16S rRNA gene sequence was analyzed by RDP classifier(website) against the Database(version) 16S rRNA database using confidence of(threshold) 70%.