登录注册写文章

MetaStat原理

MetaStat原理

MetaStat

一直不清楚MetaStat的脚本输入到底应该是Read数还是相对丰度，大概过了一下R语言版本的MetaStat代码的脚本，留此记录。

代码解析

R语言版本的MetaStat被封装到了一个R函数内部，针对不同的数据输入，MetaStat会采用不同的处理策略

两个比较组都是单样本无重复

此时MetatStat使用Fisher精确检验或卡方检验（每个样本内tag或reads数都大于20）
涉及到Fisher或卡方检验的输入都是列联表，肯定都是整数因此理想的输入的表格内都应该是整数

有重复

MetaStat对于有重复的样本（或者说是上述情况以外）的比较组的统计分为两步

对于输入的每一行，都会通过T检验计算其t统计量（这里使用的是每个样本的相对丰度），然后通过t统计量利用置换检验算出p值
重新遍历每一行，对于在两个比较组内平均tag数小于1的行，重新利用Fisher精确检验计算p值替换前一步得到的该物种的p值

感想

综上所述，应该使用count/reads值作为其函数的输入

吐槽

这个R代码内各种for循环~ 效率真是不高~
有空看一下置换检验，这里置换检验也是限制代码执行时间的坑~
好像mothur里面有C++的版本，有时间试一下

最后编辑于：2021.06.01 23:39:09

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

译文：分段式结构方程模型（piecewiseSEM）的构建原理
前言-写在前面在进行一些论文研读的过程中，我发现针对模型复杂生态系统（比如农田土壤微生物的宏基因组学研究），研究者...
杜嘟嘟9527阅读 21,943评论 2赞 6
第三章微生物组数据统计分析简介
3.1人类微生物组数据研究的主题和统计假设目前的微生物组研究主要有两个主题：(1)描述微生物组特征与生物、遗传、...
ZMQ要加油呀阅读 6,666评论 0赞 12

组间差异检验，终于有人讲清楚了!
什么是组间差异检验？就是组间的差异分析以及显著性检验，应用统计学上的假设检验方法，检验组间是否有差异及其差异程度。...
周运来就是我阅读 304,511评论 5赞 273
第八章单变量群落分析
我们将微生物群落组成研究分为两个主要部分：(1)分类多样性、OTUS和类群的假设检验；(2)类群间差异分析。第一个...
ZMQ要加油呀阅读 2,299评论 0赞 2
第五章微生物组数据功效和样本量计算
5.1假设检验和功效分析 ①假设检验：统计学的主要目的是根据样本信息对未知的总体参数进行推断：从观察到的样本数据中...
ZMQ要加油呀阅读 4,645评论 3赞 5

友情链接更多精彩内容

赞1赞

赞赏

手机看全文