T检验:两样本数据的差异性

注:简书不支持数学公式。 带公式版本的,请浏览博客文章:T检验:两样本数据的差异性
我最近在研究TCGA的RNAseq数据表达差异性的分析,常用的并且最简单的方法是统计量T检验。下面用一个例子来验证T检验的弊端问题所在。

两配对样本的T检验是利用来自两个总体的配对样本,推断总体的两个均值是否显著差异,从而推断两个总体是否存在差异。

通过对T检验的P值来判断是否存在差异,从而判断数据是否来自同一个样本。

下面以sin(x) 为例来说明:
代码:

x=seq(-pi,pi,0.0001)
y1=sin(x)
y2=-y1

png("test.png")
plot(y1~x)
lines(y2~x)
dev.off()

mean(y1)
[1] 9.974243e-11
mean(y2)
[1] -9.974243e-11
t.test(y1,y2)
#结果

        Welch Two Sample t-test

data:  y1 and y2
t = 5.0003e-08, df = 125660, p-value = 1
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.007819244  0.007819244
sample estimates:
    mean of x     mean of y 
 9.974243e-11 -9.974243e-11 

图如下所示:


数据的图像

可以明显发现,两个数据来自不同分布,差异很明显,但是T检验的P值却为1,表明不存在差异,与图像的结果明显不符合。这就是T检验的不足。

关于T检验的改进方法介绍,在下一次分享中将会介绍。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 12,932评论 0 3
  • 《多元统计分析与SPSS应用》笔记 文章结构 单一样本均值检验 只对单一变量的均值加以检验,用于检验样本所在总体的...
    辛辛辛烷阅读 39,389评论 3 21
  • 《数据分析的统计基础》的读书笔记 作 者:经管之家、曹正凤 出版社:电子工业出版社 版 次:2015年2月第1...
    格式化_001阅读 13,563评论 1 58
  • 别名:刺榆子、刺梨子、金罂子、山石榴、山鸡头子、糖莺子、糖罐、糖果、蜂糖罐、槟榔果、金壶瓶、糖橘子、黄茶瓶、藤勾子...
    本草园丁阅读 6,705评论 0 0
  • 在拉勾上提交了一份简历,速度收到一份电话面试。露珠毕业已经三年,真真忘了如何在简历关和面试关如何顺利通关,只能硬着...
    小野惪妹子阅读 2,656评论 0 1

友情链接更多精彩内容