在研究时最常见的问题就是对两个组进行比较。例如,哪一种治疗方式更有效?哪一种生产工艺造出的产品合格率更高?
能够应用t检验的必要条件是假设总体的分布都是呈现正态分布的。
独立样本的t检验
t.test()这个函数的用法如下
#用法一
t.test(y~x, data)
-y: 一个数值型变量
-x: 一个类别型变量,只拥有2个值。
-data: data=你的数据框
#用法二
t.test(y1,y2)
-y1: 一个数值型变量
-y2: 一个数值型变量
y1 和 y2就是两组不同变量,进行比较。
state.x77数据集包含了1977年美国50个州的一些数据,其中包括谋杀率,文盲率,高中毕业率等。
state.region是一个因子向量,将50个州划分为不同地区,包括South,West等。
mytable <- data.frame(state.x77,state.region) #给state.x77数据框加入新的一列
x<- mytable$Illiteracy[mytable$state.region == "South"]
y<- mytable$Illiteracy[mytable$state.region == "West"]
# 生成两个数值型变量,我们将要比较South地区和West地区的文盲率是否有显著差异
t.test(x,y)
Welch Two Sample t-test
data: x and y
t = 3.2761, df = 24.621, p-value = 0.003122
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.2649499 1.1638963
sample estimates:
mean of x mean of y
1.737500 1.023077
P值小于0.05,所以文盲率是有显著差异的。
非独立样本的t检验
在t.test()函数的参数中,加入paired=T选项即可。