什么是假设检验
image-20200217233648814.png
假设检验:
参数检验:T检验, 对照组为122,实验组为234,检测实验组比对照组显著,认为各组结果是服从正态分布的,所以比较的是各组的平均值。
非参数检验:不用T检验,不符合正态分布,需要用非参数检验,结果说那个偏大,那个偏小。参数检验要比非参要好。
image-20200217234348959.png
假设检验的基本思想
image-20200217234859267.png
假设检验的一般步骤:
image-20200217235108361.png
举例
当地均值与国家均值不同可能有两种情况
image-20200217235249391.png
P Value
(⚠️)P Value的含义
[图片上传中...(image-20200217235725683.png-9d2406-1583768770435-0)]
R语言中的P Value
计算P Value 由于多函数,但都包括p、q、d、r
image-20200218000646033.png
pnorm(-1.96,mean = 0,sd = 1)#p和q是反着的,计算概率
qnorm(0.99,mean = 0,sd = 1)#计算分位数,正态分布的3 sigma法则
dnorm(-10:10,mean = 0,sd = 1)#概率密度
plot(dnorm(seq(-10,10,length.out = 1000),mean = 0,sd =1))#概率密度曲线
#模拟正态分布
rnorm(1000,mean = 5,sd = 2)
set.seed(20200218)#加随机种子,保证随机取样重复出现、
rnorm(2,mean = 5,sd = 2)
image-20200218002317096.png
生信中的例子1
image-20200218002619715.png
image-20200218002717809.png
生信中例子2
ChiP-Seq:染色体免疫共沉淀技术
1⃣️蓝色和黄色都是蛋白,想知道蓝色结合DNA的序列
2⃣️先用甲醛使蛋白和DNA结合铰链
3⃣️用蓝色蛋白抗体结合,把蛋白和DNA拽下来
4⃣️进行测序,找鼓包
image-20200218003003952.png
input为对照样本
image-20200218003514949.png
> ppois(20,lambda = 5)#小于等于20的时候
[1] 0.9999999
> 1-ppois(20,lambda = 5)#pvalue为极端值概率,则大于20时候
[1] 8.10925e-08
#pvalue很小,则认为可能是个peak, 但是在全基因组中reads多,pvalue都很小,则需要进行pvalue的校正。