让我们荡起双桨,重新认识一下p值

在正文之前先分享一点生活故事:

上周天傍晚,我闪着腰了,躺了一晚上不见好,发朋友圈寻医问药了:



因为做的是生信分享,我朋友圈里医学生和医生非常多,我想看他们怎么说。
我收到了几十条回复,分享一下给大家,就当拿我的教训给大家涨涨经验吧,有备无患...

1.关于为什么痛

根据我的症状描述,多位医生/医学生指出这是腰肌劳损,多半是因为久坐姿势不对引起的,如果严重一点就会发展成为小关节紊乱,再不注意,过几年会发展成腰椎间盘突出(啊吓死了。)

2.关于去不去医院

大多数医生/医学生说得去医院,也有几位说不用去医院,在家躺着休息,感觉有麻木、牵拉感再去医院。

3.关于挂什么科

先要去骨科或者脊柱外科,要拍个片子确认一下没有伤到骨头,也有人说做MR(核磁共振成像);然后去针灸/推拿/理疗/疼痛/康复科,针灸和推拿都是有效的,有针灸科的医学生说,这个一针见效。不能针灸的话,那就是中医正骨推拿,也能搞定,不过大家都说推拿不是谁都可以,要有经验的老中医才行。

关于拍片子,有朋友指出我这个是弯腰岔气,不是摔的或者碰的,没有伤到骨头,不拍也行,拍了放心。

4.病例本例现身说法

知道了推拿可以治这回事,我查了一下家长,附近有个中医推拿馆,我就打了电话过去,他们详细询问了我的症状,问是不是久坐,以前有没有出现过轻的腰部不适症状,我说是的。她说可以过去,推拿能搞定。最后没有拍片子,一个小时的推拿基本缓解了疼痛,本来无法弯腰,坐下就痛,按完可以弯腰了,还有一些不适的感觉,但是明显缓解。

发现了没,我的朋友圈可太优秀了吧!剧透一波,双十一我要在公众号为我朋友圈里的单身男女们发布一下征友信息,敬请关注哈哈


以下是正文

1.p值是不是概率?

P value is the probility that rendom chance generated the data, or something else that is equal or rarer.

也就是说,p值由三部分概率组成:目标事件概率+(与目标事件概率相同的事件)的概率+(比目标事件概率更小的事件)的概率。

顺便补充两个R语言的函数,choose和combn。

choose(5,1)
## [1] 5
choose(5,2)
## [1] 10
choose(5,3)
## [1] 10
choose(5,4)
## [1] 5
choose(5,5)
## [1] 1

choose(5,3)表示从五个数中抽取三个,有多少种可能,返回具体数值。

combn(1:5,1)
##      [,1] [,2] [,3] [,4] [,5]
## [1,]    1    2    3    4    5
combn(1:5,2)
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
## [1,]    1    1    1    1    2    2    2    3    3     4
## [2,]    2    3    4    5    3    4    5    4    5     5
combn(1:5,3)
##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
## [1,]    1    1    1    1    1    1    2    2    2     3
## [2,]    2    2    2    3    3    4    3    3    4     4
## [3,]    3    4    5    4    5    5    4    5    5     5
combn(1:5,4)
##      [,1] [,2] [,3] [,4] [,5]
## [1,]    1    1    1    1    2
## [2,]    2    2    2    3    3
## [3,]    3    3    4    4    4
## [4,]    4    5    5    5    5
combn(1:5,5)
##      [,1]
## [1,]    1
## [2,]    2
## [3,]    3
## [4,]    4
## [5,]    5

combn(1:5,3)表示从五个数中抽取3个,列出所有可能(矩阵形式)

2.计算实例一,扔两个硬币

结果为HH的概率和p值

(H:head,T:tail)

随机抛两次硬币,HH、TT的概率都是1/4,HT的概率是1/2。

根据三个组成部分,可以计算出HH的p值:1/4 + 1/4 + 0 = 1/2 = 0.5

结果为HT的概率和p值

顺序通常没什么用,在这里,不考虑顺序,HT和TH是一样的。概率为1/2。

p值是 1/2 + 1/4 + 1/4 = 1

3.计算实例二,扔五个硬币

五个硬币,总共有32种可能:

除了五正、五反两种情况,其他的30种是:

library(stringr)
lapply(1:4, function(n){
  k = combn(1:5,n)
  sapply(1:ncol(k), function(x){
    y = rep("H",5)
    y[k[,x]] = "T"
    return(paste(y,collapse = ""))
  })
})
## [[1]]
## [1] "THHHH" "HTHHH" "HHTHH" "HHHTH" "HHHHT"
## 
## [[2]]
##  [1] "TTHHH" "THTHH" "THHTH" "THHHT" "HTTHH" "HTHTH" "HTHHT" "HHTTH" "HHTHT"
## [10] "HHHTT"
## 
## [[3]]
##  [1] "TTTHH" "TTHTH" "TTHHT" "THTTH" "THTHT" "THHTT" "HTTTH" "HTTHT" "HTHTT"
## [10] "HHTTT"
## 
## [[4]]
## [1] "TTTTH" "TTTHT" "TTHTT" "THTTT" "HTTTT"

可以看到上面生成的结果是一个列表,分了四组,分别代表有1、2、3、4个T的所有情况。

五个正面朝上的概率和p值

HHHHH的概率:(1/2)^5 = 1/32,TTTTT与之概率相等,不存在比1/32概率更小的事件。

HHHHH的p值:1/32 + 1/32 + 0 = 0.0625

虽然五个H的几率很小,但是p值>0.05,不认为是非常罕见的事件。

四正一反的概率和p值

四正一反的概率:choose(5,1)/(2^5) = 5/32

与目标事件相等的事件是四反一正,比目标事件概率更小的是五正和五反,所以p值是:

5/32 + 5/32 + 1/32 + 1/32 = 0.375

4.连续型的数据如何计算p值

例如身高,无法穷举所有的可能性。

密度图曲线下的面积代表横坐标对应范围事件发生的概率

生成示例图,身高的正态分布曲线,均值约为155.5

library(ggplot2)
x = seq(130,180,0.1)
df = data.frame(x = x,
                 y = dnorm(x,mean = 155.5,sd = 7),
                 gro = ifelse(x< 142,"A",ifelse(x >= 169,"C","B")))
ggplot(df, aes(x = x,y = y)) +
  geom_line() + theme_bw()
image.png

R语言如何计算曲线下的面积?我找到了一个积分函数,奇怪的知识增加了

连续型数据的概率

小于142cm:

integrate(function(x){dnorm(x=x,mean = 155.5,sd = 7)}, -Inf, 142)
## 0.02689204 with absolute error < 8.3e-06

大于169cm:

integrate(function(x){dnorm(x=x,mean = 155.5,sd = 7)}, 169, Inf)
## 0.02689204 with absolute error < 8.3e-06

介于142~169cm之间

integrate(function(x){dnorm(x=x,mean = 155.5,sd = 7)} , 142 , 169)
## 0.9462159 with absolute error < 6.7e-12

R语言是个好玩具,还可以画出相应的图(面积图)

ggplot(df, aes(x = x)) +
  geom_line(aes(y = y)) +
  geom_area(data = df[df$gro == "A",],aes(y = y), fill = 'blue',color = NA,alpha = 0.5)+
  geom_area(data = df[df$gro == "B",],aes(y = y), fill = 'red',color = NA,alpha = 0.5)+
  geom_area(data = df[df$gro == "C",],aes(y = y), fill = 'blue',color = NA,alpha = 0.5)+
  theme_bw()
image.png

重申一下,面积就是概率啊。

连续型数据的p值

再来看p值,身高小于142的p值如何计算?

身高>169和<142概率相等,没有比<142更加小概率的事件。所以p值为0.027*2 = 0.054

身高为142~169之间的p值:

0.946 + 0.027*2 = 1

0.946 是目标事件的概率,两个0.027是(比目标事件概率更小的事件)的概率。

区分p值和概率的极端例子

身高介于155~156之间的概率是:

integrate(function(x){dnorm(x=x,mean = 155.5,sd = 7)} , 155 , 156)
## 0.05694333 with absolute error < 6.3e-16

面积图:

df2 = data.frame(x = x,
                 y = dnorm(x,mean = 155.5,sd = 7),
                 gro = ifelse(x< 155,"A",ifelse(x >= 156,"C","B")))
ggplot(df2, aes(x = x)) +
  geom_line(aes(y = y)) +
  geom_area(data = df2[df2$gro == "B",],aes(y = y), fill = 'red',color = NA,alpha = 0.5)+
  theme_bw()
image.png

概率只为0.057,但p值呢?

目标事件概率是0.057,比目标事件概率更小的事件概率?因为155~156 处在正态分布的中位数附近,所以他的概率是最大的,身高落在所有的其他范围内的概率都比155~156要低,所以p值等于0.057+(1-0.057)=1

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,525评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,203评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,862评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,728评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,743评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,590评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,330评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,244评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,693评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,885评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,001评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,723评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,343评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,919评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,042评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,191评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,955评论 2 355