校正年龄和性别 | 统计

写在前面

之前做群体进化,经常会遇到需要考虑群体结构对结果的影响。比如病例组和对照组之间在某个基因上存在差异,病例组在这个基因上突变了,对照组没有,刚开始以为是导致该病的原因。后来发现病例组是靠近北极的人,对照组是靠近赤道的人,本来两组人群在遗传上的差异就贼拉哒,这个突变可能是本来就存在的差异,不一定就是和疾病相关。这时候就需要将地域信息(人种信息)加入,作为协变量对结果进行校正。(好像扯远了...)

一般临床上要找指示疾病的标志物,比如某个基因的表达水平高低是否与疾病相关,也需要对常见的相关因素进行校正,如年龄和性别。

是否患病是0和1的游戏,所以这其实是一个binomial logistic regression的问题。除了拟合度的高低(R2,p-value),更应该关注比值比(odd ratio)的大小。OR>1,说明该因素能提高患病风险;OR<1,则认为是保护因素。

实战呗

例子文件

###
library(epiDisplay)
library(carData)
data(Wells, package="carData")
head(Wells)
#  switch arsenic distance education association
#1    yes    2.36   16.826         0          no
#2    yes    0.71   47.322         0          no
#3     no    2.07   20.967        10          no

glm1 <- glm(switch~arsenic+distance+education+association,
            family=binomial, data=Wells)
summary(glm1)    #查看相应参数    
logistic.display(glm1)  #计算OR值
#Logistic regression predicting switch : yes vs no 
 
#                    crude OR(95%CI)         adj. OR(95%CI)         P(Wald's test) P(LR-test)
#arsenic (cont. var.)   1.46 (1.35,1.58)        1.6 (1.47,1.73)        < 0.001        < 0.001 
#distance (cont. var.)  0.9938 (0.9919,0.9957)  0.9911 (0.989,0.9931)  < 0.001        < 0.001  
#education (cont. var.) 1.04 (1.02,1.06)        1.04 (1.02,1.06)       < 0.001        < 0.001  
#association: yes vs no 0.86 (0.75,1)           0.88 (0.76,1.03)       0.106          0.106    
#Log-likelihood = -1953.913
#No. of observations = 3020
#AIC value = 3917.826

pseudo_r2=1-(glm$deviance/glm$null.deviance)   #McFadden's pseudo-R2;不同模型用不同的pseudo-R2

关于pseudo r2,可参考以下描述:

The denominator of the ratio can be thought of as the sum of squared errors from the null model--a model predicting the dependent variable without any independent variables.

了解不同的pseudo_r2 https://web.archive.org/web/20130701052120/http://www.ats.ucla.edu:80/stat/mult_pkg/faq/general/Psuedo_RSquareds.htm

实际数据

data<-read.table("adjust_gender_age.inp",header=T)
head(data)
#GROUP AGE SEX T6 T7 T8 T9 
#1     0  48   1 0.06 0.56 0.38 0.74  
#2     0  45   1 0.07 0.95 0.34 0.77  
#3     0  24   1 0.00 0.65 0.40 0.83  

#(T6)binomial logistic regression:要求y必须用0和1来分类 (0<=y<=1)

glm<- glm(GROUP~AGE+SEX+T6,
          family=binomial, data=data)
pseudo_r2=1-(glm$deviance/glm$null.deviance) 
name=cbind(T6,pseudo_r2)
write.table(name,file="glm.out",quote=FALSE,sep="\t",append=TRUE,col.names=FALSE,row.names=FALSE)
or=logistic.display(glm) #计算OR
write.table(or$table,file="glm.out",quote=FALSE,sep="\t",append=TRUE,col.names=FALSE)

输出结果如下:

#T6 0.0128045811182196
#AGE (cont. var.)   0.9995 (0.994,1.0051)   0.9996 (0.9941,1.0053)  0.899   0.899
                
#SEX (cont. var.)   0.6 (0.52,0.71)     0.61 (0.52,0.72)    < 0.001 < 0.001
                
#T6 (cont. var.)    6.62 (1.55,28.29)   5.04 (1.17,21.6)    0.03    0.025

从结果可以看到,在校正AGE和SEX后,T6在病例和对照组之间的比值比是5.04,说明T6是风险因素,可以提高5倍的患病率(表述的好像不太准确,大概是这个意思)。

SPSS

SPSS可以很方便地以表格形式输出结果,唯一的弊端可能是表格太多,有时候不清楚看哪个。这个链接内容写得很详细,供参考 https://www.zhihu.com/question/34502688

写在最后

发现自己的统计,真的是渣渣级别啊。许多底层的基础逻辑和思维严重欠缺,不说了,看书去吧。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,997评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,603评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,359评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,309评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,346评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,258评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,122评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,970评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,403评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,596评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,769评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,464评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,075评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,705评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,848评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,831评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,678评论 2 354

推荐阅读更多精彩内容