统计学(47)-一般线性模型

1、什么是一般线性模型呢?

(1)t检验用于两组均值比较?
(2)方差分析用于多组均值比较?
(3)线性回归则用于自变量对因变量的影响分析?
粗粗一看,三者之间貌似没有联系!
但它们却在同一个模型下面,这就是一般线性模型(General Linear Model)。
一般线性模型并不是一个具体的模型,而是多种方法的统称,像t检验、方差分析、线性回归等都从属于一般线性模型的范畴。

2、揭开一般线性模型的面纱?

(1)左侧为两座城市空气质量指数(AQI)的比较,中间为不同心功能分级的精神健康得分比较,右侧为不同温度对某病发病率的影响。

image.png

(2)对于上述三份数据,应该用什么分析手段呢?
分别用t检验,方差分析,线性回归

3、数据转换

image.png

有没有恍然大悟的感觉?
左图第一列的1和2分别表示城市A和B,分别表示心功能分级的1级、2级和3级。
这三份数据有什么共同点呢?
第一,都有两个变量。而且研究目的基本可以统一概括为左列变量对右列变量的影响。
第二,根据研究目的,这3份数据都有一定的侧重,变量有主次之分,如分析的是温度对发病率的影响(而不是反过来)、心功能分级对精神健康得分的影响(而不是反过来)等。也就是说,两个变量可以分为结果变量(右列)和影响因素(左列)。
第三,结果变量(AQI 、精神健康得分、发病率)都是定量的而不是分类的,影响因素既有定量的(如温度),也有分类的(如二分类的城市、三分类的心功能分级)。
事实上,上述三点也就是一般线性模型的特点。一般线性模型的基本形式为:
image.png

其中,y称为因变量,也叫反应变量、结局变量等;X1,X2,·· · ,Xp称为自变量,也叫解释变量、预测变量等。
模型中
image.png
表示截距,反映了当自变量=0时y的均值;而β1,2,3,4等表示斜率,反映了自变量每增加1个单位,y值的变动大小。

4、一般线性模型的用法

在一般线性模型中,因变量必须是定量的,而自变量则既可以是定量的,也可以是分类的。自变量的不同形式会导致一般线性模型退化为不同的具体方法,具体对应的各种方法如下:


image.png
5、一般线性模型的理解

(1)首先,将左侧数据做一个t检验,结果如下:

image.png

(2)我们再用一般线性模型来分析,将城市(分别将城市A和B赋值为1和2)作为分类自变量,以AQI作为因变量,结果如下:
image.png

(3)二分类自变量的不同模型比较分析
其实我们发现,截距=水平1,斜率项=城市2与城市1的均值差,斜率项的P值等于t检验的P值。
为什么会这样呢?
因为此处将城市作为分类变量纳入模型,相当于一个虚拟变量(这个之前粗粗提过,实际上可以理解有n个变量,通过某一个变量标准化,最后形成n-1个虚拟变量)。
对于一个二分类变量,尽管我们将其赋值为1和2,但当作为虚拟变量纳入模型的时候,都变成了0和1(分别对应我们对其赋的值1和2)。
重点理解的一句话
由于截距项表示自变量=0时的值,而自变量=0也就等同于城市A, 因此截距项对应的是城市A的均值。(想象下,我认为这个好理解)
斜率表示自变量每增加1个单位时y的变化值,对于二分类的0-1变量而言,增加1个单位,也就是从0到1的变化。而0表示城市A,1表示城市B, 因此,对于虚拟变量,斜率也就是城市B与城市A的均值差。(这里注意0和1是分类变量,但是我们可以理解为数值变量,差就为1,均值差/1就是斜率了)
强调一点 此处不要把自变量作为数值变量,要作为分类变量来计算。(要不结果会很不一样)
(4)多分类自变量的不同模型比较分析
其实,本质与二分类相同,虚拟变量增加而已。
中间数据的一般线性模型结果图
image.png

结果中,截距项表示心功能分级=1时的均值,“心功能分级[2], 表示心功能分级=2与心功能分级=1相比的差值为-10.01, "心功能分级[3],表示心功能分级=3与心功能分级=1相比的差值为-19.52。(虚拟变量是0,1,2)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容