强势回归,再说回归分析

首发于公众号:可乐的数据分析之路

高尔顿发现了“向平均回归”,一个总体中在某一时期具有某一极端特征的个体在未来的某一时期将减弱它的极端性,比如非常矮小的父辈倾向于有偏高的子代,而非常高大的父辈则倾向于有偏矮的子代。这些都是“回归效应”

之前也写过回归分析的文章,今天再说回归分析:
细说回归分析

变量间的度量

对于数值型自变量和数值型因变量之间的分析方法就要用到相关与回归分析。变量间的关系有两种:函数关系和相关关系。

函数关系

函数关系是一一对应的确定关系,因变量y随自变量x的变化而变化,比如销售额和销量之间的关系,就是线性函数关系。

相关关系

但是很多时候变量之间的关系是不确定的,这种不确定的数量关系就是相关关系。比如父母身高和子女身高,一个变量的取值不能由另一个变量唯一确定。

1.画散点图
通过散点图可以直观地看到变量之间的关系。

image

2.计算相关系数
发现有线性关系后,可以通过计算相关系数得出变量之间相关关系的强度。

image

需要注意的是:

  • r=0只能说明变量之间没有线性相关关系,但不能说变量之间没有任何关系。
  • 变量之间的相关关系不等于因果关系

3.相关系数的显著性检验
对相关系数进行显著性检验,以此来判断样本所反映的关系能否代表总体。

这里用t检验

  • 提出假设
    H0:总体相关系数等于0,结果不显著
    H1:总体相关系数不等于0,结果显著
  • 计算检验统计量
  • 决策

一元线性回归

前面在讲相关关系如何分析,回归分析主要解决的是:

  • 用数学表达式将变量间的数量关系描述出来
  • 确定一个/几个变量对另一个/几个变量的影响程度
  • 根据一个/几个变量的取值来估计预测另一个变量的取值

回归模型

只涉及一个变量的称为一元回归,且变量之间为线性关系的称为一元线性回归,其回归方程可以表示为:
[图片上传失败...(image-1adf9f-1607152509731)]

其图示是一条直线,实际上描述其关系的直线有很多条,究竟用哪条来代表两个变量之间的线性关系呢?这里就需要一个原则,就是最小二乘法。通过最小二乘法得到的回归线能使离差平方和达到最小,但不一定是拟合数据的最佳直线。

image

回归分析的计算量很大,通常我们可以依靠Excel、Python等工具来辅助我们计算分析。

判定系数R平方

判定系数是对估计的回归方程拟合程度的度量。R平方的取值范围是[0,1],R平方越接近于1,表示回归直线拟合的程度越好。

显著性检验

在得到了估计方程后,不能马上用来预测,因为该方程是根据样本数据得到的,它是否能真实地反映总体的关系,还需要进行两方面的检验:
1.线性关系的检验
检验自变量和因变量之间的线性关系是否显著。用F检验。

  • 提出假设
    H0:两个变量之间的线性关系不显著
  • 计算检验统计量F
    significance F用于检验的显著性F,也就是P值
  • 决策
    若significance F小于给定的显著性水平则拒绝H0,两个变量之间的线性关系显著。

2.回归系数的检验
检验自变量对因变量的影响是否显著。用t检验

  • 提出假设
    H0:自变量对因变量的影响不显著
    H1:自变量对因变量的影响显著
  • 计算检验统计量t
    P-value,直接与给定的显著性水平比较
  • 决策
    若P-value小于显著性水平,则拒绝H0,自变量对因变量的影响显著。

多元线性回归

一个因变量与多个自变量之间的回归关系就是多元回归,若因变量与自变量之间为线性关系,则为多元线性回归。

回归模型

多重判定系数

也用R平方来表示,意义与一元线性回归中的R平方类似,

显著性检验

在一元线性回归中,线性关系的检验和回归系数的检验是等价的,因为只有一个自变量。但在多元线性回归中,就不等价了
1.线性关系的检验
这里用F检验说明的是总体的显著性,总的多元回归方程是否具有线性关系,若要判断每个自变量对因变量的影响是否显著,则需要分别进行t检验

2. 回归系数的检验
t检验分别对每个自变量与因变量进行回归系数的检验,判断其影响程度,如果某个自变量没有通过检验,则说明该自变量对因变量的影响不显著,就没有必要将该自变量放进回归模型当中了。

举个例子

image

[图片上传失败...(image-3c0f76-1607152509731)]

多重共线性

多元线性回归中,可能会遇到自变量之间彼此相关的问题,这就是多重共线性。

多重共线性导致的主要问题是对单个回归系数的解释和检验

如何判别多重共线性?

  • 计算自变量之间的相关系数
  • 对相关系数进行显著性检验

如何处理多重共线性?

  • 将相关的自变量从模型中剔除
  • 若一定要保留,则对因变量的推断应限定在自变量样本值的范围内
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容

  • 回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人...
    黄成甲阅读 46,016评论 0 61
  • 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时...
    Vicky_1ecd阅读 1,273评论 0 0
  • CDA level I考试大纲 Part1 数据分析概念与统计学基础 占考试比例的30%; 共分5个知识方向,考试...
    嬛嬛非甄嬛阅读 3,676评论 0 2
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,518评论 16 22
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,561评论 0 11