2018-10-20

多元线性回归

        在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。

公式

——多元线性回归模型

1.建立模型

        以二元线性回归模型为例 ,二元线性回归模型如下:

        类似的使用最小二乘法进行参数估计:

2.拟合优度指标

        标准误差:对y值与模型估计值之间的离差的一种度量。其计算公式为:

3.置信范围

        置信区间的公式为:置信区间=

其中, tp是自由度为 n-k  的 t 统计量数值表中的数值,n  是观察值的个数,k  是包括因变量在内的变量的个数。

估计方法

1.普通最小二乘法

        普通最小二乘法(Ordinary Least Square, OLS)通过最小化误差的平方和寻找最佳函数。通过矩阵运算求解系数矩阵:

2.广义最小二乘法

        广义最小二乘法(Generalized Least Square)是普通最小二乘法的拓展,它允许在误差项存在异方差或自相关,或二者皆有时获得有效的系数估计值。公式如:

其中,Ω是残差项的协方差矩阵。

分析

1、多元回归分析与简单线性回归区别

多个自变量x

2、多元回归模型

3、多元回归方程

4、估计多元回归方程

一个样本被用来计算

的点估计

5、估计流程(与简单线性回归类似)

6、估计方法

        使sum of squares最小,

        运算与简单线性回归类似,涉及线性代数和矩阵代数的运算

7、举例

        一家快递公司送货,X1:运输里程;X2:运输次数;Y:总运输时间

8、描述参数含义

        b1:平均每多送1英里,运输时间延长0.0611小时

        b2:平均每多一次运输,运输时间延长0.923小时

9、预测

        问题:如果一个运输任务是跑102英里,运输6次,预计时间是多长?

10、如果自变量里面有分类型变量(categorical data),如何处理?

11、对第一个表格的数据,快递公司运输问题用Python进行代码实现

        将运输里程、运输次数、总运输时间按列的形式保存到文件TransportData.csv文件中,如下图:

Python3.7实现代码为:

运行结果:

transportData: [[ 100. 4. 9.3]

[  50.    3.    4.8]

[ 100.    4.    8.9]

[ 100.    2.    6.5]

[  50.    2.    4.2]

[  80.    2.    6.2]

[  75.    3.    7.4]

[  65.    4.    6. ]

[  90.    3.    7.6]

[  90.    2.    6.4]]

X: [[ 100.    4.]

[  50.    3.]

[ 100.    4.]

[ 100.    2.]

[  50.    2.]

[  80.    2.]

[  75.    3.]

[  65.    4.]

[  90.    3.]

[  90.    2.]]

Y: [ 9.3  4.8  8.9  6.5  4.2  6.2  7.4  6.  7.6  6.4]

coefficients: [ 0.06231881  0.88000431]

intercept: -0.807517256255

y_pred: [ 10.82902718]

12、当自变量中有分类变量(如:车型)时,多元线性回归处理

        将分类变量转化成0,1,2等数字来表示。0:小车,1:SUV,2:卡车,转码格式为:用一个3维数表示,所用车辆类型为1,其余车型为0.

        将运输里程、运输次数、运输车型、总运输时间按列的形式保存到文件TransportData2.csv文件中,转码格式如下图:

将转码后的数据保存在TransportData2.csv文件中:

总结

        好啦,以上是线性回归算法,我希望自己能多专研机器学习方面的知识并结合实例进行阐述。

        让人遗憾的是,简书不支持数学公式,所以我大部分地方是从我的word文档里面贴图过来的,花费我大量的时间不说,可能有些地方难免会失去数学本来的味道。

        写这篇文章的目的,一是帮助自己加深对机器学习算法的理解;二是很希望能帮助到需要的同学,大家共同进步。

        本人知识水平有限,如有错误之处,还请大家多多谅解。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,951评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,606评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,601评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,478评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,565评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,587评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,590评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,337评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,785评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,096评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,273评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,935评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,578评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,199评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,440评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,163评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,133评论 2 352

推荐阅读更多精彩内容

  • 回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人...
    黄成甲阅读 46,016评论 0 61
  • [{"reportDate": "2018-01-23 23:28:49","fluctuateCause": n...
    加勒比海带_4bbc阅读 767评论 1 2
  • 流感盛行于陇上,我身染疾在凉州。 又咳又喘人难受,时热时凉心郁忧。 母病未痊儿亦病,儿酬有志母何酬。 可怜母盼儿早...
    雪窗_武立之阅读 1,244评论 0 4
  • 我不知道你是怎样想的 但不管怎样我都牵动不起你的情绪 你在意又或是不在意 我不知道 但我知道 你不喜欢我
    花海o阅读 177评论 0 1
  • 世界,扑朔迷离 戴一副眼镜 把眼前的事物 看个清楚 撑一把伞 在风雨里 在烈日下 寻一处晴空和安然 漫漫前路 穿一...
    Jsunshine_912晴天阅读 1,130评论 28 30