Logistic回归模型

Logistic回归的诞生

一般的线性回归模型也是可以分类的,虽然y值是连续的,但结合分段函数来实现,比如:y>=0为A类,y<0为B类。在y值离散的情况下,拟合出的线性回归模型的表现是非常差的。

如果凑巧样本如图1所示,那么线性回归模型能表现得如我们预期。但样本改变,原有的分段函数得出的分类结果就会很糟糕。所以对于离散的y值,线性回归模型不太适用,因此有了Logistic回归模型。


图1
图2


一、Logistic回归原理

Logistic回归模型起源于Logistic分布函数,它是一种分类函数,包括二分类和多分类。

在二分类模型中,y的取值只有0和1,以ln(p/(1-p))与自变量建立线性关系。p/(1-p)被称作y发生的几率,p是y发生的概率,几率和概率二者意义不同。

简单的Logistic回归模型为:

图3
图4

模型中的自变量可以是复杂的高维多项式,图4中等式右边的式子被称为决策边界,决策边界是由模型参数决定的,并非绘制样本集而得。

在多分类模型中,y的取值可能有0 1 2 3...比如预测天气是多云、下雨、晴朗还是阴天...Logistic回归模型采用的是‘一对’多方法。如三类的情况,需要把其他类都看作一类拟合二分类模型,需要拟合三个分类器。预测的时候,将预测样本分别输入三个分类器,选择概率最大、效率最高的那一个。

图5

在二元的线性模型中,求解损失函数最小会采用最小二乘法,从而得到最优的参数估计值。但在Logistic模型中,求损失函数最小常用的是梯度下降法以及更高级的优化算法。

二、参数估计

梯度下降法是对损失函数求最优的算法,来寻得最优参数向量,其过程为对初始参数向量不断迭代更新。

假设模型中只有两个参数,且损失函数为:

假设我们无法一眼看出参数的值分别为0和1时,损失函数达到最小。首先分别对参数求偏导:

那么用随机梯度下降怎么做呢?梯度下降迭代的公式为:

式子中是二维向量。首先随机给出一对参数值(1,2),并且设定学习率=0.1,那么参数向量的更新过程为:

......

如此迭代下去,直到损失函数收敛,接近一个常数,迭代停止。梯度下降法虽是奔着全局最优去的,但选取初始样本点的不同,得到的结果可能是局部最优解。如下图,分别从两个不同的样本点出发,得到的最优参数不一致。

但对于线性回归模型来说,损失函数总是凸函数,不会出现局部最优的情况,由梯度下降法得到的解总是全局最优的。凸函数如下图,无论从哪个位置开始下降,最终都会落到全局最低点。

另外,在参数迭代的过程中,学习率的选择比较考究。当学习率太小,迭代次数非常多,下降的速度很慢;当学习率太大,参数向量靠近最优点的时候可能会出现梯度爆炸,损失函数会趋于震荡甚至发散,得不到最优解,如下图:

有时候,自变量的取值量级相差很大,也会导致损失函数收敛速度变慢。比如x1的值是四位数,x2的值是两位数,那么代价函数的等值线密度会不规整,迭代次数很大,如下图:

所以需要先进行特征缩放,使变量的值都控制在差不多的范围之内,可以理解为标准化。多数建模过程都需要标准化,来消除量纲给参数带来的影响。

三、python实践

对于Logistic分类模型不仅能预测因变量,还能预测因变量发生的概率。在https://www.jianshu.com/writer#/notebooks/42661243/notes/60250510介绍了决策树模型对销量的预测,并对9个测试样本的结果进行了分析。那么用Logistic模型,对相同的样本,准确率会怎样呢?

预测结果和实际值如下,准确率并没有提高:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351

推荐阅读更多精彩内容