逻辑回归

1 、引言

逻辑回归( logistic regression ),是一种分类方法,用于二分类问题,即输出结果只有两种,如用于广告预测,也就是根据某广告被用户点击的可能性,把最可能被用户点击的广告摆在用户能看到的地方,结果用户要么点击,要么不点击。通常两类使用类别标号 0 和 1 表示, 0 表示不发生, 1 表示发生。

2 、问题引入

例如:有 10 个手机,其中有 3 个是你喜欢的, 7 个是不喜欢的。现预测你对第 11 个手机的喜好。这是一个两类问题,喜欢与不喜欢。显然这是一个二分类问题,我们对第 11 个手机进行预测分类,分为喜欢和不喜欢两个类别。

那么就需要对手机取特征,比如价格,外观,用户体验等,简单处理只拿这个三个特征,那么可以使用如下等式:

x1 , x2 , x3 分别表示我们对某部手机的价格,外观,用户体验具体的量化数值。 θ 表示相应的权重,权重越高表示你越看重手机哪方面。

假设通过训练已经得到了 θ 值,那么就只需要将第 11 只手机的价格,外观,用户体验的量化数值代入上述公式中,得到 z 值。如果 z 值越高,说明喜欢该部手机的可能性就越高。 z>0 表示喜欢这部手机; z<0 表示不喜欢这部手机。 z>0 时, |z| 越大表示越喜欢; z<0 时, |z| 越大表示越不喜欢。

3 、 目标函数

sigmoid 函数的取值范围为 (0,1) 。 z>0 时, z 越大, g(z) 函数值越大,无限趋近于 1 。 z<0 时, z 越小, g(z) 函数值越小,无限趋近于 0 。因此就可以使用 g(z) 的值来代替 z 表示我们对手机的喜欢程度。

以 g(z) 值 0.5 为分界线,对于横坐标 z>0 时, g(z) 值大于 0.5 的可以归为 1 类, z<0 时, g(z) 小于 0.5 ,归为 0 类。

g(z) 值的范围在 (0,1), 而任意一个概率值也在 [0,1] 。概率的取值范围大于 g(z) 的取值范围,因此任意一个 g(z) 都能够找到一个概率值相对应。假设 z 的输出结果是 0 和 1 ,那么就有我们下式:

假设分类的概率写成如下:

把上面的概率写到一起:

联系贝叶斯公式的后验概率,分类的时候选取后验概率大的值进行分类。那么现在分类模型含有未知参数 θ ,如果求出 θ 那么就可以对新的样本进行分类。

那么如何求未知参数 θ 呢?我们现在有 m 个样本,思路是建立一个目标函数,求目标函数极值,极值处的 θ 值,就是我们最有未知参数值,即我们常用的极大似然估计。

4 、极大似然估计思想

给定:数据集和含有未知参数的模型(参数全部未知或部分未知)

估计:模型的未知参数

极大似然估计的思想:在给定模型(含有未知参数)和样本集的情况下,用来估计模型参数, 使得模型实现样本的最大程度的拟合,即使得该样本出现的可能性最大。

m 个样本的释然函数:

取对数后:

似然函数求导:

逻辑回归的目标就是使似然函数最大,因此可以采用梯度下降法进行迭代求得似然函数的最大值。

5 、梯度下降法求解对数似然函数的最大值

5.1 批处理梯度下降法

需要把所有m个样本全部带入计算,迭代一个计算量为mxn2

批处理梯度下降法没迭代一步要用到训练集所有的样本,如果样本数m很大,那么计算相应速度会很慢。所以针对这种不足,又引入了另一种方法:随机梯度下降法

5.2 随机梯度下降法 SGD(stochastic gradient descent)

随机梯度下降法每次迭代只代入单个样本,迭代一个计算量为n2,当样本量总数m很大的时候,随机梯度下降法迭代一次的速度要远远小于梯度下降法,迭代公式如下:

由于每次只代入一个样本进行计算,虽然每次迭代误差准则函数都不一定是向着全局最优方向,但是大的整体方向是向着全局最优方向的。

6、逻辑回归代码

6.1 样本数据

前两列分别为x1和x2值,第3列为数据的类别

6.2 读取数据

6.3 定义sigmoid函数

6.4 批处理梯度下降法

6.5 随机梯度下降法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容