登录注册写文章

机器学习之逻辑回归算法

机器学习之逻辑回归算法

已知有n个特征x_i，我们需要通过这n个特征进行组合建模，最简单的即是线性组合，但是这里加入了一个扰动因子（为了模拟真实场景特征的变化）

为了实现数值与概率的映射，我们需要一个概率函数将上述线性变化之后的值转换为概率，针对2分类问题，该概率函数为sigmoid函数

针对2分类问题，分类为1和分类为0的概率分别为

这里我们假设Y|X服从伯努利分布，由伯努利分布公式可得观测概率为

因此可得似然函数为

下面将根据公式推导为什么该概率函数为sigmoid函数

假定概率函数具有以下性质

eq-1

根据信息论中定义的最大熵可得

eq-2

从上面的已知条件中，根据标准的解约束不等式优化方法（拉格朗日不等式可得）

eq-3

这里对不等式求导，并令求导的结果等于0（求取极值）可得

eq-4

求导之后可得

eq-5

化简公式之后可得

eq-6

将公式6带入公式1的条件2中化简可得

eq-7

然后将公式7代入公式6可得最终的表达式（softmax函数）

针对2分类问题（k=2），化简softmax函数可得（sigmoid函数）

参考文献

The equivalence of logistic regression and maximum entropy models

最后编辑于：2017.12.09 22:42:43

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

机器学习算法小结与收割offer遇到的问题
机器学习是做NLP和计算机视觉这类应用算法的基础，虽然现在深度学习模型大行其道，但是懂一些传统算法的原理和它们之间...
在河之简阅读 20,549评论 4赞 65
浅谈机器学习基础（上）
注：题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主，不涉及代码实现。前些日子定下了未来三年左右...
我偏笑_NSNirvana阅读 40,092评论 12赞 145
[译] 第三章改进神经网络的学习方式（上）
Neil Zhu，简书ID Not_GOD，University AI 创始人 & Chief Scientist...
朱小虎XiaohuZhu阅读 3,155评论 1赞 18
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念姓名：钟航转载自：http://mp.weixin.qq....
XavierZHH阅读 1,977评论 0赞 7
机器学习算法整理无公式
这个题目取得比较奇怪，原因是：虽然号称数学是世界上最简洁的语言，但是太多的公式难免看的人心慌；其次公式在hexo+...
Helen_Cat阅读 2,661评论 0赞 13

赞1赞

赞赏

手机看全文