登录注册写文章

逻辑回归算法-极大似然函数推导

逻辑回归算法-极大似然函数推导

全部数据点数学表达为：

$\vec{x}，\vec{y}=(x_{1},y_{1} )(x_{2},y_{2} )\circ \circ (x_{n} ,y_{n} )$

（1）最大概率，采用二项式分布，概率连乘，极大似然函数

公式（1） $P(\vec{y}|\vec{x} ,\vec{w} ,b)=\prod\nolimits_{i=1}^n P(y_{i}|x_{i}，\vec{w},b )$

（2）用指数形式表达极大似然函数

当 yi=1，P(1| $x_{i},w,b$ )

当yi=0，1-P(1| $x_{i} ,w,b$ ）

极大似然函数指数形式转换为：

补充知识点：指数函数特性，f(x)= $y^x$ ,当也就是x=0，f(x)=1,x=1，f(x)=y

公式（1）转换为如下形式：

公式（2） $P(\vec{y}|\vec{x} ,\vec{w} ,b)=\prod\nolimits_{i=1}^n (1-P(x_{i} ))^(1-y_{i}）\bullet P(x_{i} )^(y_{i}）$

（3）求解极大自然函数，公式(2)是个概率的连乘，使用数学中转化思想，把连乘计算转换为连加，加法永远比乘法简单。

补充知识点：

使用对数函数单调特性，要么是自增，要么是自减，同时通过对数函数四则运算法则，连乘转换为加法法则解决公式（2）的问题；

注意：幂函数的指数，在对数运算中变化，由幂函数转为连乘，指数与对数的连乘

$\ln （x_{1} ^ay_{2} ^b ）=\ln x1^a +\ln x2^b=aln(x_{1})+b\ln (x_{2} )$ ,

公式（3） lnP( $\vec{y}$ | $\vec{x},w,b$ )= $\sum_{i=1}^m((1-yi)ln(1-P(xi))) +yiln(P(xi))$

公式（3）继续化简，使用四则运算法则，把左边式子部分展开

$\sum_{i=1}^m\ln(1-P(x_{i})$ - $y_{i}$ $\sum_{i=1}\ln (1-P(x_{i} ))$ + $y_{i}$ $\sum_{i=1}\ln (P(x_{i} ))$

把右边2个式子进一步简化，提取出 $y_{i}$ ，使用对数减法转换为对数除法，合并为一式

公式（4） $\sum_{i=1}^m\ln(1-P(x_{i})$ + $\sum_{i=1}^my_{i}$ $\ln (\frac{P(x_{i} )}{(1-P(x_{i} ))} )$

而 $\ln \frac{P}{1-P} =wx+b$ ，右边式子进一步简化为，(4-右)w $x_{i} +b$

P= $\frac{1}{1+e^-(wx+b) }$ ，左边式子转换为（4-左） $\ln (1-\frac{1}{1+e^-(wx_{i} +b) } )$

$\ln (1-\frac{1}{1+e^-(wx_{i} +b) } )=\ln(\frac{1+e^-(wx_{i} +b)}{1+e^-(wx_{i} +b)} -\frac{1}{1+e^-(wx_{i} +b) } )$

$\ln (1-\frac{1}{1+e^-(wx_{i} +b) } )=\ln(\frac{e^-(wx_{i} +b)}{1+e^-(wx_{i} +b)} )$ = $\ln (\frac{1}{e^(wx_{i} +b)+1} )$

$上下同除e^-(wx_{i} +b) 公式\frac{1}{e^-(wx_{i} +b)}=e^(wx_{i} +b)$

公式（4）最后简化为：

铺垫 $\ln \frac{1}{a}=-\ln a$

$\sum_{i=1}^m\ln (\frac{1}{e^(wx_{i} +b)+1} )$ + $\sum_{i=1}^my_{i} (wx_{i} +b)$

$-\sum_{i=1}^m\ln (1+e^(wx_{i} +b))$ + $\sum_{i=1}^my_{i} (wx_{i} +b)$

下一章内容就是最极大似然函数求导

最后编辑于：2020.07.12 12:45:33

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

2赞3赞

赞赏

手机看全文