本文来自我的个人博客 https://www.zhangshenghai.com/posts/48429/
Logistic 回归是统计学习中的经典方法,属于对数线性模型。
二项 Logistic 回归模型
将线性回归函数和Logistic函数复合起来,称为逻辑回归函数,二项Logistic回归模型是一种分类模型,二项Logistic回归模型是如下的条件概率分布:
其中,是输入,是输出,和是参数,称为权值向量,称为偏置,为和的内积。
Logistic回归比较两个条件概率值的大小,将实例分到概率值较大的那一类。
可将权值权值向量和输入向量加以扩充,即,,则逻辑斯谛回归模型如下:
模型参数估计
Logistic回归模型学习时,对于给定训练数据集,其中,,可以应用极大似然估计法估计模型参数,从而得到Logistic回归模型。
设:
似然函数为:
对数似然函数为:
对求极大值,得到的估计值。这样,问题就变成了以对数似然函数为目标函数的最优化问题。Logistic回归学习中通常采用的方法是梯度下降法和拟牛顿法。
假设的极大似然估计值是,则学得的Logistic回归模型为:
多项 Logistic 回归模型
可将上面介绍的二项分类Logistic回归模型推广为多项Logistic回归模型,用于多类分类。
假设离散型随机变量的取值集合,则多项逻辑斯谛回归模型为:
二项Logistic回归的参数估计法也可以推广到多项Logistic回归。