从线性回归说起
对于线性回归问题,我们的模型函数根据定义自然地选择为而当我们考虑二值化问题时,由于目标变量只能取0或1,因此我们选择了值域在区间的Sigmoid函数。那么什么是Sigmoid函数?以及,为什么不选择其他值域在区间的函数呢?
Sigmoid函数
Sigmoid函数又叫做Logistic函数,或者Logistic Sigmoid函数,也被经常称作S型曲线。函数形式为 现在,我们的模型函数具体写为
指数分布族
二值化问题其实在统计上满足单次Bernoulli分布(即0-1分布),当考虑到这一分布其实是属于指数分布族时,即的分布列可以表达为形式时,我们可以“自然”导出Sigmoid函数:
取 可以发现我们已经证明了单次Bernoulli分布属于指数分布族。而反解我们就可以得到
这里补充一点,常用的统计分布都可以表为某种形式的指数族分布,例如二项分布,其结果与0-1分布很类似,不同点只有。
另外,Sigmoid函数还有一个非常好的性质,我们选择它也有一部分这方面的原因:
因为这个性质可以大大降低梯度下降时的计算量。
一些会涉及到的其他概念:
广义线性模型GLMs
生成学习算法