非线性假设(Non-linear Hypotheses)
在之前的分类问题中,我们可以使用多项式帮助我们建立更好的的分类器(假设函数)。但数据集中存在超过100个特征变量,我们又希望使用这100个特征变量来构建多项式来建立分类器。此时,若我们只考虑特征变量两两组合的情形,其就有大约5000个项,个数以O(n2)的级别增长,数学表达式为n2/2。
倘若我们仍以多项式来构建分类器,其效果是远远不理想的。
再例如我们希望构建一个模型用来识别视觉对象(如识别一张图中的汽车)。我们可以利用许多张汽车的图片和不是汽车的图片中一个个像素的值(饱和度或亮度)来作为特征变量。
现假设我们只选用灰度图片,则每一个像素只有一个值,进而我们可以选取图中的两个不同位置上的两个像素作为特征变量,通过使用逻辑回归算法来构建分类器。
如果我们采用的都是50*50像素的图片都每个像素都作为特征变量的话,则一共有2500个特征变量,为了更好地拟合数据集,我们又将特征变量两两组合,构建一个多项式的分类器,但此时又近3百万个项,继续使用逻辑回归算法,不用多说其效果肯定不尽人意。
对此,为了解决上述问题,我们将引入神经网络这一概念。
神经网络
神经网络算法主要来自对大脑的模仿,其目的是发现一个类似于人类大脑学习能力的算法。