欠拟合(underfitting) 、高偏差(bias)
过度拟合或过拟合(overfitting)、 高方差(variance)
当我们的假设函数的形式很难映射到数据的趋势时,不合适或者偏见很大。 它通常由太简单或使用太少功能的功能引起。 另一方面,过度拟合或高变异是由适合可用数据的假设函数引起的,但不能很好地概括以预测新数据。 它通常是由复杂的函数引起的,它会产生许多与数据无关的不必要的曲线和角度。
过度拟合的问题会在变量过多的时候,发生这种时候训练出的方程总能很好的拟合训练数据。所以你的代价函数实际上可能非常接近于0或者就是0 。但是这样的曲线它千方百计的拟合于训练数据,这样导致它无法泛化到新的数据样本中, 以至于无法预测新样本价格。在这里术语"泛化" 指的是一个假设模型能够应用到新样本的能力,新样本数据是没有出现在训练集中的房子。
过度拟合的解决办法,适用于逻辑回归、线性回归。