引例:预测房子的价格,可能有两个特征,frontage和depth。我真正关心的是房子的占地面积,这决定了我拥有的土地的大小,因此我们可以自己构造一个特征,即frongtage*depth,表示房子的占地面积,用x表示。
与特征选择密切相关的一个概念就是多项式回归。对于一个房价预测问题,可能有不同的模型进行建模,如建立二次函数模型、三次函数模型等。如何将这些模型对应到线性回归模型中呢。
对于上图,我们想用三次函数来拟合房价数据,则要进行参数的转换,,这样就转换为一个多变量线性回归模型。在此时,特征缩放就会变得很重要。 实际上特征的选择有很多,你也可以不选择三次模型,凭借数据特征和对不同函数图像的了解程度,有不同的特征可供选择。不过有很多算法可以自动根据数据选择适合的特征。