内容为西瓜书的第10章特征选择和第11章特征降维。
1 在机器学习工程中,特征工程才是最重要,特征决定着算法的上限。
2 特征工程中最为重要和最为基础的两种技术,就是特征选择和特征降维。特征选择和特征降维的目的很简单,就是选择出或变换出更优的特征,从而更利于我们学习算法的学习。
第一节学习内容任务名称:
1 西瓜书10.1/10.2/10.3任务详解:特征降维的意思就是原有的一组特征经过数学变换,变换成数量更少的一组特征。
2 通常特征降维主要有两种目的,第一,减少特征维数,使计算开销更小;第二,使转换后的低维特征更具有特征性,使学习器学习起来更容易。
3 而特征降维主要包括两种方法,有监督降维和无监督降维,在3.4节的线性判别分析就是最为典型的监督降维,本节的主成分分析法就是最为典型的无监督降维,请大家对10.3节的主成分分析法进行重点的学习。
PCA 参考:https://blog.csdn.net/program_developer/article/details/80632779
备注
TODO:
1 pca代码未实现
2 https://scikit-learn.org/stable/auto_examples/feature_selection/plot_feature_selection.html#sphx-glr-auto-examples-feature-selection-plot-feature-selection-py