Avatar notebook default
8篇文章 · 3050字 · 4人关注
  • Resize,w 360,h 240
    SelectKBest

    from sklearn.feature_selection import SelectKBest http://scikit-learn.or...

  • 稳定性选择(stability selection)

    sklearn在随机lasso和随机逻辑回归中有对稳定性选择的实现。from sklearn.linear_model import Rando...

  • Resize,w 360,h 240
    平均不纯度减少(mean_decrease_impurity)

    随机森林提供了两种特征选择的方法:平均不纯度减少和平均精确度减少(sklearn没有直接提供)。平均不纯度减少中,对于分类问题通常采用基尼不纯度...

  • Resize,w 360,h 240
    线性模型和正则化

    仔细想想线性回归,线性回归的系数就是权重。大于0正相关,小于0负相关。因此通过查看拟合模型的系数,就可以得到系数的权重。 这是最常用不带正则化项...

  • Resize,w 360,h 240
    热力图

    根据热力图也可以看出数据表里多个特征的两两相似程度。 import numpy as npimport matplotlib.pyplot as...

  • Resize,w 360,h 240
    基于学习模型的单变量特征选择

    Model based ranking这种方法的思路是直接使用你要用的机器学习算法,针对每个单独的特征和响应变量之间建立预测模型。皮尔森相关系数...

  • Resize,w 360,h 240
    递归特征消除(RFE)+ 交叉验证

    递归特征消除(Recursive feature elimination) 递归特征消除的主要思想是反复构建模型,然后选出最好的(或者最差的)特...

  • Resize,w 360,h 240
    皮尔森相关系数(Pearson Correlation)

    皮尔森相关系数是一种最简单的反应特征和响应之间关系的方法。 这个方法衡量的是变量之间的线性相关性。 结果的取值区间为[-1,1]。-1表示完全的...

文集作者