240 发简信
IP属地:江苏
  • Resize,w 360,h 240
    对模型评价指标AUC的理解

    AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本...

  • 在win10环境下修正matplotlib绘图包的中文乱码问题

    涉及一些数据集中存在中文字符, 原始的matplotlib绘图会出现中文乱码的问题.试了很多办法,最后这里找到一个可以完美解决的方案,亲测有效:...

  • Resize,w 360,h 240
    如何进行一场数据挖掘算法竞赛

    一. 为什么要参加竞赛? 二. 需要哪些技能? 三. 怎么选择比赛合适的比赛? 建议去kaggle学习. 里面大牛分享的想法 , 还有开源.c...

    2.0 1879 0 13
  • 关于pandas merge 合并操作的讲解

    pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法. 合并时会将所有的列进行合并,但是指定...

  • 关于pandas索引的小记

    pandas中DataFrame结构的索引分为行索引和列索引,因此在不同的用法下索引指代的操作也是不一样的.这里记录一下,后面忘记了再回来看. ...

  • skew_dummies方法

    这是实现将数据正态分布化,然后整体One-Hot化的代码

  • 关于OrdinalEncoder 、OneHotEncoder 、get_dummies、LabelEncoder的用法与作用

    OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征...

  • Ridge & Lasso & Elastic Net

     这边文章主要是记录自己对于Ridge & Lasson & Elastic Net的理解和总结.内容较为粗浅,偏向应用而没有太多的数学理论. ...

  • Resize,w 360,h 240
    学习曲线

    在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训练出的算法模型不足以表达数据间...