IP属地:江苏
AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本...
涉及一些数据集中存在中文字符, 原始的matplotlib绘图会出现中文乱码的问题.试了很多办法,最后这里找到一个可以完美解决的方案,亲测有效:...
一. 为什么要参加竞赛? 二. 需要哪些技能? 三. 怎么选择比赛合适的比赛? 建议去kaggle学习. 里面大牛分享的想法 , 还有开源.c...
pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法. 合并时会将所有的列进行合并,但是指定...
pandas中DataFrame结构的索引分为行索引和列索引,因此在不同的用法下索引指代的操作也是不一样的.这里记录一下,后面忘记了再回来看. ...
这是实现将数据正态分布化,然后整体One-Hot化的代码
OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征...
这边文章主要是记录自己对于Ridge & Lasson & Elastic Net的理解和总结.内容较为粗浅,偏向应用而没有太多的数学理论. ...
在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训练出的算法模型不足以表达数据间...