240 投稿
收录了7篇文章 · 3人关注
  • 数据清洗

    数据类型转换 查看数据类型data.dtypes 将不同的数据类型进行转换data['id'].astype(type_name) # str,...

  • XGB算法梳理

    算法原理 XGB(extreme gradient boosting)是GBDT的一种工业实现,也是通过不断增加新树,拟合伪残差去降低损失函数。...

  • Resize,w 360,h 240
    GBDT算法梳理

    前向分布算法 负梯度拟合 使用负梯度作为伪残差拟合决策树。 损失函数 均方误差 回归 二分类,多分类 正则化 优缺点 优点 预测精度高 适合低维...

  • 随机森林算法梳理

    集成学习概念集成学习就是组合多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分...

  • 模型评估

    问题 验证方法 有哪些? 当样本数趋向于无穷时,自助法中大概有多少样本未被选出? 超参数 如何调优? 余弦距离 什么是? 余弦距离和欧式距离的区...

  • 特征工程

    问题 特征归一化 为什么要进行特征归一化? 方法? 使用场景? 离散型特征处理 为什么要处理? 方法? 特征组合 什么是? 方法? 存在的问题?...

专题公告

算法岗准备阶段