Ransac regressor

Random sample consensus

核心思想:把数据分成inliers 和outliers,选用inliers的数据训练模型。是一种非确定性算法

算法细节

  1. 选择一部分随机样本从原始数据中,并检查数据是否有效。
  2. 使用随机选择的子集训练模型并检查模型是否有效。
  3. 根据模型结果残差 按照residual_threashold分成inliers 和outliers
  4. 保存训练的模型如果inliers样本达到最大

其中1,2步是为了防止一些outliers来训练模型,也可以不要。

收敛条件:

1.达到最大试验次数
2.inliners 数量满足要求
3.所有样本的残差小于阈值
4.训练样本中至少有一次无异常值的样本被抽样
Reference:

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.RANSACRegressor.html#sklearn.linear_model.RANSACRegressor

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、完整的机器学习建模流程 1. 实际问题抽象成数学问题 2. 获取数据 3. 特征工程 4. 训练模型、诊断、调...
    Jasmine晴天和我阅读 1,816评论 0 9
  • 用于分类 逻辑回归是一个分类模型,“逻辑”是 Logistic 的音译。之所以叫回归,是因为它实际上预测的是概率,...
    李威威阅读 826评论 0 0
  • 线性回归算法简介 线性回归算法以一个坐标系里一个维度为结果,其他维度为特征(如二维平面坐标系中横轴为特征,纵轴为结...
    __method__阅读 610评论 0 1
  • 线性回归算法简介 线性回归算法以一个坐标系里一个维度为结果,其他维度为特征(如二维平面坐标系中横轴为特征,纵轴为结...
    __豆约翰__阅读 1,033评论 1 5
  • 夜莺2517阅读 127,761评论 1 9