预测:

一: 主成分分析,

1找出主factor  下降维度
2特征工程特征工程23增加纬度




二: 分情况:


例一:房价预测;2;进阶版预测

(1)先聚类(无监督),

(2)再拟合
1各种映射最小二乘
2增加条目0 1,对此进行线性回归 回到原函数映射季节性+趋势
3各种映射放缩组合boosting:boosting 算法 CatBoost、Light GBM 和 XGBoost 进行了对比;虽然本文结论依据于特定的数据集,但通常情况下,XGBoost 都比另外两个算法慢。GBDT(也属于boosting)


例二:泰坦尼克号是否成活12

  西瓜是否熟了
  是否患有糖尿病

文本分类cnn rnn实现

分类(有监督)

即基于一组预测变量预测一个分类结果(二分类)。有监督机器学习领域中包含可用于分类的方法:逻辑回归、KNN(k临近)、决策树、随机森林、支持向量机(svm)、神经网络等。


例三 GBDT+LR CTR预估-Kaggle实例[有数据集]

点击率(ctr)解释



三,正则化(防止过拟合)


最后:预测结果常用评分标准

kaggle竞赛入门

If you are interesting in this topic.
You can get in touch with me.
18234056952(Tel  wechat  qq)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关于预测的两类核心算法 函数逼近/预测分析问题(分类问题、回归问题)解决方法:惩罚线性回归、集成方法 当数据含有大...
    maocy阅读 1,508评论 0 1
  • 常见的分类算法 感知机 感知机是神经网络以及支持向量机的基础。通过w*x + b = 0这样一条直线将二维空间划分...
    Alex_杨策阅读 1,844评论 0 1
  • 要想做到区间预测,首先搞清楚一般预报方法,这属于数据挖掘的范畴。看到这样的网络总结,虽然写的不够精细,但是可以帮助...
    就叫李德新阅读 1,032评论 0 3
  • 小妞的梦想 去洛阳看牡丹花一直是我家小妞的梦想。 小妞在幼儿园里看过一部动画片《牡丹仙子之瑞春花开》,特别喜欢,回...
    漫游家阅读 679评论 1 1
  • 幼时,我饱读诗书,勤练武艺,为朝廷,为社稷,为江山报效。我喜欢蒙里,雾里,那种醉眼朦胧的感觉,也喜欢运筹帷幄,一切...
    三邪七正阅读 174评论 0 0