一: 主成分分析,
1找出主factor 下降维度
2特征工程,特征工程2,3增加纬度
二: 分情况:
例一:房价预测;2;进阶版预测
(1)先聚类(无监督),
(2)再拟合
1各种映射最小二乘
2增加条目0 1,对此进行线性回归 回到原函数映射季节性+趋势
3各种映射放缩组合boosting:boosting 算法 CatBoost、Light GBM 和 XGBoost 进行了对比;虽然本文结论依据于特定的数据集,但通常情况下,XGBoost 都比另外两个算法慢。GBDT(也属于boosting)
例二:泰坦尼克号是否成活1,2
西瓜是否熟了
是否患有糖尿病
文本分类cnn rnn实现
分类(有监督)
即基于一组预测变量预测一个分类结果(二分类)。有监督机器学习领域中包含可用于分类的方法:逻辑回归、KNN(k临近)、决策树、随机森林、支持向量机(svm)、神经网络等。
例三 GBDT+LR CTR预估-Kaggle实例[有数据集]
三,正则化(防止过拟合)
最后:预测结果常用评分标准
If you are interesting in this topic.
You can get in touch with me.
18234056952(Tel wechat qq)