波士顿房屋租赁数据训练(GBDT\线性回归\决策树CART)

基于波士顿房屋租赁数据进行房屋租赁价格预测模型构建,使用集成学习的算法方式对模型进行构建,比较基于GBDT的模型效果和单模型(单个线性回归、单个决策树)情况下的R2的评估值的比较

解题库:

房屋租赁价格预测属于回归类型,故模型选用回归模型:GBDT (from sklearn.ensemble import GradientBoostingRegressor)、 线性回归(from sklearn.linear_model import LinearRegression)、决策树_cart(from sklearn.tree import DecisionTreeRegressor)

工具库:

加载数据(import pandas as pd)、R2模型评估(from sklearn.metrics import r2_score)、划分样本_训练集vs测试集(from sklearn.model_selection import train_test_split)

step1 数据加载

波士顿房屋租赁数据如下图,数据格式不统一,无法使用同一个分隔符处理

数据处理

step2 数据清洗


step3 划分数据集


step4 训练模型(GDBT\线性回归\CART决策树)


线性回归这边增加了规格化数据处理(from sklearn.preprocessing import StandardScaler)

step5 用R2评估各模型

由此可见集成学习GBDT效果优于单模型效果

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容