基于波士顿房屋租赁数据进行房屋租赁价格预测模型构建,使用集成学习的算法方式对模型进行构建,比较基于GBDT的模型效果和单模型(单个线性回归、单个决策树)情况下的R2的评估值的比较
解题库:
房屋租赁价格预测属于回归类型,故模型选用回归模型:GBDT (from sklearn.ensemble import GradientBoostingRegressor)、 线性回归(from sklearn.linear_model import LinearRegression)、决策树_cart(from sklearn.tree import DecisionTreeRegressor)
工具库:
加载数据(import pandas as pd)、R2模型评估(from sklearn.metrics import r2_score)、划分样本_训练集vs测试集(from sklearn.model_selection import train_test_split)
step1 数据加载
波士顿房屋租赁数据如下图,数据格式不统一,无法使用同一个分隔符处理
数据处理
step2 数据清洗
step3 划分数据集
step4 训练模型(GDBT\线性回归\CART决策树)
线性回归这边增加了规格化数据处理(from sklearn.preprocessing import StandardScaler)