本篇章主要是利用sklean建立一个简单的线性回归模型,然后利用matplotlib.pyplot 对结果进行图像化,里面知识点有对数据进行训练集、测试集划分,LR模型建立,可视化展示。
模型数据如下:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 导入相关数据
dataset = pd.read_csv("../datasets/studentscores.csv")
X = dataset.iloc[ : , : 1].values
Y = dataset.iloc[ : , 1].values
# 导入sklean库的cross_validation类来对数据进行训练集、测试集划分
from sklearn.model_selection import train_test_split
# 拆分数据,0.25份作为测试集
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/4, random_state=0)
# 建立模型
from sklearn.linear_model import LinearRegression
# 使用训练集对模型进行训练
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)
# 预测结果
Y_pred = regressor.predict(X_test)
# 训练集可视化
# 散点图
plt.scatter(X_train, Y_train, color = 'red')
# 线图
plt.plot(X_train, regressor.predict(X_train), 'bo-')
plt.show
# 测试集可视化
#散点图
plt.scatter(X_test , Y_test, color = 'red')
#线图
plt.plot(X_test ,Y_pred, 'bo-')
plt.show()