回归分析-python实践

研究汽车销量与生产总值、汽油价格相关性及预测模型建立

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import SGDRegressor

加载数据集并拆分训练数据集和测试数据集

# 加载数据集
data =  pd.read_csv('/data.csv')
x = data.iloc[:, 3:5]
y = data.iloc[:,2]
# 拆分训练数据集和测试数据集
X_train, X_test, y_train, y_test = train_test_split(x, y,test_size = 0.25, random_state = 1)

数据集进行处理并拟合

# 数据归一化
standardScaler = StandardScaler()
standardScaler.fit(X_train)
X_train_standard = standardScaler.transform(X_train)
X_test_standard = standardScaler.transform(X_test)

# 实例化 SGDRegressor
sgd = SGDRegressor(max_iter=1000, tol=1e-5)

# 对训练数据集进行拟合
sgd.fit(X_train_standard, y_train)

print('coefficients(b1,b2...):',sgd.coef_)
print('intercept(b0):',sgd.intercept_)

预测数据并评判

# 预测数据
y_pred = sgd.predict(X_test)
print(y_pred)

# 对测试数据集进行评分
print('模型评分:', sgd.score(X_test_standard, y_test))

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 10,182评论 0 5
  • 翻译自analyticsvidhya 基于树的学习算法被认为是最好的和最常用的监督学习(supervised le...
    珞珈村下山阅读 11,392评论 1 19
  • 我连自己都照顾不好自己,光是钱就要了我的命,我一点也不知道怎么去算清楚我的钱,怎么去省钱,还有怎么去生活才是刚刚好...
    新can者阅读 4,922评论 1 1
  • 怎么会跟雨季有关系:对印染行业来说,使用的一般是工业用水的标准,而水质往往随着季节、地区、气候变化而变化。尤其是夏...
    金练阅读 1,234评论 0 1
  • 1. 昨天看到这么一段话,说:一个成人,最好的进攻性武器是自己的智商,最好的防守武器是自己的道德底线。 而有人正好...
    疾风细语阅读 1,684评论 0 0

友情链接更多精彩内容