从零建立回归模型步骤 (2020.04.17)

1. 明确需求(因变量Y)

2. 数据清洗(缺失值、异常值、分类变量)

异常值:默认三倍标准差之外
分类变量:多为汉字和字母标识

3. 相关分析(将每个待选X与Y求相关系数、画散点图)

4. 分隔测试集与训练集

5. 回归(F检验、t检验、调整R^2)

6. 调优(对着高斯马尔科夫)

a. 残差服从正态分布
b. 同方差
c. 内生性
d. 共线性
f. 序列相关性

7. 模型优化(交互项、高次项、时间季节趋势等)

8. 逐步回归、交叉验证

9. 测试

推荐书:《数据挖掘导论》--人民邮电出版社

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 来源: http://www.douban.com/group/topic/14820131/ 调整变量格式: f...
    MC1229阅读 11,845评论 0 5
  • 以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等 第一章 绪论 1.2 基本术语 ...
    danielAck阅读 10,142评论 0 5
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 12,872评论 0 3
  • 老故事 狼来了 多少年多少天 我都相信 狼来了 你对我讲 :狼来了 我知道 我的神圣和肉体 已经 长成羊
    李希容阅读 734评论 1 4
  • 反正这种生活我也过腻了,有个人给了我一笔钱,我可以拿着他去环游世界!可他却对各种生活恋恋不舍,只有他的老婆...
    圈圈小诺阅读 4,946评论 0 1