EDA-3

1、两个变量之间存在关系,可以先提出下面的问题:关系是偶然的吗?如何描述?关系强弱?受其他变量的影响吗?查看子群,变量之间的关系会变化吗?

2、

library(modelr)

mod <- lm(log(price)~log(carat),data=diamonds)

view(dfSummary(diamonds))


diamonds3 <- diamonds %>%

  add_residuals(mod) %>%

  mutate(resid=exp(resid))


ggplot(data=diamonds3)+

  geom_point(mapping=aes(x=carat,y=resid))


ggplot(data=diamonds3)+

  geom_boxplot(mapping=aes(x=cut,y=resid))+

  coord_cartesian(ylim=c(0,2))

#观察残差有什么用?

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 严重的睡眠不足导致我的焦虑症又严重了,不过一切还好的是,我竟然仍然敢去别的空间开会,这是不容易的事情,中午特意没敢...
    fba1b6419346阅读 154评论 0 0
  • 诚从农村考上大学,村里人在村头谈论的三天三夜,再没人有兴趣说谁家的媳妇走错了房,谁家的猪娃像四条腿的狼,反正就是吵...
    果枚阅读 373评论 2 1
  • 我躺床上考虑,今天一整天我试想了一下,思想有比昨天更进步了吗? 就想到上午看了《变量》,有很多不懂的词汇,“城市收...
    蓝白红黄阅读 432评论 0 0