kaggle学习 - 缺失值处理

如何检测补缺失值的效果?
补完以后看“补的数据”和“原生数据”的分布是否有差异。这里有两种合适的可视化方法,散点图、密度图和条状图。

散点图

散点图

密度图

密度图

条状图

条状图

可以发现补的效果还可以,但是下图就出现了意外。


可能的原因是m选取的过大,m是拟合的轮数。这里具体什么作用我也不是很清楚,存个疑。以后具体查看mice包及相关论文。

tempData1 <- mice(df3,m=50,seed = 12345)
modelFit1 <- with(tempData1,lm(CPI~Unemployment))

参考
Imputing Missing Data with R

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、认识缺失值 在我们的数据分析过程中,经常会碰到缺失值的情况。缺失值产生的原因很多,比如人工输入失误,系统出错,...
    鸣人吃土豆阅读 11,375评论 0 11
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,352评论 25 709
  • 用两张图告诉你,为什么你的 App 会卡顿? - Android - 掘金 Cover 有什么料? 从这篇文章中你...
    hw1212阅读 14,472评论 2 59
  • 日精进 郑州 坚持原创分享第78天 2017年9月14日 星期四 晴 妞妞礼拜二放学回来告诉我:妈妈,老师说星期四...
    小莲蓬儿阅读 1,631评论 0 0
  • 真正爱你的人就是 你在他的面前是一个孩子 你可以任性的哭 任性的闹 任性的撒娇 你什么都不要去操心 因为有他 因为...
    红尘结香阅读 2,801评论 0 0