Day23 - 2018-04-25

我们将数据分析过程组织为五个步骤:提问、整理、探索、得出结论和传达结果。以下是关键要点的概述。

第 1 步:提问

你要么获取一批数据,然后根据它提问,要么先提问,然后根据问题收集数据。在这两种情况下,好的问题可以帮助你将精力集中在数据的相关部分,并帮助你得出有洞察力的分析。

第 2 步:整理数据

你通过三步来获得所需的数据:收集,评估,清理。你收集所需的数据来回答你的问题,评估你的数据来识别数据质量或结构中的任何问题,并通过修改、替换或删除数据来清理数据,以确保你的数据集具有最高质量和尽可能结构化。

第 3 步:执行 EDA(探索性数据分析)

你可以探索并扩充数据,以最大限度地发挥你的数据分析、可视化和模型构建的潜力。探索数据涉及在数据中查找模式,可视化数据中的关系,并对你正在使用的数据建立直觉。经过探索后,你可以删除异常值,并从数据中创建更好的特征,这称为特征工程。

第 4 步:得出结论(或甚至是做出预测)

这一步通常使用机器学习或推理性统计来完成,不在本课程范围内,本课的重点是使用描述性统计得出结论。

第 5 步:传达结果

你通常需要证明你发现的见解及传达意义。或者,如果你的最终目标是构建系统,则通常需要分享构建的结果,解释你得出设计结论的方式,并报告该系统的性能。传达结果的方法有多种:报告、幻灯片、博客帖子、电子邮件、演示文稿,甚至对话。数据可视化总会给你呈现很大的价值。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 179,227评论 25 708
  • 每天进步一点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点~~从开始只能写几句话、模仿别人的观点,到现...
    一个帅气的名字呀阅读 19,398评论 4 31
  • 对于从不想问题的我,读后感是1,思想、观念和井井有条的计划。2,做什么?如何做?3,要知道自己真正想要的是什么?这...
    蒋泳频阅读 249评论 0 1
  • 许久没有提笔写字了,无论什么原因中断了那么久都是不对的。就先从我们这次北京之行说起吧。首先我感受到了城市发展差距之...
    起风了的简书阅读 211评论 0 0
  • 某一天自己也从妈妈的孩子成了孩子的妈妈,可是对于妈妈这个职业,我是个小白。孩子初到这个新世界,我也初为人母。看着刚...
    花缘过客阅读 221评论 0 0

友情链接更多精彩内容