《head first 数据分析》

2018-6-11

前几天又把这本书读了一遍。略过比较简单的章节,主要重看了贝叶斯定理、直方图、线性回归、误差、数据库和数据(csv)整理六个章节。

贝叶斯定理可以评估新信息对先前预估概率对影响。屏蔽了个人主观对新信息对矫枉过正,计算出一个更正确对概率。人脑很难一次性处理多个事,记忆也不太好——之前概率评估的细节在新信息来临时可能遗忘一部分,这就影响了准确的判断。说实在的,这本书对贝叶斯讲得太少,只是引用的话我现在还不太会。概率统计是塑造世界观的一个重要概念,图书馆搜了下,相关书籍很多,今后一定要拿来研究下。

直方图、线性回归、误差三章让我对旧概念有了新认识。这些都是大学里学过的,当时没有仔细学,更没有想过能应用到现实生活中。用鲜活的情景讲冷冰冰的知识,这可能是我喜欢head first系列书籍的原因吧。除此之外,把知识和实操深入结合也是该系列的优点。缺点是涉及内容不深不全,这受设计架构限制。

直方图主要讲数据分布,主要概念有平均数、标准偏差。线性回归主要讲概率预测。误差主要讲线性回归预测时的误差,用均方根来提供预测范围。

数据整理这章主要设计规则文本文件整理。其实所有“规则明确,机械重复”的情况都适用编程。编程,机械处理将人力解放。规则的文件可以用excel函数或正则表达式处理。正则表达式内容博大精深,今后一定研究下。对前段时间beancount卡住的银行csv导入一定有帮助。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Chapter 1 引言: 数据分析有一个固定的流程:确定-->分解-->评估-->决策。 1.确定 确定:确定就...
    奉先阅读 3,680评论 0 0
  • 30天目标:用本月学的时间管理和结构力建立自己的行为模式,改善行动力的稳定性。学会平衡生活工作,与控制情绪。 30...
    爱偷懒的大脑阅读 3,051评论 0 0
  • 自从一零年接触网络,就养成了这样的习惯。每年的今天,用文字诉说自己最真实的情感。 其实,情感与网络无关,其实,我的...
    如伊老师阅读 3,382评论 3 12
  • 天空亮得有些刺眼,一阵阵风和煦的的拂过,将他面前人儿的发轻轻的扬起,远处小河叮咚的水声,化成一个个音符,跳动在她的...
    雨微水阅读 2,784评论 0 1
  • 很多时候身边总是听到各种各样的抱怨、牢骚、对世间的不满、对社会的厌烦。听多了这些,人也会慢慢的往这方面去想,结果,...
    韩飞君阅读 1,805评论 0 0

友情链接更多精彩内容