谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理)

1.数据处理

1.1 数据清洗

  • 重复数据的处理:COUNTIF法,删除重复数据法,透视表法等
  • 缺失数据的处理:
    • 方法一:用样本统计量的值代替,通常用样本平均值代替
    • 方法二: 用统计模型计算出来的值代替,常见的模型有回归模型\判别模型
    • 方法三: 将有后发制人值的记录删除,这会导致样本量减少
    • 方法四: 将有缺失的记录保留,仅在缺失值 不大的情况下做分析时排除
    • 方法五:查找替换
      技巧:CTRL+G 定位,Ctrl+Enter同时输入一个值
  • 检查数据数据
    • 用IF函数
    • 用条件格式

1.2 数据加工

  • 数据抽取:取出字段时需要的信息
    • 字段分列法
    • 函数 LEFT,MID,RIGHT截取法
    • 字段合并: &连接字符,concatenate合并函数,text限定显示格式等
    • 字段匹配:vlookup,lookup,hlookup等
  • 数据计算
    日期函数date,year,month,day,today,datedif的组合运用
  • 数据分组
    用vlookup,lookup等函数将数据分组,比如将43寸以下的电视定义为"小板",将43寸(含)-55寸的电视定义为"中板",将55寸(含)以上的尺寸定义为"大板"
  • 数据转换
    • EXCEL的转置功能
    • 二分法:用if,isnumber等将调查转为1或0的两种结果

1.3 数据抽样

rand,randbetween随机函数的运用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容