1、数据需要由字段与记录共同组合而成。
2、数据处理就是根据数据分析的目的,将收集到的数据,用适当的处理方法进行整理加工,形成适合数据分析的要求样式,它是数据分析前必不可少的阶段。
1)重复数据处理
2)缺失数据处理
3)检查数据逻辑错误
3、数据加工
1)、数据抽取,是指保留原数据表中某些字段的部分信息,组合成一个新字段。可以是截取某一字段的部分信息——字段分列;也可以是将某几个字段合并为一个新字段——字段合并;还可以是将原数据表没有但其他数据表中有的字段,有效地匹配过来——字段匹配。
2)数据计算
3)数据分组
4)数据转换
4、数据抽样