Excel数据建模——Power Query数据清理与整合

我们经常遇到数据源不规范的数据,或者数据来源较多,需要进行交叉整合。这时候,仅靠普通的数据处理不但效率低下,而且很难解决问题。因此,需要用到Excel中强大的数据处理工具——Power Query,将不同来源的数据汇到一起,进行数据清洗、筛选、合并,从而得到我们需要的结构化数据,以便进一步进行数据建模分析和可视化。

1. 数据导入Power Query

首先,通过Power Query,将存放在一个文件夹中的数据源(Excel工作簿)导入到Power Query编辑器,筛选出目标工作表(这里有10个目标工作表),并基于此分别提取投入产出数据信息。

图1-存储在一个文件夹中的数据源
图2-Power Query筛选出目标工作表

2. 提取标准工时

产出数据建立在标准工时产出数量的基础上,而工厂没有建立一个独立的工序标准工时数据源,因此需要从原始数据中将工序的标准工时提取出来

3. 提取产出数据,得到工序产出

接着,提取各个工序的产出数量,与标准工时一起计算得到各个工序的产出工时,以便从产品和工序的角度进行生产分析

4.按人员分组,得到人员产出

将上述的工序产出工时按照人员进行分组,从而得到人员产出,以便从人员的角度进行生产分析

5. 提取人员投入数据,合并查询得到人员投入产出

另外,提取员工每天的投入工时,再将人员投入和人员产出进行合并查询,从而得到了每人每天每种产品的投入产出查询方案。

图3-投入产出查询
图4-Power Query查询关系

有了规范的投入产出数据,我们就可以进行下一步的Power Pivot数据建模分析了。后面我会逐步介绍Power Pivot数据建模分析,敬请关注!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容