前言:
Microsoft Excel,Power BI和其它能够处理数据的产品中存在一种数据转换技术,可以避免重复性的工作,尽可能帮你节省80%的时间。
- 每次复制粘贴相似的数据到工作簿并手动清理数据时,大多数情况都在浪费宝贵的时间,你可能还没有意识到有更好的办法去提高效率。
- 每次你依靠别人来获取正确的数据,你都应该了解这里有一个更简单的方式去重新整理你的数据并享受这种自动化的工作。
- 每次你需要做出快速明智的决定,但面对庞大的数据清理工作。当你了解这种方法后,便可以轻易地处理这些数据并且节省大量时间。
让我们准备好一起学习吧,用高质量的数据清理工具取代重复性手动数据清理工作,享受这个过程并获得工作的极大乐趣。
我们将一起学习使用Power Query来解决实际的数据难题,如何将杂乱无章的表格和内容导入创建为可供分析的自动化和结构良好的数据库。这些方法大都轻松易学并且可以长期运用于工作中。
适合谁学习:
- 经常要复制粘贴数据到Excel中并且需要经常清理数据;
- 需要导入外部数据并在Excel或Power BI中创建报表,并希望提高效率;
- 非常熟悉Excel数据透视表;
- 非常熟悉Excel数据透视表并希望简单化数据模型;
- 非常熟悉Power Query 并希望提高这个技能;
- 使用PowerApps开发业务应用程序,需要连接到庞大混乱的数据源;
- 作为数据分析服务开发人员,希望加快ETL的发展。
目录:
第一章:介绍Power Query
了解Power Query的基本知识并开始实践。
第二章:基础数据准备工作
将学习如何处理相对基本的常见数据工作。如果你的工作经常需要频繁地清理数据,这章节将对你有极大帮助。将学习到最简单的技巧去自动化你的数据清理工作,仅仅用鼠标点击便可完成。如果你是第一次使用Power Query,这几下鼠标点击已经可以开始帮助你节省大量时间。
第三章:合并多个工作簿/表的数据
将学习如何合并多个数据源并且在Power Query编辑器中追加多个表格。你将了解如何从一个文件夹中添加多个工作簿并合并不同工作表——当添加新的工作表时,只需简单的刷新就可以将新的数据添加到你的报表中。
第四章:合并不同形式的表格
本章将进入新的阶段,学习如何合并不同形式的表格。在实际工作中,你的数据可能是割裂的,数据的格式和结构各不相同。学习如何规范化不同的表格将帮助你获得新的商业洞见。
第五章:保存上下文
将学习如何导入及保存外部数据,合并标题行以及其它元信息,比如文件名、表名。
第六章:逆透视表格
将学习如何提升表格结构来更好地表示数据的内容。逆透视转换是重塑表格结构的基础,以便更好地进行数据分析。你还可以学习到如何处理嵌套表格,以及为什么及如何忽略数据源中的总计和小计。
第七章:高级的逆透视和透视表
你将继续学习逆透视转换并归纳一个解决方案来帮助你逆透视和汇总表格,不管数据中有多少层次及行列数。然后,你还将学会运用透视来处理多行数据。本章学习的技巧将使你能够执行广泛的转换和重塑过于结构化的数据集,使之成为强大灵活的分析平台。
第八章:应对协作工作
如果你需要经常在团队或公司中和他人分享协作你的报表,你将学习关于基础的协作技巧并通过设置参数和模板来解决这个问题。
第九章:关于M函数语言
你将深入学习M语言,可以自定义你的查询语言来实现更多需求。在本章中,你将学习M语言的主要模块——语法、运算符、类型及各种内置功能。如果暂时没有此需求,可先跳过本章节。掌握M语言不是处理繁杂数据的先决条件,但在必要时可以提升你的能力。
第十章:搭建正确稳固的查询语言
Power Query编辑器的使用体验非常棒,因为它可以将乏味但重要的数据清理工作转变成自动化更新流。但随着数据处理的学习,你可能会在Power Query编辑器中犯下一些常见的错误,使得数据在自动转换过程中报错,或在刷新数据时得出错误结果。
在本章中,你将了解到一些常见错误和陷阱,并学习如何创建稳固的查询语言,来避免报表刷新失败及得出错误结果。
第十一章:基础文本分析
在你的报表中也许包含了大量在分析中常常被忽略的文本列。你将学习如何使用常见的转换工具来提取文本的意义、检测关键字,忽略常用词等。
第十二章:高级文本分析
本章节将进入高级文本分析,学习如何使用语言翻译、语境分析以及Microsoft Cognitive Service来做关键短语检测。使用网页版Power Query和一些基本M语言可以帮助提取文本信息和驾驭人工智能的力量,无需借助专业数据分析人员的帮助。
第十三章:社交网络分析
你将学习分析社交网络数据并且找到简易的方法来链接到社交网络,获取洞悉。可以帮助你处理非结构化JSON数据集以及Power Query在公共数据集中的运用。
第十四章:万元归一
你面临的最后一个挑战将是整合所有的知识并运用到广泛的工作中。