PowerQuery 数据源获取相关笔记

本文章为个人学习笔记,主要是对Excel、PowerBI中,对于数据源的获取渠道进行简单学习,不知道会不会更新,差不多就这样了。

获取方式

Excel

Excel主要是在 “数据”=》“获取和转换数据” 这里进行数据获取

PowerBI

一般可以刚打开的时候点击数据源

或者在主页的标签里面进行选择

一、表格获取数据

(多工作表为例)

Excel:

选择适合的文件,直接导入

导航器可以预览数据,点击“选择多项”才可以选择多个表格。

然后直接点击“加载”。

“转换数据”是进行Power Query查询器,这里不进行介绍。

自此,已经将数据加载成功

想要表格出现在工作表里面,就可以右击选中的表格,然后点击“加载到…”,然后根据自身需要,选择合适的导入方式。

自此,已经加载成功了。

PowerBI:

点击“获取数据”之后,选择“Excel”,点击“连接”。(PowerBI相较于Excel有更多数据源的导入方式,大家可以自行探索一下)

同样打开相同的表格,

PowerBI的导航器跟Excel差别不大,不用勾选“多项选择”。

通过左侧栏的“数据”图标,可以看到数据具体的内容,右侧则可以观看数据表的各个字段。

Excel与PowerBI的第一个区别

Excel 创建好模型之后,一般是需要手动进行数据建模的,

而PowerBI会自动识别表格字段的关系进行建模

(个人学习过程的总结,有错请指正,谢谢。)

二、文件/CSV

ExcelAndPowerBI

两者的原理相同,这里不过多的阐述,在于导入数据之后的导航器页面与前项不同。

导入数据后,会自动识别编码方式和分隔符,其余操作与前项。(以PowerBI界面为例)

Excel与PowerBI的第二个区别

PowerBI在导航器页面左下角有个“使用示例提取表”的按钮,主要是对数据源的实际存在的数据数据进行二次编排,在爬取网页结构化数据的时候比较多使用到。

JSON

一般打开之后会有这三种情况

三种情况是从上至下发生的,所以一般可以通过Power Query进行处理,M函数请观看表上的代码。

以第三种情况为例子,我们对表格进行“转置”和“将第一行用作标题”的数据处理。就得到下图的数据表了。

PS:数据源是通过Python进行编码转换的,所以时间列转化成时间格式会报错。

据说有公式可以转换,但是愚人找不到。

PDF

PowerBI(目前只了解PowerBI可以读取)

依照上图,可以知道PowerBI以表格为基础和以页数为基础分别读取了数据,根据具体的数据可以选择合适的表格,然后利用“追加查询”进行表格的合并就好啦。

SQL Server

Excel

服务器名称可以在数据库新建查询,输入“Select @@servername”获取,也可以直接输入"."或“localhost”或“127.0.0.1”,一般只需要输入服务器和数据库。

下半部分的“高级选项”则是需要比较高的SQL编程水平和数据需求才会用到。

PowerBI

PowerBI与Excel的区别在于,把连接模式区别开来。

导入:连接数据,可以进行数据建模,需要点击刷新才可以更新数据。

DirectQuery:在线连接数据,实时更新,但不可以进行数据建模,需要提前

              设计好数据模型。

SQLServer登录凭证

登录数据库有三种方式,如果是本机的数据库可以直接通过下图的形式建立连接。

这边我选择用数据库的账号进行连接。(一般也是按照这种形式连接)

PowerBI页面的导航器,左下角可以根据你选择的表格自我搜索相关表格。

PS:作者远程连接没成功过,希望大佬们指点一下,哈哈哈

Web

Web就是通过简单的爬虫获取结构化的数据,并形成表格进行筛选。

有基本模式和高级模式。愚人只做了基本模式的爬取,所以只讲基本的。

基本上选择合适的表格就可以了。

使用示例添加表(PowerBI导航器页面)

只要在列表上输入两行相同属性的数据,再点击第三行就能自动填充该标签下所有相同的数据,列名也可以在此更改,最后确定就能生成想要的表格

总结

Excel相较于PowerBI的数据源获取方式比较少且简单,PowerBI更加灵活且智能。

编写时间:

2021-08-13

作者:

KerwinLi

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容