学习笔记14 自学戴师兄的数据分析-tableau(上)

==感觉他这里讲的不好,不实用,全是毫无意义的理论

==今天又看了一边,楼上说的对(4.17                                           

1 tableau介绍

今天继续跟着戴师兄继续学习新的数据分析BI工具tableau,这个工具主要是用于数据的可视化和仪表盘的搭建。

本节的目标大概就是学习制作这样的一个仪表盘。

但是可视化其实只是tableau的基础操作,数据赋能和数据探索才是tableau正确的打开方式。

数据赋能大概意思就是将数据的看板发送到线上,其他部门人员可以直接基于你给的网址登陆去查看信息,并且看板是可以自动刷新的,业务人员还可以以此去下载数据。还可以设置一个通知,即数据中出现异常时可以自动的发出预警。

并且还可以让线上人员直接编辑修改,无需下载tableau软件。

总结一下,数据赋能功能如下:

自动更新看板,自动下载数据,线上修改图标,邮箱发送数据,设置数据预警。

数据探索是tableau第二个核心功能,主要功能如下

支持亿级数据的连接和处理,自由对字段进行各种计算,拖拽就可以轻松制作图表,数据可以随意聚合下钻,图标类型灵活转换,内置算法智能建模。

当然BI工具并不是只有tableau,PBI也很强,但是其不支持MAC,拓展资源也少。

小结:以上这些貌似都是需要会员才可以使用,学习阶段可能是无法接触到上述功能的。

2 数据连接

连接到本地文件时注意,csv属于文本文件。连接数据库还需要下载相关的驱动。


而数据连接的功能类似于excel当中的vlookup,将两个数据表按照其中一列进行连接。

默认就是智能连接,只需要选择连接所用的数据字段就可以。

这里视频中做了两个连接,shop连接cpc,河shop连接order,两个连接都有两个连接字段,上图已经给出。

在tableau的右上角有连接的两个选项,实时就是每次计算都会提取一次数据库进行运算,但在数据量大的时候会比较卡顿。数据提取就是将数据取到自己的库中,但每改动一次数据源就需要重新提取一次数据。

一般来说都是选择数据提取。

在做数据保存时,会有两个保存格式,twb是不包括数据的,打开工作表时需要自己连接数据;twbx是内置数据的。

此外右上角还有数据筛选器功能

例如选取GMV,我们可以设置提取范围,只显示满足范围条件的数据。当数据量比较大,或者有着统一的筛选规则时可以使用这里的功能。

接下来再说一下数据的处理,就是下方的大表,可以查看数据,进行排序,重命名,拆分等操作,由于过于简单,这里就不贴图了。点击这里可以之间查看数据列的信息,了解数据。

然后本次课程所使用的数据有三个,分别是shop,cpc和orders,第三个数据只有一家门店数据信息。

3 数据可视化原理

对于tableau的可视化而言,数据有两种类型,分别是维度和度量,其实维度就是分类型数据,度量就是连续型数据。

3.1数据可映射的图形类型:

3.1.1 位置:

通过两个度量(连续)分别作为x轴和y轴,确定某一个维度(离散)变量的位置,从而形成空间关系来表现该维度变量的分布和趋势,有点像气泡图。

3.1.2 长度

长度直接以图形的长度来衡量度量(连续)的大小,以维度(离散)变量作为区分,就如正常的条形图。

3.1.3 角度

角度或者弧长都是以度量的大小直接衡量,其表现可以细分维度与整体的关系,就如同饼图。

3.1.4 方向

这是对趋势的描述,如同折线图,以维度作为横轴(一般是时间),度量作为纵轴,观察其变化趋势。

3.1.5 形状

用来做区分,有些类似聚类时的一些图,用来区分维度,其实就是在散点图中加入形状。

3.1.6 面积与体积

面积体积比大小

3.1.7 颜色与深浅

类似热力图

3.2 可视化字典(链接)

3.3 使用tableau将数据变成图表

可以拖拽的区域主要有如下:

行列,标记卡和筛选器。行列不多说,就是简单的拖拽字段,标记卡用来切换数据的视觉映射类型,调整图标颜色标记大小等展示细节。筛选器是将指定变量作为筛选条件。

师兄视频里举了一个例子,将GMV放在行,日期放在列,但这里还需要将日期转换成日或者月。

然后就是表的制作,表的制作是不能使用连续型数据的,如果非要,那就得手动将连续数据改成离散型,离散会产生标签数据,连续会产生图形。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容