一、界面认识
1、导入数据、数据源处理:
- 数据合并:多表连接(内、外、左、右连接)
- 读取非标准数据:手动处理源文件 / Tableau数据解释器
- 数据透视表读取:长型、宽型数据转换(一般是宽型为标准)
- 数据库连接:自定义SQL语言
- 多数据源融合:编辑管理关系
2、数据整理操作:
- 数据类型设置:数据源在左上角(#、Abc、日期等)
- 重命名
- 字符型变量(别名:数据的别称 ;数值拆分:自定义拆分)
- 数值型变量(数字分段:比如年龄分段 → 创建级)
-
创建(计算字段、组)
- 数据显示设定:元数据视图切换、字段显示排序、切换显示别名
3、工作表绘制
- 维度:分类变量(
数据桶:分段后的数据桶会被作为维度进行分析
度量名称:代表所有度量变量的集合 - 度量:大致对应连续变量
记录数:代表符合筛选条件的数量
度量值:代表对应度量的具体汇总数值,一般和度量名称联合使用 - 度量计算方式:计数、求和、平均...
- 表格基本框架:
行:形成表格横行的元素
列:形成表格列的元素
层:表格中第三个维度,Tableau使用分页实现分层效果
4、数据分层、分组、数据集
- 数据分层:数据维度上钻与下钻
创建分层结构:右击 → 分层结构 → 创建 - 创建分组:右击 → 创建 → 组
- 数据集:
注意:创建合并集必须是同一纬度
5、图表设置
-
如何显示行列总计:分析 → 合计 → 显示行、列总计
显示百分比
显示小数显示百分比:选中数据 → 设置格式
在单元格设置多个统计量:记录数拖至文本(比如显示人数,也显示百分比)
筛选器:筛选条件设置
导出图形数据:工作表 → 复制 → 数据(也可交叉表) / 选择图形 → 查看数据 → 导出
6、分析结果发布
7、统计图分类框架
- 单个- 分类变量:
简单条图:按照分类区直条,直条高度代表大小
分段条图:按照分类区分颜色,分段大小代表大小或构成比
饼图:饼块大小代表大小或构成比大小
气泡图:气泡大小代表大小 - 单个- 数值变量:
直方图:对数值进行分组频数汇总,呈现整个取值区间的数据分布特征(先创建数据桶)
箱图:使用百分位数体系刻画整个取值区间(中间粗线50%,方框上下为25%和75%) - 数值因变量:
简单条图
线图
散点图:呈现连续自变量的影响 - 分类因变量:
复式条图
分段条图
百分条图:呈现一个变量不同类别下另一个变量各类别的百分比情况(条形图 → 分析 → 百分比 → 列)
树状图
二、图形设计
1、条形图:
- 网格线删除:图表内部右击 → 设置格式 → 线 → 无
- 添加背景色:图表内部右击 → 设置格式 → 阴影 → 工作表
- 轴坐标设置:选择轴右击 → 设置格式 → 刻度、数字单位设置
- 设置标题格式:选择标题右击
- 升序、降序、交换行和列
堆积图:
2、折线图:
- 图表显示数据:记录数拖至标签处
- 类别添加颜色区分:将颜色区分的选项拖至颜色处
- 修改列名称:选择轴右击→ 编辑轴 → 轴标题
- 修改轴颜色字体大小设置:选择轴右击 → 设置格式
- 添加注释:右击空白 → 添加注释 → 标记 → 标记格式设置
双折线:同一列坐标,多行数(维度同度量多)(要显示在同一张图,双轴,同步轴)
3、散点图:看数据之间的趋势和分布情况
有横轴有纵轴
- 添加自定义形状:打开文件安装位置 → 找到defaults → Shapes
环形图::先创建两个相同饼图 → 行选择最小值 → 一个饼图放大,双轴合并成一个图 → 中间小饼图去除颜色标签,显示白色
4、饼图:展示数据占比情况
显示百分比:记录数 → 快速表计算 → 合计百分比
5、气泡图:
6、文字云:显示词的频率
记录数选择计数,标记改为文本
7、树状图:
8、热图:
9、凸显表、基本表:
10、标靶图:看完成进度
条形图添加参考线
11、甘特图:
12、雷达图:
13、瀑布图:
14、地图:
- 数据转换为地理角色
- 未知数处理:选中 → 编辑位置/筛选数据
- 地图 → 地图层 → 样式、冲蚀、国家地区
①符号地图:形状、大小设置(数字拖至大小)
②填充地图:数字拖至颜色
③多维地图:
④多边地图:
⑤背景图地图:
15、其他图形:
1、人口金字塔图(本质是成对条形图)
2、箱线图
3、漏斗图:
4、范围-线图:将整体数据的部分统计特征(均值、最大值、最小值等)展示在图形中,既可以说明群体特征,还可以展示个体信息,更可以比较个体与整体的相对关系
5、倾斜图:
四、计算字段
1、计算字段:
右击 → 创建 → 计算字段
2、表计算
常用函数
index():返回分区当前索引
size():返回分区行数
rank():返回当前行的排名,desc降序 asc升序
div(整数1,整数2):返回整数1除以整数2的除法运算的整数部分
power(number,power):计算数字的指定次幂。例如,POWER(5,2)=25
六、案例
1、topN练习
topN检测表:
-
数据提取时处理
- 工作表的筛选
-
参数:用户自定义直接控制的新增变量
2、
1、已有数据源增加数据:
并集追加:要求是在同一个数据连接下,将其中一张表拖至另一表上变黄松提前后追加:在已进行数据提取下直接从文件追加数据
2、异常值进行检测:
分析里面添加各参考线
3、筛选去掉空值
4、绘制词云和树状图
5、统计分析相关功能
趋势:只能针对日期时间维度进行预测
聚类分析:分析 → 群集