1.1 基础入门——入门
这是开始屏幕。我们可以在这里连接到新数据,连接到保存的数据源,或者打开最近使用的工作簿。
连接到数据
在“连接” 窗格,我们可以看到 Tableau 可以本地连接的许多种数据源。
在本视频中,我们将连接全球超市数据(这些数据可以下载)。超市数据是像这样的一个 Excel文件。
数据的形状类似数据库表:第一行包含列标题。该数据集包含购买具体产品的客户交易。
我们返回 Tableau Desktop......然后选择连接到 Excel。导航到您电脑上的该文件,然后双击打开。
现在,我们来到了“数据源” 页面。从这里,我们可以选择使用哪些工作表或表格。我们可以把“订单” 拖到画布中。
如果要从这个数据源调出更多信息,只需将其他表拖至画布。
如果有位于另一个数据源的相关数据,我们可以单击“添加” ,通过添加连接来创建整合式数据源。
我们将在这里引入关于被退回订单的 csv. 文本文件(此文件同样可以下载)。
工作表已自动添加到画布,我们可以在这里看到自己的跨数据库联接。
为了让大家能够跟上,我们现在使用的是平面文件。但这可以是例如对来自 Hadoop 和 Redshift 数据的联接,而跨数据库联接是一项极为强大的功能。
联接和数据准备
Tableau Desktop 自动创建默认联接,就像我们在此处图标中看到的一样。单击该图标即可查看联接的详细信息,我们可以直接编辑这些信息。
我们将选择左联接,这样既可以获取“订单” 表格的所有信息,又可以仅引入被退回交易的相关“退回” 信息。订单 ID 已经被用作联接子句,但我们可以根据需要改变联接子句。
下方的网格让我们能够验证自己有什么样的数据——我们有很多来自“退回” 数据库的黄色 Null(这很好,我们不喜欢“退回” !),而我们的所有订单信息均显示为蓝色。
我们可以在这个网格视图中进行一些基本的元数据管理。只需单击图标,我们就可以将行 ID 从数字改为字符串。
此数据集中的“订单 ID” 字段包含多个部分,配送中心代码、年份以及两个其他代码。
如果我们想拆分此字段并且仅保留配送中心代码,这非常容易办到。只需单击字段名称旁边的下拉菜单并选择“自定义拆分” 。我们将在连字符处拆分,只保留第一列。
让我们将该字段重命名为“配送中心” 。
实时连接与提取
接下来,我们可以决定是实时连接到数据还是提取数据。
如果数据不断变化,或者希望利用高性能数据库,实时连接是很不错的选择。
我们也可以选择通过数据提取把数据导入 Tableau 的快速数据引擎。这样可以获得离线数据,并让我们能够将关键系统受到的性能影响降到最低,同时仍然可以定期进行计划刷新,保持数据时效性。
我们将实时连接并单击底部的工作表1标签。
维度与度量
我们连接到了数据集。现在,让我们来看看探索数据有多简单。我们只需要拖出字段,现在把
- “类别” 拖至行
- “细分市场” 拖至行
- “数量” 拖至列
- “市场” 拖至列
- 同时将“市场” 拖至“颜色”
我们可以非常轻松地根据销售的物品数量,为每个类别、客户细分和市场的销售情况创建可视化。可以很快看到,非洲是我们的新兴市场。您可以看到,我从左侧的这个数据窗格引入了这些字段。它分成不同的维度与度量,代表 Excel工作表中的列标题。
维度与度量是什么?
维度是类别字段,在本例中,就是日期、客户和类别等字段。这些字段是我们对数值数据进行切片和切块时的依据。维度常常是离散的。离散的字段在图表中形成标签,在数据窗格和视图中以蓝色进行颜色编码。
另一方面,度量则是我们的指标。这是我们希望分析的数字。度量常常是连续的。连续的字段在图表中形成轴,其胶囊以绿色进行颜色编码。
构建视图
现在,假设我们想看销售总数。我们将“销售额” 放入视图。我们可以看到 Tableau 查询数据库,并返回一个结果,告诉我们“销售额” 总和。
这家公司的销售额为 1,250 万出头。
如果我们希望看到随时间推移的销售情况,可以将“订单日期” 拖到视图顶部。Tableau Desktop 会以年度汇集日期。我们可以使用“加号 (+)” 将其展开。现在,我们可以在视图中同时看到季度和年度。
要查看几年来所有第 1 季度的情况,我们可以轻松透视数据,让“季度” 在“年份” 前面。现在,我们可以比较这几年各季度的增长情况。
把“年份” 移动到“颜色” ,就会以竖列的形式显示所有年份。
如果我们不继续下钻,而是想把季度改成月份,可以单击这个胶囊,访问下拉菜单并更改。
如果查看销售平均数要比销售总和更有用,我们只需使用胶囊上的下拉菜单,将“聚合” 改为“平均值” 即可。不过我们暂且撤消此操作。
快速表计算
如果我们想知道年同比增长之类的信息又会如何?
在 Tableau Desktop 中,像这样的计算非常容易。再一次单击胶囊的下拉菜单,然后转到**“快速表计算” **,我们可以看到作为一键选项的常见业务计算。我们选择“年度同比增长” 。
如果我们仍然想查看原始“销售额” ,只需要将其放回可视化中。
如果想让年度同比增长值显示在工具提示而不是图表中,可以将其移至工具提示功能区。当我们在视图中的标记上悬停时,工具提示可以提供更多信息。例如,我们看到 2015 年 11 月的数值比前一年同期提高了接近 50%。
我们把“类别” 拖到行功能区。我们现在可以看到哪些类别的表现不错,在什么时间段表现不错。我们甚至还可以写下评注。例如,我们看到,每年的销售额会在 7 月份下降,但会在秋季反弹。
要添加注释,可以右键单击,选择“注释” ,然后添加点注释。
这是非常有用的视图。
要轻松分享,可右键单击,复制此图像,然后与自己组织中的其他人员快速分享。但现在,我们要双击工作表标签,然后将此工作表重命名为“销售季节性” 。
交叉表与导出数据
如果我们想导出此时间表后的原始数字,该怎么做?Tableau Desktop 很容易就可以做到这一点。我们可以右键单击可视化图表并复制数据,
然后粘贴到 Excel 中。这甚至包括我们执行过的快速表计算。
我们还可以只右键单击选项卡,然后**“复制为交叉表” **。
我们可以轻松进行轴交换并将类别移至行功能区。看起来不错,但我担心办公用品促销活动期间以及年末的利润不是很好。我们把利润添加到交叉表,看看情况到底如何。把“利润” 添加到“颜色” ,可以更清晰地理解总体趋势。
但这些颜色有点淡,让我们来编辑一下显示方式。我们单击“颜色” ,然后单击“编辑颜色” 。下拉菜单中有多种颜色可供选择,我喜欢绿色-金色,我们将使用 6 种渐变颜色,然后单击“确定” 。
我们将标记类型更改为方形,然后启用标记标签。现在,我们得到了利润的突出显示表。
我们可以右键单击“类别” 胶囊,显示突出显示工具 。
如果选择“办公用品” ,我们可以看到,2015 秋季为深绿色,所以我们在那几个月利润相当可观。太好了!
悬停在突出显示工具中的那些类别上,我们可以很快看到,虽然技术和办公用品在秋季实现了很好的利润,家具却没有出现同样的以深绿色表示的利润上升。
这种情况是不是发生在我们市场的所有门店?我们来研究一下吧!我们将双击工作表标签,将此工作表重命名为“交叉表” ,并创建一个新工作表。
智能显示
我们知道家具的利润不佳,并且认为这可能存在地区差别。但我们不一定知道查看这些数据的最佳方法。Tableau Desktop 提供了名为“智能显示” 的简单工具。在我们知道希望查看的数据,但不知道如何创建有效视图的情况下,该工具可以提供帮助。 “智能显示” 包含常见图表类型列表,可以帮助您开始分析。
注意:我们可以在 Tableau 中构建种类繁多的图表——“智能显示” 是一键式选项,并没有全面列出可以构建的所有图表。
我们在按住“Control” 键的同时选择不同的维度和度量,看看“智能显示” 如何工作。我们想了解我们的“销售额” 以及不同国家/地区的销售情况。
请注意,该工具会根据我们选择的度量和维度突出显示不同的图表类型。符号地图好像是这些字段不错的选择。
我们再加上“州”。
我们可以通过单击“大小” 功能区,放大这些点。
我们另外调整一下透明度,加上边框。
我们将隐藏大小图例2,
然后按“利润” 给这些州着色。请注意,这里我们还可以执行地理搜索——如果我们要查看特定地点的利润情况,我们可以直接转过去。
我们取消固定,将其缩小为原尺寸。
自定义区域
现在,我们是一家全球化公司,而销售额在七月份出现那样的下跌。这是因为总部推行的某种做法,还是因为某种季节影响?按半球细分各时间的销售额,我们就可以知道答案,可是数据中没有该字段。但我们可以直接在地图中自行创建自定义区域。
右键单击并复制此工作表,以便让原始视图保持不变。我们可以简化视图,去掉“国家/地区”以外的所有东西。接下来,我们使用套索选择工具,
选择大致覆盖南半球的标记。注意,选择的是大致形状。单击工具提示中的回形针图标,为这些国家/地区创建一个群组.
我们已经在数据窗格中创建了新字段。
如果回到我们的销售季节性标签并将此新字段添加到列。看起来,我们在南半球的收入总体上要少一些。
但如果只保留该列,我们就没有明确的季节性证据。这是个好消息!
我们可以离开这一分析渠道,甚至可以删除工作表4,返回原工作表3,将其命名为“全球销售额和利润” 。
筛选器
之前,我们发现家具的利润比较差。为了进一步调查这个情况,我们把产品“类别” 拖放到筛选器功能区。然后我们选择“家具” 。
要让其成为交互式筛选器,我们右键单击胶囊,选择“显示筛选器” 。我们还可以修改筛选器,方法是选择其下拉菜单,从各种选项中进行选择。在这里,我们选择**“单值(列表)” **。
现在,任何人都可以轻松选择自己感兴趣的类别,比如“家具” 或“技术” 或“办公用品” 。
条形图
我们知道家具有问题,但是,具体是哪些家具类型情况不佳呢?让我们创建新工作表,然后使用“智能显示” 来一探究竟。
按住 Control 并选择我们感兴趣的变量,比如类别、 子类别和销售额,此时我们再次看到“智能显示” 给出了多种建议。
我们逐次单击几个图表,看看哪一个最好。
分层结构
我们数据中的类别和子类别间存在自然的分层关系。
在 Tableau Desktop 中,我们只需要在“数据” 窗格中,通过拖放操作叠放字段,就能创建分层结构。
我们把“子类别” 拖动到“类别” 上,然后命名为“产品” 。我们还可以将“产品名称” 添加到此分层结构。在 Tableau Desktop 中创建该分层结构只需要几秒钟,并提供完全下钻功能。
排序
要根据总销售额对这三个类别进行排序,可以单击工具栏上相应的排序按钮。我们现在可以看到,“技术” 的合计销售额最高。
如果扩展至子类别,我们就会看到那些条形尚未进行排序。我们再次排序,这一次使用轴上的“快速排序” 。注意,类别的次序仍然保持原样,我们只是在每个类别内部对条形进行排序。
我们可以通过单击工具栏中的“T” 按钮,以开启或关闭标记标签,从而查看实际销售价值。但是,又要说回来,利润怎样?我们将“利润” 放到“颜色” 上。我们很快看到,从利润率角度来看,“桌子” 情况差,尽管销售看起来不错。
这种情况是不是发生在所有市场?我们把“市场” 放到顶部。我们很快看到,在家具方面,几个市场看起来都存在同样的利润问题。
分组
我们可以把类似项目分到一组,这一点是很有帮助的。我们在“办公用品” 中可以看到,几个项目的销售额非常小。我们可以选择所有这些子类别的标题,并使用回形针图标对其进行分组。要重命名该行,右键单击并选择“编辑别名”, 重命名为“小型办公用品”。
我们再次移除“市场” 并交换轴。
我们还可以右键单击列标题并隐藏该标签。
我们将此工作表称为“按子类别的销售额” ,然后创建一个新工作表。
使用标记
我们已经看到,我们有一些利润方面的问题。我的直觉是,这可能是因为运费降低了我们的利润。
让我们来看看利润和运费数字。
我们将:
- “利润” 放到行功能区
- “装运成本” 放到列功能区
Tableau 为利润总和和运费总和生成标记。
如果我们将
- “类别” 放到“颜色” 上则第一个标记会按类别拆分,最后得到三个标记。
- 如果我们将客户 ID 添加到详细信息。
Tableau 为每个类别的每个客户生成标记。这些标记代表某一个类别内,每个客户所有交易的总运费和利润。
我们还可以完全解聚数据,在记录的级别上绘制出每一笔交易。
我们还可以把标记卡上的字段分配给不同角色。例如,我们可以单击“类别” 前面的“颜色” 图标,将其改为“标签”。也可以将字段直接放到标签功能区,例如“子类别” 。
我们可以在文本旁边单击两次,随后对标签进行适当修改。
从这里,我们可以看到各种类别中有大量的客户利润很低,因此,肯定值得调查一下。我很想知道那些低利润订单是否被退回。我们可以放大“退回” ,Null 表示另一个数据库中没有退回信息。看起来装运成本最高的标记被退回,但低利润订单没有退回。
趋势线
然而,是不是如我所想,装运成本和利润之间存在某种关系?我们可以去除标签和大小,以便不受干扰地进行分析。让我们添加趋势线。我们可以从分析窗格轻松添加,先选择趋势线,然后将其放到视图中。
在“家具” 类别中,随着装运成本上升,利润的上升幅度减小。但当我们在趋势线上悬停时,可以看到,其 R 平方值非常低,因此它没有特别的意义。我们将这些趋势线拖走。
然而,存在一些相当极端的低利润标记。我们可以很快找出造成利润问题的客户。选择这些标记,我们可以直接查看底层数据。
我们将“类别” 从颜色更改为形状,并将颜色设置为灰色。我们把这个工作表称为“客户细分” 。
仪表板
我们已经根据这个数据集创建了一些很有见解的视图。现在,我们希望将其分享给我们的团队,并编制仪表板。多个视图可以组合成单个仪表板。我们单击这个图标,创建仪表板。可以将其命名为“销售额仪表板” ,调整大小,使之适合笔记本计算机。
我们的所有工作表都在左侧。可以通过悬停进行预览。我们把地图拖进该视图,把“按子类别的销售额”和“客户细分”放在其下方。然后添加仪表板标题。在交互式筛选器上,注意我们单击不同类别的时候,地图会发生变化,反映出我们选择的内容。
但如果我们想改变工作簿中的所有可视化呢?我们可以使用下拉菜单,选择“应用到使用此数据源的所有项” 。现在,我们的所有工作表都将更新。
但是,如果我们想下钻至地图上的详细信息,该怎么办?例如,地图上的亚利桑那州有一个低利润标记,我们想了解这个标记是怎么来的。如果单击地图,我们可以单击边界中的筛选器图标,将整个地图转化为可视化筛选器。条形图和散点图更新为仅显示该标记的信息。
Story Points
如果我们想逐步引导观众,探索这些利润率问题,该怎么做?Tableau Desktop 提供一项名为Story Points 的功能,便于您把一系列的具体视图汇编起来,逐步引导观众查看分析。
我们可以通过从菜单单击“新建故事” 构建故事。我想让我的故事自动调整大小。与仪表板一样,我们可以引入此前制作的任何可视化。
我们调出“全球销售与利润” ,然后把这个点命名为“总体而言,我们的利润势头强劲” 。
可以轻松添加更多内容——我们调出仪表板,根据故事对其进行大小调整。我们将再次关闭标题。该可视化仍然具有完整的交互性——我们可以筛选,调出亚利桑那州的那个标记。我们这样操作时,“更新” 一词会显示在导航器的上方。
单击“更新” 可保存可视化的当前状态,让每个人不差分毫地看到当前的信息。
可以使用“但一些领域存在问题” 作为标题。这是 Story Points 的一个重要方面,即在保持交互性的同时能够对可视化内容的具体见解拍摄快照。
协作
我们已经在这个工作簿中从原始数据进展到了深入见解,现在,我们想考虑如何将其分发给其他人。
最有效的工作簿分享方式是将其发布到 Tableau Server 或 Tableau Online 中。已发布的工作簿具有完整的交互性,随时保持最新版本,而且安全,可以通过浏览器或移动应用进行访问。
要进行发布,打开“服务器” 菜单并选择“发布工作簿”——如果我们只想发布数据源本身供其他人使用,选择“发布数据源” 。我们可以发布至具体项目,命名工作簿,输入描述,标记内容,精确选择要发布的项目,控制权限。
完成发布后即可与内容轻松进行交互。所有内容都仍然具有完整的交互性,可以通过浏览器直接实现。我们可以订阅内容,以便按照设置的计划通过电子邮件发送更新,还可以收藏内容以及进行搜索和筛选。借助 iOS 和 Android 应用,您可以通过手机或平板电脑,从任何地点安全地访问仪表板和数据。