优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相

为什么要学习计算字段?在 Tableau 中,当数据未提供回答问题所需的信息时,创建计算字段非常有助你实现自助式分析。

主要用途有以下几种:将数据分段;转换字段的数据类型,例如将字符串转换为日期;聚合数据 ;筛选结果;计算比率;集成如 R 之类的外部服务等......

下面,我们将从宏观整体角度,介绍每种计算类型及运用场景案例,帮助你循序渐进地了解计算,更好挖掘数据。一睹为快吧

计算类型及实例介绍

计算通常分为3种类型,分别是基本计算字段、表计算以及详细级别表达式(LOD)。

『类型一:基本计算字段』

首先,聚合函数我们比较常用的就是SUM、AVG或者是MIN、MAX。还有包括统计学中的中位数,求相关性等,这些也属于聚合函数。

数字函数,我们常用的是ZN函数,ZN函数会将在连续日期时突然缺失的那几天转换为0,日期少几天,ZN函数就会补多少个0。

用户函数,比较偏向于 IT 场景,它会获取我们进入登陆 Server 的一个人的名字,这时可以用 USENAME 来做一个权限设置。

字符串函数内有一个是包含的函数,有时我们设置权限表,会有一个USE,一个权限,这时如果权限重复,数据会翻倍。所以此时换一种方式,比如说我们按照地区来设权限,把字符串内的函数包括和 Usename 结合在一起使用,此时数据不会翻倍。这个小知识,IT人员可以考虑这样设置权限。

▌案例:零售行业的指标是如何计算?

利润=营业额-单件成本*数量

利润率=总利润/总营业额

折扣=1-营业额/销售吊牌金额

客户数=客户名称计数不同

交易次数=订单ID计数不同

客单价=总营业额/客户数

连带率=总数量/交易次数

坪效、人效、完成率、存销比……


『类型二:表计算』

表计算是嵌入在 Tableau 中的快速计算方法。快速表计算,总共有8类,我们可以做差异,可以做移动平均,可以做百分比差异、百分比、总额百分比、百分位,排名、汇总之类的一个计算,它相当于基于一个计算结果(聚合结果)做了一个二次计算。

瀑布图:用到汇总计算,通过汇总算出每一个点,它相当于是一个高点,做一个汇总  
排序凹凸图:无法查看具体数值,但可以了解每辆车排名的升降情况  

除了刚刚那几个函数之外,我们还可以去集成 R、MATLAB 和 Python 。我们以 R 为例,它其实是做一个表计算,把表计算的结果以及一个代码发送到 Server,然后 R 代码就会进到 R,产生一个 R 值,最后返回到表计算里面。

▌案例:表计算的集成

❶ SCRIPT 函数-集成外部服务-以 R 为例

将表达式传递到外部服务以与 R、MATLAB 和 Python 集成的函数。

❷ 集成外部服务-以 R 为例

1.下载 R

2.下载,安装和调用 R serve

 a. install.packages("Rserve")

 b. library(Rserve)

 c. Rserve()

3.在 Tableau Desktop 中连接 R:

帮助 -> 设置与性能 ->管理外部服务器连接

4.输入服务器名称, 端口号为 6311

5.测试连接!


『类型三:详细级别表达式(LOD)』

详细级别表达式是三个函数,fixed、Exclude、Include,它相当于在改变你的视图级别,有的时候你双击,你的视图就根据你双击的那些字段来划分它的详细级别,但是有的时候你的计算级别不一样,这时候就会用到详细表达 LOD。

Fixed:指定确切的详细级别,独立于可视化内容所用维度实现

Exclude:以较高详细级别进行计算,删除某一维度执行计算

Include:以较低详细级别进行计算,创建粒度较高的表达式

▌案例:客户分析 LOD

比如,找出每个客户订购的订单数是比较简单的,但是如果我们想了解订购过一个订单、两个订单、三个订单(依次类推)的客户数目,该怎么办呢? 如果要生成相应视图,我们必须按订购的订单数划分客户数。

再比如,在我们的订单数据里面,一个客户可能存在多次购买,那么新客户增长情况如何?越早购买的客户对后来销售额的贡献会越大吗?各个地区客户争取情况每日趋势如何?

另外,争取新客户的成本可能非常高,因此会希望能够确保现有客户有重复购买。在间隔一个、两个、三个、N 个季度重复购买的客户数目是多少? 从未重复购买的客户数目是多少? 如果按季度阵列划分重复购买行为,会有什么发现么?

客户订单频率
新客户增长情况
同期群分析
各地区客户争取率
回头客分析

我们在使用 LOD 的时候,还会跟参数进行结合。比如,下图展示的是每个地区的销售情况,同时有一个参照地区,每一个地区都会跟参照地区做比较,然后可以进行一个切换。我们在计算里面有时候可以融入参数。


如何正确进行计算

或许你还不知道该根据哪些应用场景选择计算类型,我们在这里分享一种思维方法,方便各位更好做出决策。

首先我们看计算是否会需要排名迭代或者移动,跨行计算这种,如果要存在这种计算的时候,你就要用表计算,因为这些计算相当于存在一个跨行,你要跨行只有表计算能去实现跨行的结果。

如果你不是做这类计算,我们可以做其它的判断。你的视图里面是否有所需的所有数据,如果是,则可进入下一问题。视图布局是否允许使用快速表计算,因为有的时候视图布局是不允许用快速表计算的,如果是允许可以使用快速表计算,相当于做一个二次计算。

如果是不允许,以及包括视图没有所需数据的时候,就可以统一去看另外一个问题,我们的数据粒度是否一致,如果我们的数据粒度是一致,可以直接使用基本计算,如果数据力度是不一致,就需要用到详细级别表达式。



文章部分信息来源于网络,如有侵权请告知

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容

  • 举例,通过LOD找到每个州产品类别中具有最大品类的是什么 如下可以看到,加利福尼亚的Paper是最多的品类。 如下...
    ccvscc阅读 5,270评论 0 3
  • 第三章 数据库系统 3.1 数据库管理系统的类型 通常有多个分类标准。如按数据模型分类、按用户数分类、按数据库分布...
    步积阅读 2,699评论 0 7
  • Reference:tableau教程 w3c school 数据源 1. Tableau运算符 运算符是一个符号...
    mcdullsnow阅读 28,862评论 1 14
  • 今天我去沧州,去接我姐姐去。我们我们下午来的,爸爸先去给姐姐开家长会的了。我和妈妈在车上休息一会儿,姐姐在食堂里等...
    付梦缘阅读 125评论 0 0
  • 在手机电池爆炸门之后,三星又遇到了棘手事儿。这次出事的是号称史上最贵智能手机之一的柔性折叠屏手机Galaxy Fo...
    科技热门搜索阅读 282评论 0 0