Kylin+Tableau制作 互联网理财用户持仓监控仪表板的案例(1)

//
应用Apache Kylin+Tableau制作 互联网理财用户持仓监控仪表板的案例(1)
http://mp.weixin.qq.com/s?__biz=MzI2MDU5ODY2Mg==&mid=2247483898&idx=1&sn=7c84d2351f9641e9014e700a8f8cf523&chksm=ea667f13dd11f605c93341f51271588b06f063a84266386eae7b859b19841e838cede0516d2c&mpshare=1&scene=1&srcid=0224HqDXoz8WGX2R48sq21kp#rd

导读

越来越多的互联网企业采用Apache Kylin作为超大规模数据查询的解决方案,很多公司分享了基于Kylin的数据平台架构案例。其实作为最重要的应用者——数据分析师,他们的工作侧重于衔接技术与业务,因此更多的关注如何理解业务需求,使用Kylin建立数据模型,构建并优化Cube,最终在BI工具上实现数据可视化或进行数据探索。基于此,本文从互联网金融平台一位数据分析师的角度,在已搭建好的Kylin+Tableau Server平台上实现“理财用户持仓情况”的可视化,并针对“理财平台的综合收益率”进行了有益的数据探索。
由于本人理论水平和技术水平有限,文中错漏之处在所难免,敬请同行批评指正。
建议横屏观看图片,效果更佳。
欢迎转载,转载请注明出处。

目录

  1. Kylin和Tableau简介
  2. 虚拟互联网理财平台产品结构
  3. 需求是什么?
  4. 实现流程
    数据清洗

构造适用于Kylin的星型模型

创建Project及Model

设计并构建CUBE

制作Tableau仪表板

数据探索

正文

1. ****Kylin****和Tableau简介
Apache Kylin有大数据分析界“神兽”之称,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力,能够在亚秒内查询巨大的Hive表,在同样的数据集上提供比Hive更好的性能。Kylin能够与BI工具的无缝整合,如Tableau。Kylin资料很多,在此不赘述。
Tableau作为一款领先的可视化分析软件在中国的普及率越来越高,其市场地位从全球最大的IT行业分析和咨询服务企业Gartner 2017年2月发布的报告可见一斑。
《Magic Quadrant for BusinessIntelligence and Analytics Platforms》


本文采用Kylin 1.5.4版本和Tableau 10.1版,一个是大数据多维分析引擎领导者,一个是数据可视化软件领导者,二者结合,希望能产生如虎添翼的效果。

2. ****虚拟互联网理财平台产品结构


以上工具介绍完之后,下面我们来虚拟一个综合型互联网理财平台的产品结构

该平台有四大类理财产品:活期,固收,基金,其他

共有13种理财产品:活期A\B,固收A-G,基金A\B,其他A\B

各大类产品数比例:

  活期:固收:基金:其他=2:7:2:2

活期作为引流产品不易过多,防止活期产品之间用户低效流动;互联网理财用户大多为风险厌恶型,追求稳定收益及本金安全,所以平台上的不同收益率及期限的固收类产品较为丰富,满足大多数用户的资产保值及流动性需求;少量的基金和其他创新型产品用来满足占比较小的风险偏好者对高收益的追求。综上,此虚拟平台基本符合现实市场情况。

3. ****需求是什么?


业务方需求:“我们想看一下持仓。每天有多少人清仓,还有持仓的产品比例。”

数据分析师的工作其实跟翻译差不多,需要将业务方模糊的、方向性的、语言表达的需求转化成明确的、量化的、用数据结构表达的可落地方案。“给人一瓢水,首先你要有一桶水”,在满足基本需求的前提下,分析师加入自己的对业务的理解,从而扩展出更多的分析思路才是一名合格的老司机。那么上面简单的一句需求结合平台产品结构,分析师应该形成以下思路:


其他指标,如用户持有的产品小类/大类数,持有的产品SKU数,可以衡量用户对平台的渗透情况,对不同形态产品的跨业务线申购体现了用户对平台的信任。
考虑交付时间和实现的复杂程度,可先实现导图中的指标,更多分析指标可在以后迭代实现,“先完成,再完美”,切忌一蹴而就,完美主义害死人。

4. ****实现流程


数据清洗


我们首先在数据仓库中找到这样一张持仓表(虚拟表结构):


该表设计是为了满足各种持仓需求,但对于目前需求来说,有一些字段是冗余的,我们希望把数据处理的干干净净并且简化后再放入Kylin,不要把数据清洗工作由Kylin和Tableau来做。所以有必要作以下调整:

产品小类的产品编号防重:

cancat_ws('_','fin',biz_type,prod_code) asFIN_PROD_CODE
用户编号user_pin非空

产品小类biz_type剔除“对公产品”,只要to C产品

持仓类型hold_type选择“持有中”

清洗后的表结构

构造适用于Kylin的星型模型

目前Kylin只支持星型模型,因此有必要对星型模型和雪花模型进行简单的介绍。

星型模型:当所有维表都直接连接到事实表上时,整个图解就像星星一样,故将该模型称为星型模型,如下图。星型结构每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家 A 省 B 的城市 C 以及国家 A 省 B 的城市 D 两条记录,那么国家 A 和省 B 的信息分别存储了两次,即存在冗余。

雪花模型:当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的层次区域,这些被分解的表都连接到主维度表而不是事实表。如下图,将地域维表又分解为国家,省份,城市等维表。它的优点是 : 通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花型结构去除了数据冗余。

我们现在要解决的需求,主要有两个维度:日期和产品类型,对于持仓来说,本身每天的持仓金额就是个该时点累计值的概念,统计“第n周每天持仓金额总和”的业务意义不大,因此没有必要制作日期维表,使用事实表中的日期即可。
产品类型由于需要从产品小类上卷到产品大类,故有必要制作产品类型维表。
那么我们制作的适用于Kylin的星型模型如下

产品类型的维表不要写死,建议依赖产品信息表汇总产生,防止新出现的产品线不会自动更新到产品类型的维表,造成持仓记录没有对应的产品大类。

下一篇连载之二将先介绍Tableau如何基于Kylin构造持仓监控仪表板,并通过简单拖拽计算理财平台的综合收益率,敬请关注。

由于本人理论水平和技术水平有限,文中错漏之处在所难免,敬请同行批评指正。对文中涉及方法有兴趣讨论的同行可加笔者微信:qq188070983。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容