BI系统质量挑战与建设

​原创:陈思



BI系统质量挑战

BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与价值的过程。BI系统质量至关重要,可以说没有质量保障的BI数据还不如没有BI数据。而BI系统进行质量保障存在着巨大的挑战,主要有以下几点原因:

1.数据来源极其复杂,既有内部各个产品线的数据,又包含外部商业机构数据,主动采集数据等多种数据,数据源头质量保障挑战已经比较大;

2.数据经过多层计算,过程复杂,保证每一步都符合预期的成本较高;

3.数据口径要求严格,稍有偏差可能会导致实际业务意义偏差巨大。

建设目标

鉴于之前出现的BI系统质量问题,我们分析了BI质量保证仅有开发同学自己进行时存在的漏洞,在平衡核心质量和投入成本之后将以下三点作为核心建设目标,以进行系统化的建设:

1.形成质量闭环体系,高效高质量的可持续的迭代

2.实现P0级别报表全流程质量把控,达到报表输出0事故

3.形成数据质量平台,对数据全流程质量进行跟踪

接入前准备

为保证顺利接入进行了必要的准备工作,其中执行性的包括以下几点:

1.对数据来源、数据逻辑以及抽象出的各种业务指标的口径进行系统整理,并逐点与PM、RD同学进行同步确认,从而达到在知识层上理解是一直的目标。

2.核心技能SQL编写能力的系统提升,需要具备基于口径编写完备SQL的能力。

3.准备后续进行自动化建设所需的语言与测试框架——Python、Avocado等。

体系建设

在已经明确目标的情况下,根据需求的紧凑度,以及不妨碍正常发布的情况下,进行质量体系的逐步建设.整体测试架构如下,分为四层,分别是:

1.数据收集层

2.数据解析层

3.数据对比与Check

4.结果展示与警告


通过分层的方案建设实现了对BI系统深入测试,验证过程分为以下几个重要阶段:

1.发布前验证

在具备SQL编写以及编程数据清洗能力后,优先对报表口径学习,具备输出case形成对报表的测试能力.优先针对高优级别报表均具备质量覆盖,输出case评审后进行数据验证并维护SQL.数据验证正确后,报表才能进行发布。

2.数据diff

建立报表环比diff监控,准确找出报表发布时间点,历史数据的diff项, 完成监控报警建设。达到报表历史数据diff及时通知,并给出diff明细。

3.自动化验证

采用avocado测试框架,引入自动化case测试,保证发布数据的准确性,主要思路为:每个报表维护一组可用的验证SQL。通过sql的结果,与平台接口返回的数据做对比,验证报表数据的准确性。


在有了整体设计思路之后,就是实战的过程,基于采用的框架编写API层,Lib层以及case层面的输出,case调试并且运行成功后,就可以接入任务调度平台。

case调试成功:


接入调度平台运行:


执行通过邮件:



失败报警:


BI质量建设应用扩展

完成BI质量体系建设除了完成BI方向的目标外,作为具备线上各种维度和来源数据的BI系统可以支持多种质量建设,其中我们进行了一系列的在线质量全力数据的保障工作,具体过程如下:

1.将各个方向在线质量业务目标转化成数据指标

基于业务目标探讨数据需求,明确满足业务方向的数据输出方案和形式。例如“线上要保证注册成功的SLA>99%”,基于这个需要我们将BI数据中用户注册过程数据进行定时全量处理,将BI中过程数据抽取出来支持该指标的计算。

2.将业务指标转化为可以执行SQL

在能够满足需求的条件下,由各业务方向整理SQL语句且评审以保证数据输出满足要求。

3.在BI平台执行系统定时执行核心质量SQL以获得全量在线质量数据

基于python+Django,封装数据接口,将各方向关注数据进行采集采集后,使用Pandas将结果进行表格化,通过邮件的方式发送给对应负责人。


写在最后,感谢尊敬的大腿(张少华)与帅气的男神(徐浩)的指导,希望此文章可以给大家带来些许感悟。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,451评论 0 13
  • 电商卷皮BI的实践演进和架构体系—猫友会大讲坛第4期https://mp.weixin.qq.com/s/wbnx...
    葡萄喃喃呓语阅读 1,182评论 0 19
  • 世间万物千姿百态。“寂夜与静雨”也可算入其中。什么样的夜晚是最寂静的?住在街道旁的人会说,没有汽车笛鸣声的夜是最...
    资深玩家YOU阅读 4,169评论 88 216
  • 党的十八大以来,习近平总书记站在全面建成小康社会、实现中华民族伟大复兴中国梦的战略高度,把脱贫攻坚摆到治国理政突出...
    詹小倩阅读 134评论 0 1
  • 今年的国庆,带着孩提时的记忆,去游览桂林的山水。 记得小学语文有一篇课文,叫《桂林山水》,现在已经找不到儿时的课本...
    水翼阅读 1,047评论 1 7