MetaBase是一款数据可视化平台
在没有数据可视化平台的时候,我们往往需要从需求到审批,再到安排开发人员和排期,最终交付。流程繁琐,参与的人员也多,往往需要几天甚至几周的时间!
使用 Metabase 可以大大节省成本,简单易上手,Metabase 把数据分析常用的查询通过一个个易于操作的界面呈现,非常适合不懂SQL的业务人员使用,只需要点几下鼠标,就可以快速得出一个直观的可视化结果。
所以MetaBase上运营人员是可以直接查看数据表,筛选数据并组合成自己想要的报表。但往往他们会提出需求并希望直接获得数据结果。所以文章重点会放在技术人员直接提供数据结果到Metabase的讨论上。
Metabase数据源支持很多,本篇文章基于MySql数据库
让我们先从创建一个简单数据查询开始,点击右上角创建SQL查询
SQL查询的页面分为三个区域
1.SQL编辑区域:主要用来技术人员编写数据库查询代码
2.SQL变量区域:如果在代码中使用SQL变量,则自动弹出这个区域,方便对参数命名(SQL变量如何使用文档:https://www.metabase.com/docs/v0.43/users-guide/13-sql-parameters.html)。
- 数据展示区域:在SQL编辑完成后,点击区域内右下角查询按钮,即可查询数据并进行展示。数据默认格式为表格形式。表头名称默认为SQL语句中的字段名称(所以在SQL中可以重命名字段)
对于数据想进行图形化展示,可以点击上图左下角的视觉化按钮
选择适用业务的图形,我选择扇形图,那么就要对于扇形图的维度,衡量标准选择对应的字段。效果图:
点击已完成,并进行保存后,就可提供给运营使用。
对于单个简单业务我们就可以通过以上方式提供数据,Metabase还提供“仪表盘”看板来进行数据合集展示。用一个页面看板,把各种单个SQL查询数据归类一起进行数据展示。
仪表盘的使用可以参考官方文档:https://www.metabase.com/docs/latest/dashboards/start
需要提到的一点:我们可以在仪表盘添加过滤器,然后指定某个模块选择对应查询参数。这样保存后,我们填写手机号后,就可查询针对单个用户的数据面板
利用仪表盘我们还可以创建:交易数据看板,订单数据看板,财务报表等等,把各种单个数据汇总到一个仪表盘,方便数据阅读。(一定要注意不能出现慢SQL,不然有可能会导致数据库负载过高)
在使用Metabase中,常常我们会需要以月为维度的图形化数据。但在编写SQL上我们总会遇到某个时间点没有数据的情况,对于月纬度数据,为了防止当月某日有缺失数据,有个小技巧,我们可以创建一张表记录日期,然后在SQL查询中以日期表为主表,关联查询业务表。
例如要查询双月环比交易金额线图:
线图所对应的基础数据是这样:
要到达上图效果,参考代码:
select func.monthDay '日期', ifnull(currentMonth.amount, null) '本月交易金额', ifnull(beforeMonth.amount, null) '上月交易金额'
from (
select type, value monthDay
from date_statistics_function
where type = 'day'
# 默认为当前月份最大天数
and value <= day(last_day(current_date()))
order by value) func
left join (
select date_format(date_day, '%d') date, sum(amount) amount from transaction_user_day_info ca
where ca.date_day >= date_add(curdate(), interval - day(curdate()) + 1 day)
group by date
) currentMonth
on currentMonth.date = func.monthDay
left join (
select date_format(date_day, '%d') date, sum(amount) amount from transaction_user_day_info ca
where ca.date_day >= date_add(curdate() - day(curdate()) + 1, interval -1 month)
and ca.date_day < date_add(curdate(), interval - day(curdate()) + 1 day)
group by date
) beforeMonth
on beforeMonth.date = func.monthDay
order by `日期`;
date_statistics_function表会存储0~23小时,1~31日,hour表示小时,day表示日,用来支撑上面的SQL查询。好处就在于如果某小时或某日在业务数据表中没有数据,那么可以对当日/小时数据补0,不会缺失数据。
对于近几个月,近几日数据查询也有参考代码
-- 最近一年日期
select date_format(date_add(date_sub(curdate(), interval 1 year), interval dt.seqNo month), '%Y-%m') '最近一年'
from (
select row_number() over () seqNo
from date_statistics_function
limit 12) dt;
-- 最近30日-日期
select date_add(date_sub(curdate(), interval 30 day), interval dt.seqNo day) '最近30日'
from (
select row_number() over () seqNo
from date_statistics_function
limit 30) dt;
有了Metabase我们可以快速实现运营数据需求,并在短时间内完成交付。
类似Metabase BI平台还有很多,例如Superset、DataEase、MetaBase以及阿里云QuickBI。
无论使用哪种平台,数据的安全性是我们首要考虑的问题。