公司的数仓建设到一定阶段之后,对于业务类型比较复杂(比如存在不同业务形态的事业部)的公司,业务部门之间会彼此争抢技术资源,对数据的时效性、准确性也有越来越高的要求。为了更快的满足业务部门的数据分析需求,搭建自助分析平台是大势所趋。
搭建自助分析平台需要分两个阶段:
1、实现不同事业部的数据隔离:这是由公司内部数据隔离要求决定的,为此我们给各个事业部都建立了部门数仓;
2、可视化分析工具的选型:由于可视化分析工具市面上已经有不少成熟的产品,相比于自研一个新产品,成熟产品的用户教育成本更低、实施更快、稳定性也比较好,因此有不少公司都不会重复造轮子。
本文就是在这种背景下,开始来谈谈如何进行产品选型(以可视化分析工具为例)。
所谓产品选型,一般是指根据实际业务管理的需要,对硬件、软件及所要用到的技术进行规格选择。本文中的产品选型特指公司因为技术实力、资质、市场环境等,对市场上的商业软件产品进行功能、性能、价格、运维等方面进行综合考量,并输出相应的选型报告进行对选型结果进行总结汇报。
产品选型的目标:输出调研过程分析、给出分析结果供管理层进行选型决策。
产品选型一般是按照以下四个步骤展开(以我们公司自助分析平台为例):
1、确定目标,确定选型的功能、性能、要达到的业务要求等
功能要求--可视化分析效率高、权限完善(支持行级数据权限);
性能要求--满足5000人的访问、并发量能够达到500、查询时效在20s以内;
业务要求--业务教育成本低、操作简单、支持多种数据源(含手工数据);
2、选择竞品--产品资质、业务接受度(一般选择3-5个)
产品资质--可视化工具没有这方面的要求,但之前做过发票、税务系统需要有国家税务局的资质才能对接税局接口,所对接的税局接口数量也是公司资质的体现;
业务接受度--业务人员对于产品的熟悉程度越高越好,因此选型的产品池中要有常用的powerBI、tableau等产品;
3、选型分析--需求匹配度、矩阵分析
需求匹配度--分析每个产品与1中所定的目标之间的匹配程度;
矩阵分析--从各个维度对选型列表中的产品进行对比,找出各自的优劣势;
4、提供选型建议--选型分析结论、实施建议
选型分析结论--一般选择1-2个作为最优、次优选择,并输出选择的原因;
实施建议--对于选型的结果给出实施建议,比如是否需要售前咨询、是否需要定制开发、项目计划如何安排等;
经过以上分析之后,一般会输出选型报告,参考格式如下(也有PPT格式):
在可视化分析工具的选型中,我们主要考虑了以下因素:
其中,技术上最关键的考虑因素是数据权限的支撑、查询效率的高低,数据权限的问题tableau本身支持是不太完善的,但是由于业内使用的人很多,因此能找到比较多的替代方案(关于tableau的数据权限后续会单独分享);查询效率方面tableau的优势在于server服务器就是一个小型数据库,通过提取之后就可以提高查询效率,并且数据分析师自己就可以完成以上的操作。
业务上更加关心的是学习成本是不是很高,没有接触过的产品就会本能的抵触。这种抵触情绪其实也可以理解,毕竟新的东西需要花时间学习,推广起来就比较慢。因此,技术这边一开始选择的FinBI方案(公司之前用过Finreport)就一直没有被业务重视。
最后,在报价这一块,一次性付高额费用的产品一般在公司内部都比较难以审批,按月付费的产品相对容易一些;而后期运维也是一个大问题,powerBI没有作为最终选择的主要原因也是因为这个是纯产品一口价买卖,后期运维全靠自己解决。
基于以上的考虑,最终和业务讨论的结果是选择tableau作为可视化分析工具。
注意:这里需要再啰嗦一句,在选型的过程中业务是否能参与进来,很大程度上决定了选型的成败。由于业务的认可,因此在后期推广自助分析平台的时候比想象中要顺利的多。而反观之前在别的公司做的税务系统的选型,虽然也做了大量的前期选型工作,但最终项目做的非常艰难,失败原因主要有几点:
1、前期业务参与度不高,基于技术部的选型结果进行评估,因此后期出现了很多业务需求无法满足的问题,一直在返工;
2、对于产品价格过于敏感,在竞标的时候首先就将价格高的产品拒之门外(如航天金税),后来可选的产品范围就非常小了;
3、是否有同行业实施经验非常重要。有些小公司虽然资质不完善、要价也不低,但是已经在同行规模更大的公司中成功实施了,但由于价格问题最终还是没有选择。而报价更低的这个公司则是抱着树立这个行业“标杆项目”的目的,其实这个试错的成本溢价早就超过了项目的实际支出。