接上篇 数据分析师之打杂入门--业务学习(网址:https://www.jianshu.com/writer#/notebooks/41435296/notes/57853936)
学习了基本的业务知识(如何深入学习业务,后续还会再讲),后面就是数据技能学习了,首先需要了解公司里的数据工具,如数据门户、数据图谱、数据开发工作台(数据查询、数据开发、报表配置等)、数据Wiki等。利用好现有的数据工具才能高效产出,更好的创造商业价值,避免数据成为业务发展的瓶颈。
二、打杂技能--数据学习
1、数据门户(也叫数据产品)
对于常规公司级的经营数据、部门级的粗颗粒度运营数据,一般都有现成的门户报表。刚入行的分析师需要权限,清楚相关指标的统计口径,理解数据之间的逻辑关系。如果有业务方有这方面的数据需求,可以直接下载数据发给业务方或者让他们自行开通权限即可。同时需要有意识的去观察这些数据,把公司、运营部门的运营动作和数据变化关联起来,提升看数能力,增强业务体感。
2、数据工作平台
这里要为我们公司的数据工作平台点赞,他们开发了了数据抽取、临时数据查询、数据开发、报表配置等工具,在一个平台内无缝链接,大大提升了分析师的产出效率(而以前接触的公司,基本上每个模块都有一个工具,很多分析师被局限在临时查询这个环境中,考虑到外部很多公司在使用我们的开发工具,后面会专门写一篇来介绍这些工具的使用)
2.1 数据临时查询
临时查询:就是根据分析、运营的需求,利用SQL获取各种统计口径的数据。
加分项:熟悉常用的业务表、常用数据统计口径,有清晰的思考逻辑(后续专门弄一个章节,讲怎么写SQL)。
2.2 数据开发
数据开发:和临时查询类似,只是把取数的任务固化下来,固定周期让系统完成取数的任务。主要包含下面几个环节:创建固定表、写sql、调度配置、任务发布、日常运维等。
加分项:sql性能优化,数据倾斜,有业务前瞻性
2.3 报表配置工具
把各种纬度的统计数据以报表、图形的形式发布到门户网站、定推邮件,方便分析师、运营人员、管理层知晓监控、知晓数据的变化。
加分项:用分析视角去做报表,有审美眼光
写SQL、调度配置、任务发布,这些内容偏IT,对于非计算机出身的分析师来说是一个比较大的障碍,但如果想从事数据分析这个岗位,一定要克服这方面的困难,实在脑子笨的就找找数据开发的小哥哥,态度好一点,请人家吃个饭,一般还是乐意教人的。(考虑到外面很多公司在使用我们的数据开发平台,后续专门弄一个章节,讲怎么开发、调度配置、任务发布、日常运维等)。
3:数据图谱
即元数据管理系统,是数仓库的支持系统,受众主要是数据人员、业务人员、分析师。一般常规的指标逻辑、代码都在数据图谱里面,分析师尽可能的使用图谱里面规范的统计口径,不要随意创造数据概念。
实际上这个属于数据治理范畴,这个问题进入大数据时代后越来越严重了,数据爆炸,各个业务部门统计口径繁多,自行其道,当跨部门沟通的时候,本来是希望用数据这门公共的语言来加强互相之间的协同,业务推进,结果数据却先开始打架,阿里、腾讯、京东、知乎等这些数据意识强的公司其实早几年就开始治理这方面的问题了(数据治理其实对分析师非常重要,一旦牵涉到多部门协作的大项目,没有很好的数据环境,很多项目就没法很好的落地,后续有机会专门讲一下)。
4、数据Wiki
数据Wiki就是前人做的一些分析项目文档化,分析师一定要注重分析成果的积累,重视文档工作。有了文档沉淀之后,大家也能互相交流提高,而不是闭门造成,重复造轮子(其实这一块挺重要的,需要人人都来付出,这样大家才能有好的收益,不过看下来难度还是挺大的,很多分析师喜欢藏私)。
待续..