先简单梳理梳理
1,数据
公司的数据库都在hive sql里面,虽说已经固化了不少需求,做了不少产品,但是没次要看数据的时候总是找不到自己想要的。
第一步就是要学会随心所欲的获取数据。SQL基本语法学会之后,就要多写代码。
针对公司的具体情况,按照先后学习顺序,需要掌握以下内容:
数据图谱:公司几乎所有的数据表都存在这里,认识这些表,弄清楚主要的表里面装了些什么,才能搞明白公司都有哪些数据以及数据都放在哪里。
数据权限:申请数据权限需要3-7天不等,公司一般都会严格审核,保障数据安全,防止数据泄漏,按照流程走就好。
SQL语法:一般最后有人简单带领入门比较好,如果没有,上w3school学学就好。
指标图谱:前辈们总结的一些常用指标查询方法,可以帮你少走很多弯路。
2,分析
一般在SQL里面能很方便算好的,就导出一大堆数据在EXCEL上计算了,每天每个人的能下载的数据量有限(也是出于安全考虑),超标了就不没法干活了。
如果是数据量较大,可以申请开通Rserver,在线处理,比本地r跑的更快
数据导出来之后,都是excel格式的,90%的问题用excel基本上就够了。
剩下的一些疑难杂症,可以用r或者python,喜欢哪个就用那个。
分析:这个才是重点嘛
有三点:业务是源头,数据是手段,发现问题解决问题是产出,是结果。
3,师
有了一套体系,看问题的角度与常人不同
还不知道是啥,可能是乔布斯,张小龙吧
师,应该是看问题看得很深的人
比如,第三种境界
看山是山,看水是水
看山不是山,看水不是水
看山还是山,看水还是水