“为什么要做数据分析师”
---"我本来是要做开发的"
L说,我本来应聘的是开发岗,但是没有合适的岗位,加上他们看我Python不错,就让我先试试做数据分析。
“那你怎么没有继续发挥Python 特长呢,比如说,用Python做一些数据挖掘?”
很多东西没做是因为没有条件,没有环境啊。L跟我讲述了当前工作环境的局限性,解释了一大堆专业词汇,从什么是集群,需要什么样的语言环境,什么是关系型数据库,什么是大框表,到什么Hadoop解决方案什么MapReduce算法。“总之一句话,行业不规范”。不过,根因在于公司对用户数据的关注度不够,相比腾讯阿里或者其他看重数据的电商公司,我们用数据来改进用户体验,看起来价值是不大的。
“数字到底有什么用呢”
单从数字的角度来说的话,数字可以抽象化,抽象实物。就像之前给你说的那个分金条的故事,一根金条如何切两刀分成七块,如果真的是切金条,就很难;如果把它抽象成数字,问题就好解决了。
“那你觉得数据分析前景如何呢?”
我们部门领导说过一句话,我觉得挺对的,她说,“我们做数据分析其实跟算命没什么两样”,其实也就是异常原因分析和出现问题时的问题定位来进行可靠性预测、辅助决策。
现阶段的话,我们通过添加维度,再分解来做分析。比如,你需要先拉长时间维度,找出异常值,再找到出问题的维度,或者看转化率,把数据进行对比分析,最后得出结论。
“但是,你知道的,其实大数据对数据准确率要求很低,因为来源很乱…”
然后,就没有然后了…
后来,看到一篇讲阿里数据体系的文章,觉得不错,分享大家~
《漫谈阿里大数据》https://www.jianshu.com/p/84ce4bd3e956
阿里提出“存、通、用“概念。
四个关键点:1)数据化;2)算法;3)数据产品;4)反馈闭环。
数据化,是存和通的过程。首先将大数据采集与存储,然后是数据标准化,最后把数据孤岛打通,做到数据互联互通。用,即大数据的加工、分析、最终创造商业价值。这个过程中,算法是核心。数据、算法都有了,再把用户加进来,就构成了数据产品。最后,需要一个反馈闭环才算完整的数据生态。
“存、通、用”
---“一开始只是机缘巧合做了数据分析,后来觉得做得还不错,未来还是打算往这方面发展”
F原本学的是信息对抗技术,第一份工作是产品运营,后来也做过其他方向的工作,成为数据分析湿也是机缘巧合。数据分析的工作说不出来哪里有趣,大概是成就感吧,不过,几年工作下来,觉得做得还不错,未来也打算继续往大数据的方向发展。
“三年工作经验下来,有什么感触吗”
数据可以驱动决策,但是,在我们公司,数据主要是支撑,是花架子,可能金融行业会好一些。“我们是为了写胶片而取数据,其他公司写胶片是为了呈现数据”。
“那你觉得数据这行可以做多久”
一般会慢慢做到管理岗吧。那时候,你需要的更多是数据思维,要有大局观,要结合业务,要有眼界,知道哪些角度的数据才是真正有价值意义的。而现在,高层领导、中层领导、底层执行人,信息眼界不同,高层领导语义不能准确传达底层,过程中信息损耗,结果就会不尽如人意。
推荐阅读:
《决战大数据》https://www.jianshu.com/p/1e86a19c9555
“目前,在大数据方面,无法深入应用的原因在于,从收集到使用的大数据价值链出现了问题。用数据的人不知道大数据从哪里来,做数据的人不知道大数据如何使用。用的人不敢用,因为大数据的真实性;做的人不知道怎么用,因为大数据的复杂性。
断层是大数据所面临的最严重的问题。“
在思考数据的价值时,首先你能否清楚地识别(Identify)用户的身份?其次你能否搞清楚收集的数据对你的价值(Value)是什么?最后收集数据时的场景(Situation)是什么?
数据收集的价值包含两个维度。一方面,你是否能衡量这个数据对企业产生的价值——你不会将用户的所有行为都记录下来,而是记录那些对企业自身有帮助的数据,即企业价值;另一方面,你是否能衡量这个数据对顾客的价值——这个数据如何帮助企业为客户提供更好的服务,即客户价值。