需求层、数据层、分析层、输出层
(1)需求层
在整个数据分析中最重要。需求是整个数据分析的开始,分析的目标方向。分析需求的常规来源场景:1.监控到现有的指标出现了一场情况需要通过数据分析去找原因;2。公司要对现有的运营模式或者某个产品进行评估确定是否需要进行调整或者优化;3.公司下达了战目标或短期目标需要分析看如何达成。要确定清晰的需求,数据分析是需要具备的条件:1.对业务、产品、需求背景有比较深的了解。了解的足够对,才能去引导判断需求;2.还需要从获得的需求快速的结合自身所掌握的技能组工具有初步的分析思路;3.综合判断后再决定是否需要分析,应该怎么分析,与需求方沟通确定清楚两方理解是否一致。如果无法做到就会出现很多无法避免的问题。
(2)数据层
确定目标需求之后,开始准备相关数据。数据获取、数据清洗、数据整理。大数据挖掘商业价值的方法主要分为四种:1.客户群体细分,然后为每个群体量定制特别的服务;2.模拟显示环境,发掘新的需求同时提高投资的回报率;3.加强部门联系,提高整条管理链条和产业链条的效率;4.降低服务成本,发现隐藏线索进行产品和服务的创新。数据库mysql
(3)分析层
平民版分析工具excel、非专业的专业分析工具spss、专业资深的分析工具有sas/R/Python。
利用python进行护具分析。一般步骤为:描述分析—锁定方向—建模分析—模型测试—迭代优化—模型加载—洞察结论。
描述分析是最基本的分析统计方法,在实际工作中应用最广泛。描述统计分为两大部分:数据描述和指标统计。
数据描述:对数据进行基本情况的刻画,包括:数据总数、时间跨度、时间粒度、空间范围、空间粒度、数据来源等。若是建模,还要看数据的极值、分布、离散度等内容。
指标统计:用来做报告,分析实际情况的数据指标,可粗略分为四大类:变化、分析、对比、预测。变化:指标随时间的变动,表现为增幅(同比、环比等);分布:指标在不同层次上的表现,包括地域分布(省、市、区县、店/网点)、用户群分布(年龄、性别、职业等)、产品分布(如动感地带和全球通)等;对比:包括内部对比和外部对比,内部对比包括团队对比(团队A与B的单产对比、销量对比等)、产品线对比(动感地带和全球通的ARPU、用户数、收入对比);外部对比主要是与市场环境和竞争者对比;这一部分和分布有重叠的地方,但分布更多用于找出好或坏的地方,而对比更偏重于找到好或坏的原因;预测:根据现有情况,估计下个分析时段的指标值。