第一章:Python和数据化运营
一、数据化运营是什么?
数据化运营是通过数据化的工具,技术和方法,对运营过程中的各个环节进行科学分析、引导和应用,从而达到优化运营效果和效率,降低成本,提高效益的目的;
- 数据化运营的重要意义:
数据化运营的核心是运营,所有的数据工作都是围绕运营工作链条展开的,逐步强化数据对于运营工作的驱动作用,数据化运营的价值体现在对运营的辅助、提升和优化上,甚至某些运营工作已经逐步数字化、自动化和智能化。
具体来说、数据化运营的意义如下:
- 提升运营决策效率;
- 提高运营决策正确性;
- 优化运营执行过程;
- 提升投资回报;
- 数据化运营有两种方式:
1) 辅助决策式数据化运营
2) 数据驱动式数据化运营
- 数据化运营的工作流程
(1)第一阶段:数据需求沟通:该阶段主要包括需求产生和需求沟通两个步骤:
1、需求产生:由运营部门产生的某些数据化运营需求,例如预测商品销售,找到异常订单,确定营销目标人群名单等。
2、需求沟通:针对运营部门提出的需求进行面对面沟通和交流,沟通主要包含三个方面:
一是业务需求沟通,包括需求产生的背景,要解决的问题,预期达到的效果等;
二是数据现状沟通,包括数据存储环境,主要字段,数据字典,数据量,更新频率、数据周期等,如果没有数据则需要制定数据采集规则并开始采集数据,该过程中可能需要IT部门的协助;
三是数据和分析的关联性沟通,根据与运营人员的沟通,了解业务背景下哪些是常见的带有业务背景的数据,不同场景会导致数据如何变化、分析中会涉及那些关键字段或场景数据等,
(2)第二阶段:数据分析建模:
从这一阶段开始进入正式数据工作流程,包括数据获取、数据预处理、数据分析建模和数据结论输出四个步骤:
- 获取数据:数据化运营分析所需数据需要经过特定授权从数据库或文件中得到;
- 数据预处理:在该过程中对数据进行检验,样本均衡,分类汇总,合并数据集,删除重复项、分区、排序、离散化、标准化、过量变量、转置、查找转换、脱敏、转换、抽样、异常值和缺失值处理等。
- 数据分析建模:运用多种数据分析和挖掘方法,对数据进行分析建模。方法包括统计分析,OLAP分析、回归、聚类、分类、关联、异常检测、时间序列、协同过滤、主题模型、路径分析、漏斗分析等。
- 数据结论输出:数据结论的输出有多种方式,常见的方式是数据分析或挖掘建模报告,另外还包括Excel统计结果,数据API输出,数据结果返回数据库,数据结果直接集成到应用程序中进行自动化运营。
(3) 第三阶段:数据落地应用:
该阶段是数据化运营的关键阶段,前期所有的准备和处理工作都是通过该阶段:生价值。该阶段包括数据结论沟通,数据部署应用和后续效果监测和反馈三个步骤;
- 数据结论国通:对于输出的形式为报告、EXCEL统计结果等方式的内容,通常都需要与运营对象进行深入沟通,主要沟通的内容是数据得到的结论和结果与业务进行沟通,通过沟通来初步验证结论的正确性、可靠性和可行性,并对结果进行修正。如果没有可行性,那么需要返回第二阶段重新开始数据分析建模的流程
- 数据部署应用: 通过沟通具有可行性的数据结论,可直接应用到运营执行环节。
- 后续效果监测和反馈:大多数的数据化运营分析都不是一次性的,尤其当已经部署应用之后,需要对之前的数据化结论在实践中的效果对二次验证,若有必要则需要对结论进行再次修正和意见反馈。