我们开门见山,这是数据分析师使用统计数据的7种方式
1.设计和解释实验以指导产品决策
观察:广告变体A的点击率比变体B高5%。
数据分析师可以帮助确定这种差异是否足够显着,以致需要引起更多的关注,关注和投资。
它们可以帮助你了解实验结果,这在你测量多个指标,运行相互影响的实验或结果中发生某些Simpson悖论时特别有用。
假设你是一家全国性的零售商,并且你正在尝试测试新的营销活动的效果。数据分析师可以帮助你确定应分配给实验组的存储,以在实验组和对照组之间取得良好的平衡,应分配给实验组的样本量以获得清晰的结果,以及如何进行研究支出尽可能少的钱。
使用的统计数据:实验设计,频率统计(假设检验和置信区间)
2.建立预测信号而非噪声的模型
观察:12月的销售额增长了5%。
数据分析师可以告诉你可能的原因,为什么销量增长了5%。数据分析师可以帮助你了解推动销售的因素,下个月的销售情况以及需要注意的潜在趋势。
请参阅什么是过度拟合的直观解释,尤其是对于少量样本集?过度拟合实际上是在做什么?高R²,低标准误差的过高承诺如何发生?了解为什么仅适合信号这一点很重要。
使用的统计数据:回归,分类,时间序列分析,因果分析
3.将大数据变成全局
观察:一些顾客只购买健康食品,而另一些顾客仅在有销售时才购买。
任何人都可以观察到该企业有100,000个客户在你的杂货店购买10,000个项目。
数据分析师可以帮助你标记每个客户,将他们与相似的客户分组,并了解他们的购买习惯。这样一来,你便可以查看业务发展如何影响特定人群,而不必整体看待每个人或单独看待每个人。
邓恩比(Dunhumby)将杂货店购物者分为以下几个组:“预算购物者”,“最精打细算”,“以家庭为中心”,“观看腰围”和“挥霍与保存” 。
使用的统计信息:聚类,降维,潜在变量分析。
4.了解用户的参与度,保留率,转化率和潜在客户
观察:很多人都在注册我们的网站,而且再也没有回来。
为什么你的客户从你的网站上购买商品?你如何保持客户回头客?为什么用户退出你的渠道?他们什么时候出来?你公司最喜欢哪种电子邮件来吸引用户?参与,活动或成功的一些主要指标是什么?有哪些好的销售线索?
使用的统计数据:回归,因果分析,潜在变量分析,调查设计
5.给用户他们想要的东西
给定用户(客户,客户,用户)及其与公司项目(广告,商品,电影)之间的互动(点击,购买,评级)的矩阵,你能否建议用户接下来要购买哪些项目?
使用的统计信息:预测建模,潜在变量分析,降维,协作过滤,聚类
6.智能估算
观察:我们有一面横幅,其印象数为100,点击次数为0。
0%可以很好地估算点击率吗?
数据分析师可以结合数据,全局数据和先验知识来获得理想的估计值,告诉你该估计值的属性,并总结该估计值的含义。
使用的统计数据:贝叶斯数据分析
7.用数据讲故事
数据分析师在公司中的角色是充当数据与公司之间的大使。沟通是关键,并且数据分析师必须能够以公司可以使用的方式解释他们的见解,而又不牺牲数据的保真度。
数据分析师不仅简单地总结了数字,还解释了数字为何如此重要以及从中可以得到哪些可行的见解。
数据分析师是公司的讲故事者,负责传达数据的含义及其对公司的重要性。
前六点的成功可以衡量和量化,但是这一点不能。我想说这个角色是最重要的。
使用的统计信息:呈现和交流数据,数据可视化