作者:Thomas Maydon, Principa. 翻译:Jason Ye, TalkingData.
在我过去的博客文章中,我们已经介绍了数据分析的一些基本原理和陷阱。在这篇博文中,我们专注于数据科学中会遇到的四种数据分析:描述性分析,诊断性分析,预测性分析和规范性分析。
当我与刚刚进入数据科学世界的年轻分析师相遇时,我经常会问他们“你认为数据科学家最重要的技能是什么?”。他们的答案是非常多样。
我对他们的回馈是:数据科学家最重要的技能应该是将数据转化为非定量的、清晰的、有意义的见解的能力。瑞典统计学家汉斯·罗斯林(Hans Rosling)为此而闻名。这是一个经常被忽视的技能。
以下是Hans Rosling在“Ted Talk”的一次演讲所散发出的光芒:
视频链接:https://www.youtube.com/embed/hVimVzgtD6w?feature=oembed
围绕今天主题,非常有必要为大家详细介绍一些帮助个人如何使用分析相关的知识提炼出有价值的见解的工具。其中的一款工具就是四维范式分析。
简单地,可以将数据分析分类成四个主要类型。下面我将会详细介绍里面的细节。
一、描述性分析:发生了什么?
这是所有形式中最常见的。在业务中,它为分析人员提供了业务中关键指标和措施的视图。
例如公司每月的收支表。类似地,分析师可以获得大量客户的数据。了解客户的人口统计信息(例如我们的客户的30%是个体经营者)将被归类为“描述性分析”,利用有效的可视化工具可以增强描述性分析的信息。
二、诊断性分析:为什么发生?
这是数据分析的复杂性的下一步是诊断性分析。在对描述性数据进行评估时,诊断分析工具将使分析师能够深入到细分的数据,从而隔离出问题的根本原因。
精心设计的商业信息(BI)仪表板包含读取时间序列数据(即多个连续时间点的数据),并具有过滤器和钻取能力,可进行此类分析。
三、预测性分析:将发生什么?
预测分析是关于预测的。无论是将来发生事件的可能性,预测可量化的数量还是估计可能发生事件的时间点。这些都是通过预测模型完成的。
预测模型通常利用各种可变数据进行预测。组件数据的变异性将与可能预测的关系(例如,一个较老的人,他们对心脏病发作的敏感程度越高-我们会说年龄与心脏病发作风险呈线性相关),然后将这些数据一起编译成分数或预测。
在一个很大的不确定性的世界中,能够预测能够做出更好的决定。预测模型是许多领域中最重要的一些模型。
这是预测中需要避开的坑:http://insights.principa.co.za/the-top-predictive-analytics-pitfalls-to-avoid
四、规范性分析:需要做什么?
在价值和复杂性方面的下一步是规范性模式。规范模型利用对发生的事情的理解,为什么发生了这种情况以及各种“可能发生的”分析,以帮助用户确定采取的最佳行动方案。规定性分析通常不仅仅是一个单独的行动,而且实际上是其他一些行动。
一个很好的例子是一个交通应用程序,帮助您选择最佳路线回家,并考虑每个路线的距离,每个路上可以行驶的速度,以及当前的交通限制。
另一个例子可能是制作考试时间表,使得各个班级的学生没有冲突的时间表。
总结
虽然不同形式的分析可能为企业提供不同数量的价值,但它们都具有自己的位置。要了解数据分析如何为您的业务带来更多价值,请给我们发邮件以安排聊天。