今天我们重点来讲一下EDA分析在数据分析师手中都是怎么玩出花来的,举一个例子跟大家简单说一下。获取更多资讯请搜索九道门商业数据分析学院
本例调查研究了巴西一家大型国际银行的信用卡部门。这家银行发行的大多数信用卡都有年费。
不想支付这些费用的客户可致电银行要求取消或减少费用。在这种情况下,银行客户代表与客户就费用进行谈判。最后,根据客户的背景情况,客户代表可以提供适当的折扣。在折扣谈判过程中,银行客户代表应遵循银行的折扣政策,即,他们不能提供高于其权限的折扣。而在其管辖范围内,在提供客户可接受的最低折扣的同时,银行客户代表也应该优先考虑银行的利益。那这些因素也是数据分析师在数据分析的时候是需要引起重视的。
该银行建议的初始审计范围是识别银行客户代表在年费谈判过程中的哪些危险行为可能导致银行收入损失。数据分析师在进行数据分析的时候需要注意的危险行为包括:
1、提供高过银行标准的折扣;
2、直接提供客户高折扣而没有努力协商降低折扣率;
3、没有和客户进行过协商就提供折扣。
基于这些危险行为,制定了三个审计目标:
1、所有银行客户代表在提供折扣时均遵守银行政策;
2、银行客户代表提供尽可能低的折扣率以留住客户(保护银行的利益);
3、银行客户代表在提供最后的折扣之前与客户进行过有效协商。
除了这些问题之外,审计范围还扩展到调查发现在设定客户信用卡年费过程中潜在的运营风险,诸如:
1、缺乏有效的内部控制之类的非人为因素也可能导致收入损失;
2、即使某些案例与当前的收入损失没有直接关系,但业务流程风险可能会导致未来的收入损失。
3、为了实现这一审计目标,需要彻底探讨所有相关领域的不规范性。审核员需要了解银行流程,识别此流程中的风险和问题及其内部控制系统。
这个例子使用了两个数据集:
一、客户留存数据集
客户留存数据集里包含了某一个月内拨打的所有客户电话信息,该数据集总共包含195,694系记录。每条记录代表一个客户的电话,包含162个数据字段,这些数据对于数据分析师来说都是非常可贵的。
二、客户帐户主数据集
客户帐户主数据集是n个包含60,309,524条记录和504个字段的大型数据集。每条记录代表一个信用卡帐户,包括了过去30多年在该银行开立的所有账户。帐户主数据中的字段涵盖与账户和帐户持有人相关的各种信息:
1、帐户信息,例如帐户类型和帐户状态;
2、人口统计信息,如帐户持有人的年龄和性别;
3、财务信息,如信用额度和延迟支付金额。
银行客户代表提供的折扣在收入损失分析过程中发挥着重要作用。但是,在原始留存数据集中,没有直接反映折扣的字段。与折扣相关的两个属性变量是原始年费和实际年费。两者的差异代表折扣,这个数字必须在数据分析师进行EDA数据分析之前计算。具体而言,折扣是原始年费与实际年费之间的差额除以原始年费。用于计算折扣的公式如下:
任务一:用EDA探索分析遵守银行政策情况
任务二:用EDA探索分析懒惰的银行客户代表
任务三:探索分析代表是否执行了有效的沟通
具体的解决方法在此就不赘述了,数据分析师在进行数据分析的时候需要多方注意。如果有不清楚的,可以来九道门商业数据分析学院了解更多信息。