背景:利用SAS EM建立决策树,制定差异化的运营策略。
前期准备:在SAS中准备好数据集,对缺失值进行预设和处理,设定目标变量,导入SAS EM,新建逻辑库和流程。
1. 数据探索
选择“探索”中的“统计探索”,
建立数据与统计探索之间的关联。在卡方统计量选项,勾选通过分箱对区间型变量进行计算。
选择运行后,在结果页面,会出现3幅图。
左上角:卡方统计量/Cramer系数V
右上角:各变量的描述性统计。包括一维分析和与目标变量交叉的二维分布。
2. 建立一个自动的决策树
在描述性统计、划分测试集和训练集、替换缺失值后,建立一个控制点,通过控制点连接到决策树。
设定决策树的属性,设置好后,点击运行。
训练中的最大深度:从父节点到叶结点的总层次数,可设定为10
叶大小:叶结点可以具有的最小训练观测数,可设定为30
结果页面的分析:
查看结果,在查看——模型——节点规则中,可以看到if-then规则
结果分析:
选择模型比较,比较两种模型的ROC和KS值。
参考:
SAS EM 14.1手册英文版https://support.sas.com/documentation/cdl/en/emgsj/67981/PDF/default/emgsj.pdf