据调查80%的信贷风险来自信审审批环节,一旦消费者贷款,就只能控制20%的贷款
申请评分模型的开发
1 数据时间段划分
表现期
不同产品,不同群体有不同的表现时期。
观察期
观察,提炼与模型所需要预测的表现有一定相关性的预测变量的时期。
申请风险评分模型的预测信息主要来自两个方面:申请表上面的信息,和信用局的的历史纪录。
申请表提供申请人的个人信息与资信信息,如性别,年龄,婚姻,学历,职业,收入,房产,再现单位工作时间长短,现居住地址时间长短。
信用局数据进一步反应了申请人全面的信用历史记录,包括负面信用历史纪录,现期债务负担,信用历史长短,对新信用的追求,信用的种类。
表现变量
根据表现期终的信用表现界定:
- 3期拖欠以上,呆账,破产账户定义为坏
- 未拖欠或者拖欠1期的账户定义为好
- 2期拖欠定义为不确定,排除在模型之外
预测变量
一般衡量三个方面的信息:还款能力,还款意愿,稳定性
- 衡量还款能力的指标:房产,学历高低,收入状况,职业类别
- 衡量还款意愿:是否有较多,或者教严重的拖欠行为;性别,婚姻状况。(女性,已婚还款意愿较强)
- 稳定性:现单位工作时间长短;现居住时间长短
对于汽车贷款:申请人选择的首期付款额度(首付越低,风险越高),付款期限长短;贷款占汽车价值的比例,汽车品牌。
表现推测
对于申请评分而言,一个特殊的问题是样本的偏差性和被拒绝客户的表现推测。银行在审批信用申请的时候有一定的选择条件,导致被批准的客户群体的信用质量高于申请人群总体的信用质量。
也就是说,根据历史标准批准的人,可能模型不能通过。根据历史标准拒绝的人,模型评分也有可能批准。
也就是说,根据表现期定义的表现变量不是模型变量的总体。
解决办法其一:实验:
从拒绝的申请人中选择一部分人,批准申请,观察期表现。
模型分组
提高模型的预测力,
模型分组
提高模型预测力,在发展申请评分时候会把总体分成几个同质的群体。比如将有无房产做划分。
最终申请评分模型是从候选变量中用数理统计方法将若干变量组成一个完整的评分卡。