信用风险和评分卡模型

什么是信用风险?

交易对手未能履行约定契约中的义务而造成经济损失的风险,即受信人不能履行还本付息的责任而使授信人的预期收益与实际收益发生偏离的可能性,它是金融风险的主要类型。

组成部分:

PD 违约概率

LGD 违约条件下的损失率

EAD 违约风险下的敞口暴露

RWA 风险权重资产

EL 期望损失

坏样本的定义

• M3&M3+逾期

• 债务重组

• 个人破产

• 银行主动关户或注销

• 其他相关违法行为

M0,M1,M2的定义

• M0:最后缴款日的第二天到下一个账单日

• M1:M0时段的延续,即在未还款的第二个账单日到第二次账单的最后缴款日之间

• M2:M1的延续,即在未还款的第三个账单日到第三次账单的最后缴款日之间

什么是评分卡

信贷场景中的评分卡

• 以分数的形式来衡量风险几率的一种手段

• 是对未来一段时间内违约/逾期/失联概率的预测

• 有一个明确的(正)区间

• 通常分数越高越安全

• 数据驱动

• 反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡

非信贷场景中的评分卡

• 推荐评分卡

• 流失评分卡

观察期与表现期

观察期

• 搜集变量、特征的时间窗口,通常3年以内

• 带时间切片的变量

表现期

• 搜集是否出发坏样本定义的时间窗口,通常6个月~1年

评分卡模型开发步骤

立项

数据准备与预处理

模型构建

模型评估

验证/审计

模型部署

模型监控

评分卡开发的常用模型

• 逻辑回归

优点: 简单,稳定,可解释,技术成熟,易于监测和部署

缺点: 准确度不高

• 决策树

优点: 对数据质量要求低,易解释

缺点: 准确度不高

• 其他元模型

• 组合模型

优点: 准确度高,不易过拟合

缺点: 不易解释;部署困难;计算量大

模型监控的指标

AR

KS

PSI

Kendall’ Tau

Migration Matrix

AR(Accuracy Ratio)

衡量分数预测能力的指标 ,需要一个完整的表现期。取值位于-1~1之间。

如果我们今天用AR来监控模型的好坏,那么只能是监控模型在一年(这里假定表现期为一年)之前的数据上表现的好坏。

先把样本按分数由低到高排序,X轴是总样本的累积比例,Y轴是坏样本占总的坏样本的累积比例。AR就是等于模型在随机模型之上的面积除以理想模型在随机模型之上的面积。计算中可以用梯形近似逼近曲线下面积来计算,AR越高说明模型区分效果越好。

下图公式中Xk,Yk代表分数的第K个分位点对应的累积总样本及相应的坏样本的比例。设总的坏样本的比例为Bo,令(Xk,Yk)=(0,0)

KS(Kolmogorov-Smirnov)

衡量分数区分能力的指标。

把样本按分数由低到高排序,X轴是总样本累积比例,Y是累积好,坏样本分别占总的好,坏样本的比例。两条曲线在Y轴方向上的相差最大值即KS。KS越大说明模型的区分能力越好。

Bad k和Good k分别表示为分数累积到第k个分位点的坏样本个数和好样本个数,KS计算公式: 

PSI( Population Stablility Index)

衡量分数稳定性的指标

按分数对人群进行分组,令Ri是现在样本中第i组占总样本的百分比,Bi是一段时间后第i个分组占总样本的百分比。PSI取值越小说明分数的分布随时间变化越小。

Kendall’s Tau

正确有效的评分卡模型中,低分数的实际逾期率应该严格大于高分段的实际逾期率。我们将分数从低到高划分为10组,每组的实际逾期率记做r1,r2,r3,…,r10。对所有的(ri,rj)的组合,如果有ri< rj且i< j,或者ri> rj且i> j,则记做一个discordant pair,否则记做concordant pair。其计算公式如下:

Kendall’s Tau越接近1或者等于1,说明逾期率在分数上的单调下降性越明显,反之说明分数变化与逾期率的变化的一致性得不到保证。

Migration Matrix

迁移矩阵是衡量分数矩阵的指标,对相同的人群,观察在相邻两次监控日期(一周)分数的迁移变化。迁移矩阵中元素Mjk代表上次监控日期分数在第j组中的人群在当前迁移到第k组的概率。实际计算中可把分数平均分成10组,计算这10组之间的迁移矩阵。

申请评分卡的重要性和特性

互联网金融特性与产品

传统金融机构+非金融机构

传统金融机构: 传统金融业务的互联网创新以及电商化创新、APP软件等

非金融机构:利用互联网技术进行金融运作的电商企业

(P2P)模式的网络借贷平台

众筹模式的网络投资平台

挖财类(模式)的手机理财APP(理财宝类)

第三方支付平台等。

为什么要开发申请评分卡

风险控制

营销

资本管理

评分卡的特性

稳定性

区分性

预测能力

和逾期概率等价(即评分和逾期率呈相关性)

申请评分卡常用的特征

个人信息 : 学历 性别 收入

负债信息 : 在本金融机构或者其他金融机构负债情况

消费能力 : 商品购买纪录,出境游,奢侈品消费

历史信用记录 : 历史逾期行为

新兴数据 : 人际社交 网络足迹 出行 个人财务

非平衡样本问题的定义和解决方法

非平衡样本的定义

在分类问题中,每种类别的出现概率未必均衡

信用风险:正常用户远多于逾期/违约用户

流失风险: 留存客户多于流失客户

非平衡样本的隐患

降低对少类样本的灵敏性

非平衡样本的解决方案

过采样

优点: 简单,对数据质量要求不高

缺点: 过拟合

欠采样

优点: 简单,对数据质量要求不高

缺点: 丢失重要信息

SMOTE(合成少数过采样技术)

优点: 不易过拟合,保留信息

缺点: 不能对有缺失值和类别变量做处理

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容