信用评分模型技术及应用(陈建-著)-笔记

序言

        消费信贷产业的崛起、壮大和发展,有着非常积极的经济和社会意义。在充分认识发展消费信贷产业巨大机遇的同时,必须清醒地认识它给金融管理带来的深刻挑战。风险与收益相对称,这是金融市场的客观规律。在消费信贷业务丰厚的盈利潜力背后,也蕴藏着很大的风险,特别是信用风险。我们不可能消灭风险,但我们必须以科学的手段准确地评估风险,以正确的策略有效地控制风险,以最佳的操作来全面地管理风险。
        以信用评分模型方式来管理风险,是国际上比较成功的实践经验。由于消费信贷业务具有笔数多、单笔金额小,数据丰富的特点,决定了必须使用智能化、概率化的管理模式。除了风险管理这一核心领域,这种概率化的管理模式还贯穿在消费信贷和信用卡的收益管理、客户忠诚度管理、客户关系管理等方面。

1.信用评分模型在消费信贷管理中的应用

        信用评分模型是消费信贷管理中先进的技术手段,在市场营销、信贷审批、风险管理、账户管理、客户关系管理等各个方面发挥着十分重要的作用。信用评分模型运用先进的数据挖掘技术和统计分析方法,通过对消费者的人口特征、信用历史记录、行为记录、交易记录等大量数据进行系统的分析,挖掘数据中蕴含的行为模式、信用特征,捕捉历史信息和未来信用表现之间的关系。例如,消费者在未来一年内带来坏账损失的概率、给银行带来收益潜力的大小,或者消费者接受信用卡营销的概率等。
        按照模型所预测的未来表现结果划分,有:

  • 风险评分模型:对违约拖欠的风险概率进行预测;
  • 收益评分模型:对消费者给信贷机构带来收益的潜力大小进行预测;
  • 流失倾向评分模型:对现有客户在未来一定时期内流失的概率进行预测;
  • 市场反应评分模型:对目标客户接受信贷机构营销的概率进行预测;
  • 转账倾向评分模型:对目标客户吧贷款余额从别的银行转账过来的概率进行预测;
  • 循环信贷倾向评分模型:对目标客户或现有客户利用信用卡账户进行循环信贷的概率进行预测;
  • 欺诈评分模型:对信用卡申请或信用卡交易为欺诈行为的概率进行预测。


    信用评分模型在生命周期管理中的应用

2.信用评分模型的数据基础

        数据是信用评分模型的根本基础,数据的存储、清理、加工,到最后整合成数据仓库,为评分模型提供了健全、准确、丰富的信息来源。
评分模型的数据基础

3.数据挖掘简介

        数据挖掘的流程一般包括十大步骤:
数据挖掘的流程
  • 确定商业目标
  • 确定数据来源
  • 数据收集与选择
  • 数据质量检查
  • 数据的转换,包括衍生变量
  • 数据的挖掘、分析与建模
  • 检验和解释结果
  • 决策建议
  • 结果付诸实施
  • 跟踪与反馈

4.数据挖掘与信用评分模型的技术

        好的数据挖掘和信用评分模型技术,能够从大量、纷繁复杂、充满噪音的数据中,提炼宝贵的信息,发现其中蕴含的规律,解释客户的行为,预测客户未来的表现,从而为决策提供依据。
对数据进行描述和总结,是对数据质量进行检验的重要手段,常用的技术手段有:频率、均值、中位数、方差、极大值、极小值、1/10区间、1/4区间、相关系数等。
在变量处理的过程中分箱也是常用的技术手段,其优点有:

  • 有效捕捉数据中的非线性关系
  • 有效捕捉数据中的非单调关系
  • 有效地把类别变量加入到模型中
  • 有效处理缺失值和特殊值
  • 提高模型的抗震荡性,模型不会因数据的细小波动而受到冲击
  • 提高模型的可解释性

5.信用评分模型的开发流程

5.1 样本选取

        样本质量的高低,很大程度上决定模型的预测力和效果,样本选取的原则有:

  • 代表性:样本能够代表总体
  • 充分性:样本数要充足,不同类别的样本也要充足
  • 时效性:陈旧的数据不足以预测未来的表现
  • 排除性:特殊用户排除在外,比如本行员工、vip用户等,对于申请风险评分模型,无法确定好坏的用户也要排除。

5.2变量界定

        训练模型使用的变量要有一定的显著性,能够对不同的目标变量有一定的预测能力,而且容易获取。

5.3模型分组

        分组是模型开发的重要一环,把总体数据分组,每一组具有同质性,在不同分组上进行建模。比如,按申请人的身份分组:学生、高端客户、低端客户;按照产品分组:金卡账户、银卡账户、普通卡账户等。

5.4模型的制定

  • 分析单个变量的预测能力
  • 减少预测变量的个数
  • 选择适当的模型方法

5.5模型的检验

        在模型的检验报告中,通常使用的指标有:ks值,auc,lift-chart。

6.信用局评分模型的开发与应用

        信用局是专业地进行收集、存储、整理、加工,并向消费信贷机构提供消费者全面的信用历史记录的机构,如美国的Trans Union、Equifax、Experian三大信用局。
信用局数据中部分预测变量

7.市场营销评分模型的开发与应用

        数据库营销是现代消费信贷市场营销最中央的技术。它通过银行内部数据或外部数据的挖掘、分析和开发评分模型,对消费者的行为特征、风险水平、收益潜力、用卡偏好、反应概率等进行评估,从而瞄准那些符合银行信贷政策、风险收益对比合理、市场营销成效较好的消费者作为营销对象和目标用户。常用的模型包括:市场反应评分模型、转账倾向评分模型、游移倾向评分模型。

7.1 市场反应评分模型

        市场反应评分模型是利用消费者信用历史记录、个人信息和其他消费资讯预测消费者接受信贷机构主动营销的概率。

7.2 余额转账倾向评分模型

        余额转账倾向评分模型是利用消费者信用历史记录预测消费者把别的信用卡未清偿欠款余额转移到新的信用卡上来的概率和数额。包括:余额转账概率评分模型和余额转账数额评分模型。有针对性向的鼓励消费者转账,是市场营销和竞争的重要手段之一。

7.3 游移倾向评分模型

        游移倾向评分模型是利用消费者信用历史记录预测消费者把余额从新开户信用卡优惠期满后转移到其他银行信用卡账户的概率。由于信贷机构为鼓励消费者把贷款余额转过来,往往提供一定的优惠,如开始6个月免息或低息,一些消费者开户是为了享受优惠,一旦优惠结束,又将余额转移到其他信用卡。常用的预测变量有过去6个月新开户信用卡数量,数目越高,概率越大,原因是大量开户本身显示消费者不会忠诚于某个信用卡。

8.申请风险评分模型的开发与应用

        申请风险评分模型是对消费信贷申请人的资信状况进行评估,预测其在未来严重拖欠或坏账的概率。该评分往往是信贷审批的主要依据。据调查,80%左右的信贷风险来自信贷审批环节,一旦消费者获得审批,后续管理只能控制20%的风险。
申请风险评分模型的数据时间划分

表现变量:

  • 3期拖欠以上、呆账、破产的账户定义为“坏”
  • 未拖欠或1期拖欠的账户定义为“好”
  • 2期拖欠定义为“不确定”,排除在模型外
  • 表现变量一般根据表现期终的状态界定,若坏样本量不足,也可根据表现期内的最坏状态界定,即使表现期终恢复到相对“好”的地位。如果业务时间较短,坏样本不足,则可以把1期拖欠定义为“坏”。

预测变量

        预测变量一般范颖申请者3个方面的信息:还款能力、还款意愿和稳定性。

  • 还款能力:房产状况、学历、收入状况、职业类别等;
  • 还款意愿:性别、婚姻状况、历史信用记录等;
  • 稳定性:现单位工作时间长短、现居住时间长短等。
    在汽车贷款中,预测变量还包括:首付额占比、贷款额占比、付款期限,汽车品牌等。

表现推测

        对于申请评分模型,一个特殊的问题是样本偏差性和被拒绝用户的表现推测。训练模型使用的样本是历史全部申请用户中的被批准的用户,而预测的样本是全部申请用户。因此,历史申请用户中的被拒用户也应加入模型训练,这部分样本的标签推测是发展申请评分模型的难点,主要参考拒绝推断的方法。

模型分组

        模型分组也是提高预测能力的手段,将总体分为几个具备同质性的群体,群体之间的特征差别比较大,在不同群体中单独建模。
模型分组

模型应用

        可用于信贷审批和利率定价,风险越高,利率越高,风险与收益相对称。

9.行为评分模型的开发与应用

        行为评分模型是是消费信贷管理中最常用的预测模型之一,根据账户历史表现出来的各种行为特征预测该账户未来的信贷表现。

9.1行为风险评分模型

        利用账户的历史数据和行为特征预测账户未来一定时期内严重拖欠的风险概率。


行为风险评分模型

排除

        行为风险评分模型样本一般会排除下列账户:

  • 已严重拖欠、呆账、破产
  • 开户少于6个月
  • 最近6个月无活动
  • 已关闭
  • 持有人已故
  • 特殊情况(冻结、VIP)

预测变量

  • 严重性:历史拖欠最严重状态
  • 近期性:历史事件段内(24个月)拖欠距今时长(月数)
  • 频率性:拖欠次数
  • 货币价值性:过去三个月平均贷款余额
  • 组合性:现金提取额占交易额比例

9.2行为收益评分模型

        预测未来给银行带来收益潜力的大小

9.3行为流失倾向评分模型

        预测顾客未来流失转而使用其他信用卡的概率,流失的定义为一段时间内使用该卡,后来急剧减少使用甚至不使用该卡。

10.客户评分模型的开发与应用

客户评分模型

11.欺诈风险评分模型的开发与应用

        包括申请欺诈评分模型和交易欺诈评分模型。申请反欺诈主要靠申请者信息检验识别,需要外部数据进行建模,对数据要求较高。交易反欺诈是利用当前交易信息与历史交易行为模式对比,开预测当前交易为欺诈交易的概率。
模型具体细节有待探讨!

12.信用评分模型的实施与管理

信贷审批流程

13.信用评分模型的跟踪与检验

        模型线上回测,检验指标常用auc,ks,lift-chart等

(如有不同见解,望不吝赐教!!!)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容