银行信用风险预测分析

参考:https://www.kuxiao.cn/course/pc-course-learning.html?cid=C59acca6fa17eb456c650e849

一、商业理解

信用,对个人和企业都是无比重要的品质。比如有了信用,个人可以向银行申请信用卡,可以透支国际长途电话费、汽车保险打折等。对于企业,则可以大量透支和贷款。所以,银行考查客户的信用状况是非常重要的事情。

信用评分

  • 信用评分的方法是什么?
    信用评分是使用统计模型的方法来对潜在客户和已有客户进行贷款风险评价的方法。
  • 怎样计算客户的信用评分?
    随着这种统计建模的方法的成熟应用,其思路已被广泛推广,诸如欺诈评分、市场响应评分等领域。
  • 怎样考查客户的信用?
    在美国,客户信用评分系统主要由FICO公司推出。FICO的评分系统得出,信用评分范围在300-850分之间,评分越高,违约率越低。在我国银行业,比较通用的方法也是类似的形式 。评分特别低和特别高的客户很少,大多数评分中等。
  • 信用评分卡优缺点:
    优点 :便于理解和使用,容易被各层次的人员了解和使用;
    缺点 :假定各项因素对信用的影响关系是线性组合的。该假定在现实中并不普遍成立。

二、数据理解

  • QUESTION 1:怎样将贷款风险问题转化为数据挖掘问题?
    ►小额贷款问题可以理解为有目标变量的预测问题,根据目标变量是否违约,来预测信贷帐号是否有风险。
    ►客户是否按期归还贷款?
    ►银行把按期归还贷款理解为”好“的信贷帐号,对应的客户为”好“客户
    ►把不能按期归还贷款的理解为”坏“的信贷帐号,对应的客户为”坏“客户。
  • QUESTION 2:如何获取数据?
    银行可以从系统中提取大量关于贷款人的资金使用、消费、以及还贷款的情况数据,这些数据包括(但不限于)以下变量:
    ►帐户存在时间
    ►过去12个月最严重的拖欠行为(没有拖欠、1个月拖欠、两个月拖欠等)
    ►过去12个月的平均贷款金额
    ►过去6个月的还款占欠款比例
    ►过去6个月现金提取占交易金额比例
    ►过去6个月平均刷卡额
    ►过去6个月消费(刷卡)类型。。。。。
实验采用数据 — 小额贷款.csv

三、数据准备

离散化

►离散化可以降低异常数值的影响
►离散化使贝叶斯评分模型更易理解

四、建立模型

4.1 建立模型与模型评估

  • 建立什么模型?
    朴素贝叶斯模型,预测违约评分(0~1)
  • 朴素贝叶斯模型有什么问题?
    对于违约的预测能力差:违约类的查全率很小,接近0
  • 为什么存在这个问题?
    在朴素贝叶斯模型中,判定违约的后验概率confidence(1)的阈值设定为0.5
  • 如何解决这个问题?
    ♦ 修改confidence(1)的阈值
    ♦ 修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小
  • 修改方法:
    ♦ 从0开始,每次将阈值加1%
    ♦ 计算阈值对应的分类代价,取最小的分类代价及其对应的阈值

4.2 建立朴素贝叶斯违约评分模型

  1. Declare Missing Value
    将“收入”字段中值为100000.0判定为缺失值
    将“在现住址时间”和在现工作时间“值为999判定为缺失值
  1. Discretize
    离散化,记得将离散化类型定为标量化属性interval,用于后期贝叶斯分类,同时remove useless

  2. Loop
    子过程- 循环计算分类代价
    生成变量iteration,从1开始每次循环加1,直到50



    1)Generate Macro
    function description: threadhold=%{iteration}*0.01
    2)Validation

    3)Generate Attributes
    function description: threshold=%{threshold}

  3. append
    将每次循环得到的结果整合在一起

要使修改后的阈值使分类代价(将1归类为0的代价是30,将0归类为1的代价是1)达到最小,选取分数最低值的threadhold,即最佳阈值

4.3 保存朴素贝叶斯模型

五、模型应用

1)Generate Attributes
记得将模型训练时的离散化结果应用到测试集,这样模型才能有效运行

2)Create Threadhold
应用模型训练时得到的最佳阈值

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容