蚂蚁撼动大象?解密大数据征信

故事主角

大象:中国人民银行征信中心

蚂蚁:8家互联网个人征信公司

自2015年1月,央妈对芝麻、腾讯等8家公司开放了个人征信市场。时隔两年,8家公司交出的答卷均为“不及格”。今天,小编带您解读“个人征信”,这个对大家而言熟悉又陌生的领域。个人征信工作难在哪,竟连“马爸爸”的团队这次都没能及格?8只小蚂蚁还能否挑起中国“个人征信”市场的大梁?大数据征信,是什么样的FinTech,融入了哪些科技手段?小编就带您梳理一下征信工作的业务链条,再分别从征信业务各个环节对比“大象”和“蚂蚁”的优势劣势。

征信业务链条


1.数据筛选

根据征信数据来源的不同,大致可以分为传统征信数据和互联网征信数据。传统征信数据的主体部分——“信贷交易信息明细”,其数据主要来自于银行、小贷公司及其他类信贷机构,数据安全性高,其记录的信用历史都是由真实的资金借贷所产生,因此,公信力也是最强的,属于“强数据”。下图是央行征信报告(个人详版)的数据维度。


而基于互联网产生的征信数据则具备实时性高、覆盖范围广、数据维度丰富及市场应用便利等优势,但数据大多只能从侧面反应人品特征,是属于“弱数据”。下图以芝麻信用为例,列示了互联网征信数据所收集的数据维度。


2.数据加工处理

由于个人征信数据源细碎、分散、业务场景众多等特点,不同来源的异构数据,对匹配和集成整合工作带来了相当大的困难。

央行征信中心借助制定数据提交标准(Metro2格式标准,美国信用局制定的用于个人征信业务的统一数据报告格式和标准数据采集格式),并要求数据提供方按标准提交的方式。保证收集到的数据在较大程度上是一致的,但对于不能满足标准的非结构化和半结构化的数据,则会被拒之门外。

互联网征信公司,其自身拥有强大的非结构化数据资源集成整合能力,借助文本挖掘、语音与图像识别等融合机器学习算法,能够有效地提取有用信息,完成数据匹配与集成工作。

因此,在数据加工处理方面,央行征信中心能力受限,处于被动接收状态;而互联网征信公司,能够根据自身需要对原材料数据进行主动加工处理,从而具备了更强的扩展性。

3.数据存储

无论央行征信中心还是互联网征信公司,势必面临海量数据的存储和管理的问题。据此,征信机构都需要根据实际的数据应用需求设计数据仓库和数据集市,目的是为数据分析挖掘和征信产品输出奠定基础。由于数据存储室一个很大的问题,在本文中无法深入探讨征信机后背后的数据储存解决方案。后续“豆芽FinTech”会专门对金融大数据公司的存储架构和工作流程进行梳理,请持续关注我们。

4.征信产品

信用报告

作为征信市场最基础的数据产品,展示了被征信对象的分类信息,但不对其信用状况进行评价。现阶段央行征信中心的信用报告则属于这一类,主要有个人版(简版和明细版)、银行版、社会版三种。

信用评分

信用风险评分:预先设计好评分卡及指标权重,根据收集到的人群的数据特征,将各项指标的分数按照相应权重相加,得到信用分。著名的FICO信用得分就属于此类。

申请风险评分:对金融信贷的申请人信用状况进行评估,以预测可能发生坏账和出现逾期的概率。

市场营销评分:根据信用记录中的表现特征,制定差异化的营销策略,提高用户的响应率。共享经济类产品的评分大多属于此类。

欺诈风险评分:将信贷申请者的提交的数据与档案中的数据进行鉴权,从而识别欺诈者。在运营商实施手机号实名制登记后,多渠道信息的一致性鉴权在反欺诈中的难度有所下降了。

申请欺诈评分:采用数据挖掘方法构建计量模型,对申请者的基本信息和历史行为进行评判,给出可量化的欺诈风险评估结果。

5.征信应用

在征信产品的应用层面,传统征信产品主要用于金融借贷的审批和贷后管理。而互联网征信公司,由于其对互联网入口的强大掌控能力(如:支付宝、微信等),能够很容易的将征信产品应用到金融借贷以外的各个领域。如赊销、精准营销、共享经济、信用扩展等方面。

赊销

京东、淘宝、飞猪等平台已经打造出融合信用,为消费者提供商品赊销、服务免押金等功能。通过在商业中融入信用机制,一方面引导消费者形成建立和维护良好个人信用的观念,另一方面也加速了商品经济的周转速率,扩大全社会消费规模。

精准营销

通过关联算法,推算消费者对于新产品的接受程度,并主动将接受程度达到特定域值的人群识别为目标客户,根据不同目标客户的互联网行为偏好,分别进行网络、邮件、社交媒体等进行渠道营销。

信用扩展

借助身份基本信息、社交人脉、互联网行为信息等,采用聚类、关联等机器学习算法,实现对征信未覆盖人群——信用白户的评价,从而拓展了征信的覆盖面,推动信用社会的形成和发展。

总结:蚂蚁与大象共舞

通过对征信业务链条的拆解,以及对链条中的各个环节进行对比分析发现,“蚂蚁撼动大象”的命题是不成立的。央行信贷中心在数据源的获取和筛选方面,具备不可撼动的权威性,能够直接获取个人征信所需的“强数据”。而互联网征信公司依靠其技术优势,对征信数据进行更完善的集成整合,灵活打造出符合社会发展需求的征信产品,借助其自身的渠道优势完成征信产品的运营和推广,对信用社会的建设起到巨大的推动作用。

因此,中国未来的个人征信市场,将会是蚂蚁和大象“和谐共舞”的市场。央行征信中心凭借对“强数据”的获取能力,建立征信数据的主体。互联网征信公司聚合其他各类数据对征信画像进行补充,结合多渠道、低成本的互联网入口完成征信产品的运营和应用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容