2018年上半年,p2p频频暴雷,暴雷潮驱逐了一大批不合规的p2p平台,给互金行业留下了良好的发展空间。互金的本质是什么?互金风控是如何发展的?
P2P暴雷潮
网贷天眼研究院数据显示,截止2018年7月31日,中国P2P网贷平台数量累计6659家,其中问题平台4691家,7月份网贷成交额环比下降11.10%。
在2018年上半年,我国运营P2P平台共2835家,今年上半年新增P2P平台36家,消亡721家。相关新增、消亡情况如下图所示:
数据来源于《2018年上半年P2P发展检测报告》
【违规情况分布】技术平台对P2P平台违规情况开展持续检测。技术平台累计发现涉嫌自融自保、开展校园贷等违规业务、虚假宣传、诱导性宣传、服务器在境外、收益率过高等违规的P2P平台2000余家。2018年上半年技术平台新发现涉及上述问题平台近280家。
数据来源于《2018年上半年P2P发展检测报告》
密集暴雷的一个原因是备案延期。2017年底政府出台了一个通知,这个通知规定P2P平台最迟在2018年6月底完成整改、备案登记。很多平台还是想完成合规备案的,为了配合监管,大部分走的是自己垫资的路子,指望者监管通过后,有新资金注入。备案延期,资金流断裂,只能跑路了。
互金本质是什么?
随着暴雷潮而来的是,用户的信任问题。这是互金行业危机,用户、投资者最关注的还是风险控制问题。
金融的本质是什么呢?在货币出现前,主要是以物易物的交易方式,货币提高了交易效率,到后来的银行、移动支付,从历史发展来看,金融的本质是通过货币有效配置资源。
互联网的出现和发展,金融也发生了重大变化,大家称之为互联网金融(新金融)。互联网金融消除信息不对称,实现资源的低成本高效率配置,促进交易。互金的本质是金融,而互联网的优势则是大数据、技术创新,可以有很强的风控能力。金融的本质就是对风险的控制。
互金的本质核心是风控。风控包含三个层面:系统风险、信用风险、流动性风险。
风控模型
互金的核心是风控,国内很多互金公司风控体系大同小异。****目前互金前10:蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和网易理财。
风控技术:用户画像、人脸识别、推荐系统、智能语音、数据挖掘、风控模型。
风控系统业务流程
反用户欺诈系统
风险评估等级划分系统
用户画像
用户点击流日志分析系统
推荐系统
风险预警系统
风险定价系统
风控系统的核心是模型。风控模型应该是从两个角度去考虑,第一个角度是资产端风控策略,第二个角度是资金端风控策略。
考虑主要出发点应该是从贷前、贷中、贷后三个方向去考虑,资产进行风险等级划分,防欺诈系统、袋中的舆情监控、贷后的权重叠加。
风控模型的好坏如何评判呢?分类模型评价指标,常用的指标有,混淆矩阵、ROC曲线、AUC值、KS曲线以及KS值、Lift图、Gain图等,如下几个指标说明:
ROC:曲线可以用于评判一个模型好坏的标准,FPR(假正率)和TPR(真正率),ROC曲线坐标轴就是这两个值。
KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估,指标衡量的是好坏样板累计分布之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强;
GINI系数: 通过统计衡量坏账户数在好账户上的累计分布与随机分布曲线之间的面积,好账户和坏账户分布之间的差异越大,GINI指标越高,表明模型风险区分能力越强;
互金风控发展史
人工智能在互联网金融风控的应用,可以分为三个阶段:
机器学习(ML)阶段:即互联网金融为代表的金融机构全面渗透到所有模型建设中
自然语言处理(NPL)阶段:即国内大量互联网贷款和征信公司都在大量使用自然语言处理技术
知识图谱(KG)阶段:即大量使用知识图谱进行反欺诈分析。
1、机器学习(ML)阶段解决的核心问题在于,让风控模型自动学习、自动匹配各项数据,在模型内发现异常,揪出信用黑户。尤其是机器学习算法能够根据数百万消费者案例,如:资产、履约、身份、偏好、社会关系及借贷情况等进行开发和训练,利用算法评估预测用户是否会违约、是否会按时归还贷款等。
2、自然语言处理(NLP)阶段解决的问题则是可以在个人及企业主页、社交媒体中发现蕴含着与违约风险深度关联的深层含义,通过复杂的词向量模型将文本转化为计算机能够识别和计算的词向量表征,并基于深度学习技术对其进行特征提取,最终运用成熟的分类器网络将文本数据与违约风险实现高度的风险挂钩,而通过传统方式很难充分挖掘其风险价值。
3、知识图谱反欺诈(KG)分析恰恰是最重要的一个环节,因为知识图谱反欺诈需要把所有技术融合在一起,构建图谱,从中发现欺诈行为。这也是很多互联网金融公司目前在主攻的方向。
待续....
精彩回顾