层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树...

层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树...
背景 最近,妹子在搞风控相关的业务,所以去了解了下风控这块的经典模型:评分卡模型。整合下来,妹子总结了一套“风险类需求”挖掘框架,希望在大家对接风控类需求时,有一定的指引作用...
一.项目概述和目的 在现金贷业务中,主要面临两种风险:信用风险和欺诈风险. 信用风险主要是对借款人还款能力和还款意愿进行评估,从而决定放款金额的大小(也可以决定放款利率的大小...
1 基本风控信息 1.1 评分卡的分类: A卡(Application score card)申请评分卡 A卡一般可做贷款0-1年的信用分析,A卡中常用的有逻辑回归,AHP...
参考资料:cart决策树分箱法:https://blog.csdn.net/weixin_42097808/article/details/80172824IV及WOE详解:...
风险建模中的申请评分卡(A卡)实质是一种分类模型,常见的模型是逻辑回归(Logistic Regression model,LR)模型。分类模型常见的评测指标有以下几...
上回,妹子和大家讲过“画像类需求”的万能分析框架,它对应的是聚类任务。这次,妹子和大家介绍下“分类需求”的万能分析框架。同样,这个名字也是妹子自己起的,大家不用纠结,只是一类...
最近,妹子参与了一个团队项目,因为是团队合作,所以需要团队协同,毕竟有些项目不是一个人能搞定的。团队协同的好处简单来说,就是引入了更多的人,可以解决更复杂的问题。缺点就是每个...
今天,妹子给大家讲的是学习机器学习的“万能步骤”。用了这套学习步骤,妹子就算是看再晦涩难懂的模型,都不慌。 咱都知道成功的要素,要么是情商,要么是智商。但其实还有一种,那就是...
小伙伴们,妹子又来更新了。如题所述,妹子最近接了很多需求,但都可以归为一类,那就是“画像类需求”。以前,常听身边的同事抱怨,业务的需求是个无底洞,结束一个,又来一个,感觉自个...
hello,小伙伴们,好久不见啦。今天,咱来讲下积分这件事。为什么今天的主题是“积分”呢?对的,没有错,妹子今天接到了积分套利客群分析的任务。虽然现在还是疫情期,但也要为民族...
了解了神经网络家族核心成员后,咱来讲个解决手写数字分类的网络。首先,来看下这个任务的神经网络架构是怎么来的?神经网络架构中,我们知道,神经网络架构基础构成是输入层,包含输入神...
开始前,先介绍结果术语,算是给神经网络家族里的成员命名吧,毕竟和它们朝夕相处,用名字比用符号更亲切~哈哈 输入层:⽹络中最左边的称为输⼊层,其中的神经元称为输⼊神经元。 ...
疫情当前,在家也不能忘记学习。最近,我老是埋怨自己选专业时,为什么没有选择医护类专业,导致自己只能眼睁睁的看医护战士在一线战斗,自己却有心无力。转念一想,国家的发展是方方...
上篇回答了两个问题:一是数分人会不会被人工只能取代?答案是不会,因为人工只能现阶段只是工具,二数分人是项目pm,工具不肯能取代项目pm。二是数分人会不会被同样可以作为pm,...
上篇说,要详解数据分析师常用的分析模式案列。但着手写之前,总觉得缺少点什么,就像游戏开始前,没有了解游戏规则一样。作为数分人,首先要了解的不是方法,而是定位。你知道19年,...
刚踏入数据分析与挖掘领域的时候,整天只知道和数据打交道,按“教科书”上的流程进行输出。期间,业务对输出的晦涩提出各种质疑,自己也怀疑过岗位的价值与意义,想过退一步转底层开发...
互联网时代流量红利见顶,大厂们纷纷开始精耕流量,千人千面的推荐系统恰恰可以在流量粒度进行优化,从而提升用户与平台的交互频次,进而提升平台转化,营收。在互联网从事数据工作,不了...