混淆矩阵(Confusion Matrix),也叫误差矩阵,是分类模型中常见的概念,在风控领域,我们常用「准确率」、「覆盖率」来衡量策略和模型的...
最近半年一直在尝试从复杂的关系网络中,挖掘可能从事某种恶意的团伙,比如在交易数据中挖掘潜在可疑交易的诈骗团伙等。在对全网的复杂网络分团后,面临一...
目标管理是管理学的一个概念,即很多企业强调的“目标导向”和“结果导向”,高层制定战略目标,中层制定中级目标,基层制定初级目标,执行层给出执行方案...
IV值(Information Value),即信息价值指标,是评分卡模型中的一个常见指标,在金融风控领域得到了广泛的应用,尤其是在特征选择的场...
鸢【音:yuān】尾花(Iris)是单子叶百合目花卉,是一种比较常见的花,可能不经意间你就能在某个公园里碰见它,而且鸢尾花的品种较多。如果逛公园...
决策树是一种非参数的监督学习方法,可用于分类和回归的应用中。旨在通过数据学习出简单的决策规则来创建模型,进而预测和判定目标变量的结果。 ** 决...
在学习决策树的时候,我们知道,其一大特点是:寻找最佳的决策树是NP完成问题。什么是NP完全问题,决策树的这一特点又是什么意思? 什么是NP完全问...
上图是IBM Watson的首席技术专家Swami Chandrasekaran编撰的数据科学家地铁图,可以说是数据科学家的技能修炼指南,分享出...
过年回家,免不了会被亲人问起,你是做什么的?作为一个数据技术从业者,面对没怎么接触过电脑,对电脑使用都不太熟悉的亲人,每次回答:程序员,软件工程...