IP属地:广西
只是初步了解如何使用决策树算法,对泰坦尼克号灾难还可以继续深挖下去。
01. 数据来源及说明 所提供数据来自拍拍贷真实业务数据,从2015-01-01到2017-01-30的所有信用标的10%sample样本。数据...
数据清洗规则总结为以下4个关键点,统一起来叫“完全合一” 完整性:单条数据是否存在空值,统计的字段是否完善。 全面性:观察某一列的全部数值,比如...
用户画像的准则 首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。 首先,要设计唯一标识? 用户唯一标识是整个...
分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART 聚类算法:K-Means,EM 关联分析:...
项目数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649 这个数据包含了2...
有个大客户买了80995,这是导致数据异常的原因
01. 数据来源及说明 背景简介: 英国注册的非商店在线零售的所有交易,该公司主要销售独特的全时礼品。公司的许多客户都是批发商。 数据来源: 数...
如无意外,计划在6个月时间内:整合从数据分析到机械学习,进行系统化,既可以将自己所学进行系统处理和升级,也可以做一个近乎免费的课程。 数据分析的...