提升你的洞察的最好方法之一是通过可视化你的数据:这样,你可以更容易地识别模式,掌握到困难的概念以及注意到关键的要素,当你使用数据科学中的Python时,你很有可能已经用了Ma...
IP属地:贵州
提升你的洞察的最好方法之一是通过可视化你的数据:这样,你可以更容易地识别模式,掌握到困难的概念以及注意到关键的要素,当你使用数据科学中的Python时,你很有可能已经用了Ma...
只是初步了解如何使用决策树算法,对泰坦尼克号灾难还可以继续深挖下去。
01. 数据来源及说明 所提供数据来自拍拍贷真实业务数据,从2015-01-01到2017-01-30的所有信用标的10%sample样本。数据集包含LC.csv(标的特征表...
数据清洗规则总结为以下4个关键点,统一起来叫“完全合一” 完整性:单条数据是否存在空值,统计的字段是否完善。 全面性:观察某一列的全部数值,比如在Excel表中,选中一列,可...
用户画像的准则 首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。 首先,要设计唯一标识? 用户唯一标识是整个用户画像的核心。以一个App为...
分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART 聚类算法:K-Means,EM 关联分析:Apriori 连接分析:Pa...
项目数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649 这个数据包含了2017年11月25日至2017...
有个大客户买了80995,这是导致数据异常的原因
01. 数据来源及说明 背景简介: 英国注册的非商店在线零售的所有交易,该公司主要销售独特的全时礼品。公司的许多客户都是批发商。 数据来源: 数据集来自UCI加州大学欧文分校...
如无意外,计划在6个月时间内:整合从数据分析到机械学习,进行系统化,既可以将自己所学进行系统处理和升级,也可以做一个近乎免费的课程。 数据分析的大致如下: 1、数据分析职业生...