《数据分析实战45讲》笔记


在数据挖掘中,有几个非常重要的任务,就是分类、聚类、预测和关联分析。它是我们进行数据分析的目的。

完成这些任务的流程是这样的:

一、准备阶段

1、输入数据:

2、数据预处理:

1、数据清洗

2、数据集成

3、数据变换

3、特征选择

标签化就是数据的抽象,特征的选择,用户画像就是特征的选择,我们以用户画像为例。

①、首先要设计唯一标识

②、为用户打标签(数据层标签)

③、为用户打标签(算法层标签)

      也就是模型层的标签,这个用户画像类型的标签。

④、为用户打标签(业务层标签)

      也就是预测标签,与业务的关联,也就是预测什么样的业务能够与什么样的用户产生什么样的结果。

【PS:推荐系统 - 简书

一、3特征选择

二、分析阶段


【PS:请参考《人工智能--一种现代的方法》《终极算法》 - 简书

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 作者 | HCY崇远 01 前言 本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的...
    daos阅读 5,698评论 0 77
  • 数据挖掘的知识清单 数据挖掘的基本流程: 1.商业理解:数据挖掘不是目的,我们的目的是更好地帮助业务。所以第一步要...
    stagger_xu阅读 1,600评论 0 4
  • 每天进步一点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点~~从开始只能写几句话、模仿别人的观点,到现...
    一个帅气的名字呀阅读 18,245评论 4 31
  • 这个题目想了很久,一直纠结该不该用。这个世界太多太多关于成功方面的经验是人们觉得成功更值得关注,而失败了就...
    水水木木鸡阅读 196评论 0 0
  • 朝着心的方向,大吉不会偏航!可是,今天大吉有些退缩了,因为小倪表现出来的能力让大吉很自卑,如果不能比她强,那么还有...
    BelovedNY阅读 160评论 0 0