DAY4 特征工程(上)

由于大概率不想跨行以及走回头路,老老实实开始研究码农的技术。开始固本培元,补充一下机器学习的基础知识。

主要知识点:

  1. 理解归一化原因
  2. 归一化的方式需要考虑的原始分布可能的属性
  3. 类别型特征可以使用二进制编码达到比one hot节约空间的目的

遗留问题:

  1. 其他编码方式可以学习一下
  2. 高维组合特征中矩阵分解的思想还不理解
  3. 决策树是如何直接处理字符串

学习路线:

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。