由于大概率不想跨行以及走回头路,老老实实开始研究码农的技术。开始固本培元,补充一下机器学习的基础知识。 主要知识点: 理解归一化原因 归一化的方式需要考虑的原始分布可能的属性 类别型特征可以使用二进制编码达到比one hot节约空间的目的 遗留问题: 其他编码方式可以学习一下 高维组合特征中矩阵分解的思想还不理解 决策树是如何直接处理字符串 学习路线: image.png