2019-02-22 连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?

1. https://www.zhihu.com/question/31989952/answer/54184582

 2. https://blog.csdn.net/u010358304/article/details/80693541




连续特征离散化的基本假设,是默认连续特征不同区间的取值对结果的贡献是不一样的。

所以希望连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征。常用做法,就是先对特征进行排序,然后再按照等频离散化为N个区间.


无监督方法: 分箱法直观划分. 分箱法又分为等宽分箱法和等频分箱法

有监督方法: 

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容