数据预处理之分箱操作

分箱离散化

一种无监督离散化方法

分为两类,1 等距离分箱 2 等频度分箱

等距离分箱即等宽度分箱,设有K个空间,则每个空间的间距 I=(Max-Min)/K

等频率分箱,即等深度分箱

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、引言 数据预处理的主要任务如下:(1)数据清理:填写空缺值,平滑噪声数据,识别,删除孤立点,解决不一致性(2)...
    文哥的学习日记阅读 6,739评论 0 11
  • 前提 在数据挖掘中,海量的原始数据中存在大量不完整(有缺失值)、不一致、有异常的数据,会严重影响到数据挖掘建模的执...
    神奇的考拉阅读 2,009评论 0 3
  • 小陈最近遇到这样的一个烦恼,他 万万没想到自己崇拜的偶像,他的顶头上司,竟然是一个两面人,这让他有点不知所策。 两...
    陈年不陈阅读 193评论 0 0
  • 早上的车水马龙,目不暇接。 旧城改造的步伐稳健有成,惠及每个见证者,譬如平坦宽阔的柏油路,譬如璀璨明亮的路灯。...
    风中幽兰阅读 175评论 0 0
  • 每当听到这五个字时,我都会忍不住鼻酸。当你喜欢一个人时,徘徊不定,犹豫不决,不知道怎么办时。谁是你的心药,给你最真...
    Change辛年阅读 329评论 0 0