python 自定义划分区间,并把各区间合并

最近在做分箱统计时,想把一些点给设为参数,方便之后调整。

用到的函数cut


import numpy as np

def cus_cut_1(low_threshole, up_threshole, bins):

    """

    个性化划分:

    low_threshole:要均匀划分数据的下界

    up_threshole:要均匀划分数据的上界

    bins: 在上下界之间的等分数

    """

    bin_0 = pd.IntervalIndex.from_tuples([(0, low_threshole)])                      # 0-下界

    bin_1 = pd.interval_range(start=low_threshole, end=up_threshole, periods=bins)  # 下界-上界均分

    bin_2 = pd.IntervalIndex.from_tuples([(up_threshole, 1)])                        # 上界-1

    return bin_0, bin_1, bin_2


bin_0, bin_1, bin_2 = cus_cut_1(0.2,0.8,5)

bin_0 = bin_0.tolist()

bin_1 = bin_1.tolist()

bin_2 = bin_2.tolist()

bin_0.extend(bin_1)                  # 把各区间的list拼接起来

bin_0.extend(bin_2)

ii = pd.IntervalIndex(bin_0)          # 转为区间

print(ii)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 特征工程(feature engineering):利用领域知识和现有数据,创造出新的特征,用于机器学习算法;可以...
    rowcolumn阅读 723评论 2 1
  • 一、分析背景 电商平台的发展取决于用户。电商平台如何让用户点击里面的内容,就是留住用户的第一步。电商平台的首页往往...
    我姓许啊阅读 1,583评论 0 0
  • 数据预处理包括数据的清洗、合并、重塑与转换,解决数据缺失、极端值、数据格式不统一等问题,本文通过介绍Pandas中...
    小哲1998阅读 3,001评论 0 3
  • pandas 数据分析【转】 frompandasimportSeries, DataFrameimportpan...
    gongdiwudu阅读 1,334评论 0 1
  • 之前一直没有实践评分卡模型,今天从网上看到有相关的代码,先保存下,后续需要再细看。 https://blog.cs...
    丙吉阅读 1,232评论 0 0