说说 Python 的 bisect 模块

bisect 模块包含两个主要函数( bisect 和 insort),它们内部利用二分查找算法,分别用于在有序序列中查找元素与插入元素。

bisect /baɪˈsekt/
to divide sth into two equal parts 对半分;二等分

1 bisect 函数

Luciano Ramalho 举了这样一个在干草垛中找针的示例来说明如何使用 bisect.bisect 与 bisect.bisect_left。

HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]
NEEDLES = [0, 1, 2, 5, 8, 10, 22, 23, 29, 30, 31]

ROW_FMT = '{0:2d} @ {1:2d}    {2}{0:<2d}'


def demo(bisect_fn):
    for needle in reversed(NEEDLES):
        position = bisect_fn(HAYSTACK, needle)
        offset = position * '  |'
        print(ROW_FMT.format(needle, position, offset))


if __name__ == '__main__':

    if sys.argv[-1] == 'left':
        bisect_fn = bisect.bisect_left
    else:
        bisect_fn = bisect.bisect

    print('DEMO:', bisect_fn.__name__)
    print('haystack ->', ' '.join('%2d' % n for n in HAYSTACK))
    demo(bisect_fn)

运行结果:

DEMO: bisect_right
haystack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |31
30 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |30
29 @ 13      |  |  |  |  |  |  |  |  |  |  |  |  |29
23 @ 11      |  |  |  |  |  |  |  |  |  |  |23
22 @  9      |  |  |  |  |  |  |  |  |22
10 @  5      |  |  |  |  |10
 8 @  5      |  |  |  |  |8 
 5 @  3      |  |  |5 
 2 @  1      |2 
 1 @  1      |1 
 0 @  0    0 

Python 函数的一个特点是可以把函数名作为入参,比如示例中的 bisect_fn。这样做让函数变得更加灵活,我们可以把函数名作为程序运行参数,动态加载。

HAYSTACK 是干草垛堆,NEEDLES 是针堆。在干草垛中找针,本质上是在已排好序的数列中,找某个数。

自定义的 demo(bisect_fn) 函数,首先算出 position,然后利用位置计算出需要几个分隔符号作为打印偏移量,最后按照定义好的格式打印出来。

str.format() 用于格式化字符串,它可以指定实参位置。类似 {0:2d} 的语法中的 0 表示第一个入参,:2d 表示总长度,如果不足,以空格作为占位符;d 表示十进制有符号整数。

str.format() 格式中还可以设定对齐方式。^、<、>分别表示居中、左对齐、右对齐。所以 {0:<2d} 表示第 1 个入参左对齐且占两位的十进制有符号整数。

__name__ 是 python 的内置类属性,存在于一个 python 程序中,代表对应程序名称。如果是主线程,那么它的内置名称就是 __main__

如果在运行程序时加上 left 参数,那么在程序自定义的函数内部就会调用 bisect_left 函数。bisect 函数其实是 bisect_right 函数的别名。

bisect_left 函数与bisect 函数之间的区别是:

  1. bisect_left 函数会返回原序列中跟被插入元素相等的元素位置,如果插入新元素,那么这个新元素会被放置在与它相等的元素前面
    2.bisect 函数会返回原序列中跟被插入元素相等的元素之后的位置,如果插入新元素,那么这个新元素会被放置在与它相等的元素后面

bisect_left 函数运行结果:

DEMO: bisect_left
haystack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |31
30 @ 13      |  |  |  |  |  |  |  |  |  |  |  |  |30
29 @ 12      |  |  |  |  |  |  |  |  |  |  |  |29
23 @  9      |  |  |  |  |  |  |  |  |23
22 @  9      |  |  |  |  |  |  |  |  |22
10 @  5      |  |  |  |  |10
 8 @  4      |  |  |  |8 
 5 @  2      |  |5 
 2 @  1      |2 
 1 @  0    1 
 0 @  0    0 

python 官方文档还举了一个利用 bisect 函数,来输出考试成绩的示例程序:

def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):
    i = bisect.bisect(breakpoints, score)
    return grades[i]

if __name__ == '__main__':
  results = [grade(score) for score in [33, 99, 77, 70, 89, 90, 100]]
    logging.info('results -> %s', results)

运行结果:

INFO - results -> ['F', 'A', 'C', 'C', 'B', 'A', 'A']

自定义的 grade() 定义了三个参数:

参数名 说明
score 考试分数
breakpoints 分数等级边界值;这里分为 5 档;90 及以上、80 ~ 89、70 ~ 79、60 ~ 69 以及 60 以下。
grades 评测分范围。

grade() 函数首先根据传入的分数,通过 bisect() 函数找出其所在位置,然后把这一位置传入 grades 序列得到评测分。

在主线程中,通过 for in 语法迭代表示学生成绩的序列,把成绩传入 grade() 函数计算出评测分,最后通过序列一次性输出。

2 insort 函数

因为排序是一项很耗时的工作,所以对于一个有序的序列来说,新增一个元素时,最好是仍然保持有序。 insort 函数在插入时,会确保这个序列始终有序。

    SIZE=10
    my_list=[]
    for i in range(SIZE):
        new_item=random.randrange(SIZE*3)
        bisect.insort(my_list,new_item)
        print('%2d -> '% new_item,my_list)

运行结果:

18 ->  [18]
 8 ->  [8, 18]
21 ->  [8, 18, 21]
 5 ->  [5, 8, 18, 21]
19 ->  [5, 8, 18, 19, 21]
13 ->  [5, 8, 13, 18, 19, 21]
20 ->  [5, 8, 13, 18, 19, 20, 21]
 4 ->  [4, 5, 8, 13, 18, 19, 20, 21]
15 ->  [4, 5, 8, 13, 15, 18, 19, 20, 21]
 2 ->  [2, 4, 5, 8, 13, 15, 18, 19, 20, 21]

randrange() 会返回给定入参范围内的随机数,但不包括边界值。

可以看到,每次插入时,序列始终保持有序。

print('%2d -> '% new_item,my_list) 采用了 %s 格式化语法,%2d 定义了 new_item 值的格式,而 my_list 会自动挂在格式之后。所以这里在第二个百分号之后没有加上括号,圈出需要格式化的参数。

insort 也有个兄弟叫 insort_left,底层使用的是 bisect_left。insort_left 函数会把新元素放置在与它相等的元素前面。


另外 bisect 函数与insort 函数,都有两个可选参数(lo 与 hi),利用它们可以缩小需要查找的序列范围。lo 的默认值是 0,hi 的默认值是序列的长度。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,036评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,046评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,411评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,622评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,661评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,521评论 1 304
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,288评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,200评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,644评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,837评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,953评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,673评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,281评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,889评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,011评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,119评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,901评论 2 355