python实用小技之数据结构

本文大多数例子搬自 python cookbook 这里是对学习的一个总结和提炼

ps:python版本为python3

1.解压序列赋值给多个变量

# 有一个包含 N 个元素的元组或者是序列,怎样将它里面的值解压后同时赋值给 N 个变量?

data = ['ACME', 50, 91.1, (2012, 12, 21)]

# 任何的序列(或者是可迭代对象)可以通过一个简单的赋值语句解压并赋值给多个变量

# 变量的数量必须跟序列元素的数量是一样的

name, shares, prices, date = data

print(name, shares, prices, date, sep=" | ", end="\n")

# 如果只需要一部分,可以给个占位变量如

_, sha, pr, _ = data

print(sha,pr,sep=' | ')

运行结果:

ACME | 50 | 91.1 | (2012, 12, 21)

50 | 91.1

2.解压可迭代对象赋值给多个变量

# 解压可迭代对象赋值给多个变量

def drop_frist_last(grades):

    frist, *middle, last = grades

    return sum(middle) / len(middle)

print(drop_frist_last([0, 60, 70, 80, 100]))

# 有时候,你想解压一些元素后丢弃它们,可以使用 比如 _ 或者 ign

record = ('ACME', 50, 123.45, (12, 18, 2012))

name,*_,(*_,year) = record

print(name,year)

运行结果:

70.0

ACME 2012

3.保留有限的历史记录

'''

使用 deque(maxlen=N) 构造函数会新建一个固定大小的队列。当新的元素加入并且这个队列已满的时候, 最老的元素会自动被移除掉

'''

def search(lines, pattern, histroy=60):

    previous_lines = deque(maxlen=histroy)

    for line in lines:

        if pattern in line:

            yield line, previous_lines

            previous_lines.append(line)

            print(len(previous_lines))

            for item in previous_lines:

                print(item)

if __name__ == "__main__":

    with open(os.getcwd() + "/Lesson1.py") as f:

        for line, prevlines in search(f, '50', 3):

            print("type prevlines =", type(prevlines))

            for pline in prevlines:

                print('pline = ', pline, end='')

            print("type line =", type(line))

            # print('line = ', line, end='')

            print('-' * 20)

#           

4.怎样从一个集合中获得最大或者最小的 N 个元素列表?

# 当集合是一个列表是

nums = [3, 10, 5, 23, 7, -4, 18, 23, 42, 37, 2]

print(heapq.nlargest(3, nums))

print(heapq.nsmallest(3, nums))

# 如果是更负责的对象时候

mydirt = [

    {'name': 'IBM', 'shares': 100, 'price': 91.1},

    {'name': 'AAPL', 'shares': 50, 'price': 543.22},

    {'name': 'FB', 'shares': 200, 'price': 21.09},

    {'name': 'HPQ', 'shares': 35, 'price': 31.75}]

print(heapq.nlargest(2, mydirt, key=lambda l: l['price']))

print(heapq.nsmallest(2, mydirt, key=lambda l: l['price']))

运行结果

[42, 37, 23]

[-4, 2, 3]

[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]

[{'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]

ps:堆数据结构最重要的特征是 heap[0] 永远是最小的元素,另外 nlargest,nsmallest 适合查找的元素个数相对比较小的时候,如果你仅仅想查找唯一的最小或最大(N=1)的元素的话,那么使用 min() 和 max() 函数会更快些。 类似的,如果 N 的大小和集合大小接近的时候,通常先排序这个集合然后再使用切片操作会更快点 ( sorted(items)[:N] 或者是 sorted(items)[-N:] )

5.字典排序

'''

你想创建一个字典,并且在迭代或序列化这个字典的时候能够控制元素的顺序。

'''

from collections import OrderedDict

d = OrderedDict()

d['foo'] = 1

d['beer'] = 2

d['bar'] = 4

d['park'] = 3

for key in d:

    print(key, d[key])

执行结果:

foo 1

beer 2

bar 4

park 3

6.字典中的键映射多个值

from collections import defaultdict

df_d = defaultdict(list)

df_d['a'].append(1)

df_d['a'].append(2)

df_d['b'].append(4)

print(df_d)

d2 = defaultdict(set)

pairs = [('a', 1), ('a', 2), ('b', 4)]

for key, value in pairs:

    d2[key].add(value)

print(d2)

运行结果:

defaultdict(<class 'list'>, {'a': [1, 2], 'b': [4]})

defaultdict(<class 'set'>, {'a': {1, 2}, 'b': {4}})

7.字典的运算(求最小值、最大值、排序等)

prices = {

    'ACME': 45.23,

    'AAPL': 612.78,

    'IBM': 205.55,

    'HPQ': 37.20,

    'FB': 10.75

}

# 求最小值

# 方法 1,通过zip 函数创建的是一个只能访问一次的迭代,将键值反过来

print(min(zip(prices.values(), prices.keys())))

# 输出 (10.75, 'FB')

# 方法二 直接取values 获取最小值,不过你就不知道对于的key

print(min(prices.values()))

# 输出 10.75

# 方法三

min_key = min(prices, key=lambda k: prices[k])

print(prices[min_key])

# 输出 FB

# 排序

prices_sorted = sorted(zip(prices.values(), prices.keys()))

print(prices_sorted)

# 输出 [(10.75, 'FB'), (37.2, 'HPQ'), (45.23, 'ACME'), (205.55, 'IBM'), (612.78, 'AAPL')]

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容