Python的并发编程(六)- 多进程

之前学习了多线程以及线程池,他们在执行I/O密集的程序的时候,性能是很高的,但是如果我们有大量的CPU密集型工作的程序,现在想利用多个CPU的优势运行的更快,应该怎么解决呢?

这时候,就不能使用多线程了,而是需要真正的并行来解决问题。

concurrent.futures库中提供了一个ProcessPoolExecutor类,可用来在单独运行的python解释器实例中执行计算密集的函数。

ProcessPoolExecutor的典型用法是下面这样的:

from concurrent.futures import ProcessPoolExecutor

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """

在底层,ProcessPoolExecutor创建了N个独立运行的Python解释器,这里的N就是系统上检测到的可用的CPU个数。可以创建和修改Python的进程数,只要给ProcessPoolExecutor(N)提供一个可选的参数。进程池会一直运行,直到with语句块中的最后一条语句执行完毕为止,此时进程池就会关闭。但是程序会一直等待所有已经提交的任务都处理完毕为止。

提交到进程池中的任务必须定义为函数形式。有两种方法可以提交任务。如果想并行处理一个列表推导式或者map()操作,可以使用pool.map()

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

data = [1, 2, 3, 4]

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    results = pool.map(work, data)

另一种方式是通过pool.submit()来手动提交单独的任务:

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

data = 1

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    future_result = pool.submit(work, data)
    result = future_result.result()

如果手动提交任务,得到的结果就是一个Future实例。要获取到结果还需要手动调用result()方法。这么做会阻塞进程,直到结果返回为止。所以与其让进程阻塞,不如提供一个回调函数,让他执行任务完成时出发执行。示例如下:

from concurrent.futures import ProcessPoolExecutor

def work(x):
    """任务逻辑"""
    return x

def when_done(r):
    print("result:", r.result())

data = 1

with ProcessPoolExecutor() as pool:
    """
    在进程池pool中并行执行任务
    """
    future_result = pool.submit(work, data)
    future_result.add_done_callback(when_done)

用户提供的回调函数需要接受一个Future实例,必须用他才能获取实际的结果。

尽管进程池看起来很简单,但是在设计规模更大的程序时有下面几个重要的因素需要考虑。

  • 这种并行处理的技术只适用于可以将问题分解成各个独立部分的情况。
  • 任务必须定义成普通函数来提交。实例方法,比包或者其他类型的可调用对象都是不支持并行处理的。
  • 函数的参数和返回值必须可兼容pickle编码。任务的执行是在单独的解释器进程中完成的。这中间需要进程间通信。因此,在不同的解释器之间交换数据必须要进行序列化处理。
  • 提交的工作函数都不应该维护持久的状态或者带有副作用。除了简单的日志功能,一旦子进程启动,将无法控制他的行为。因此,为了让思路保持清晰,最好让每件事情都保持简单,让任务在不会修改执行环境的纯函数中执行。
  • 进程池是通过调用UNIX上的fork()系统调用来创建的。这么做会克隆一个Python解释器,在fork()时会包含所有的程序状态。在windows上,这么做会加载一个独立的解释器拷贝,但不包含状态。克隆出来的进程在首次调用pool.map()或者pool.submit()之前不会实际运行。
  • 既然是克隆一个独立的解释器,那每个进程都可以再执行线程。当进程池和多线程技术结合在一起使用的时候需要格外的小心。特别是,很可能我们应该在创建任何线程之前优先创建并加载进程池(例如,当程序启动时在主线程中创建进程池)。

本文最先发布于:SavingUnhappy

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351

推荐阅读更多精彩内容