Python multiprocess——多进程加速

1. 前言

现在cpu动不动就是6核12进程,计算能力越来越强?当时我们真的都用上了么?在跑python代码时,请打开你的后台监控,看看python的CPU占比。如果不做特殊处理(排除你调用的库),很有可能你的代码只能占用100%,也就是一个进程,资源利用率低下。

还有另外一个故事,当你的计算复杂度很高的时候,比如处理某些大文件,如果你只用一个进程,很有可能得跑24小时,为了加速,你就得想办法把你的计算资源用起来,想办法并行运算。那么python什么库是来帮助我们进行并行计算的呢?

有请我们的multiprocess同学来发表获奖感言,“感谢cctv,感谢铁岭tv...”

2. multiprocess详解

multiprocess提供了两个类来实现多进程计算

2.1 Process

  • 初始化 ,__init__(self, group=None, target=None, name=None, args=(), kwargs={}) 其中group分组,通常不用;target是要执行的函数;name名称;args表示给函数传递的参数

def do(i):

    print(f"我是进程小{i} 我为自己带盐!")

for i in range(3):

    p = Processor(target=do, args=(i, ), name=f"work_{I}")

    p.start()

  • 参数共享,python每次开启一个子进程,通常是把数据复制到子进程,不同进程之间没有参数共享。mutliprocess提供了一些类来实现参数共享,包括Array、Manager和Queue。个人在进行人文分类任务时,读取大训练集合的时候喜欢用到Queue来实现参数共享,参考一下代码[1] 。

import multiprocessing

from multiprocessing import Process

from multiprocessing import Queue

def func(i, q):

    ret = q.get()

    print("进程%s从队列里获取了一个%s,然后又向队列里放入了一个%s" % (i, ret, i))

    q.put(i)

if __name__ == "__main__":

    lis = Queue(20)

    lis.put(0) # 往lis中压入

    for i in range(10):

        p = Process(target=func, args=(i, lis,))

        p.sta

使用Queue的优势,制定一个有限长队列,消费完成后可以销毁,这样内存消耗就有限,遇到几百G大的训练数据,可以不用一次性加载,但是因为要并行,可以通过多进程把部分读如队列里面,然后你进行多进程消费。

2.2 Pool (进程池)

进程池方法是个人最早接触的方法,感觉特别简单,你只要开启进程池,然后借助map方法,分分钟实现多进程。


from multiprocess import Pool

def do(name):

    print(f"hello {name}")

name_list = ["liming", "hanmeimei", "xiaogang"]

pool = Pool(3) # 制定要开启的进程数, 限定了进程上限

pool.map(do, name_list)

pool.close()

pool.join()

是不是很简单,除了map方法,Pool还有apply、apply_async 、map_async方法,不一一解说,大家可以参考[2、3]。

写在最后

当你的代码慢到阻碍你幸福生活的时候,请想办法加速!如果你用的是python,请记起你的老朋友——multiprocess!

名词解释

  • 同步,调用方和被调用方结果一起返回

  • 异步,调用方返回但是被调用方结果还没有返回

  • 阻塞,阻塞调用是指调用结果返回之前,当前线程会被挂起

  • 非阻塞,非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程

参考

  1. https://www.liujiangblog.com/course/python/82 (Process)

  2. https://www.cnblogs.com/ailiailan/p/11850710.html (multiprocessing.Pool)

  3. https://www.cnblogs.com/nickchen121/p/11130258.html (multiprocessing.Pool)

  4. https://www.cnblogs.com/loveer/p/11479249.html

  5. https://www.zhihu.com/question/19732473

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,539评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,594评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,871评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,963评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,984评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,763评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,468评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,357评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,850评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,002评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,144评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,823评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,483评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,026评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,150评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,415评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,092评论 2 355