Python多进程

Python多进程

Python中进程创建方式有两种:

  1. fork:使用Python提供的os模块。
pid = os.fork();
pid即为创建出的子进程

Python在创建进程时会返回两次;一般方法只返回一次,Python分别在子进程、父进程中分别返回创建出的进程的ID。

Unix/Linux操作系统提供了一个fork()系统调用,它非常特殊。普通的函数调用,调用一次,返回一次,
但是fork()调用一次,返回两次,因为操作系统自动把当前进程(称为父进程)复制了一份(称为子进程),
然后,分别在父进程和子进程内返回。

子进程返回的ID一直为0

父进程返回的ID则是创建出的进程ID,父进程会保存该ID。

pid = os.fork();
if pid == 0:
    print('我是子进程我的编号是%1s,我的父进程的编号是%2s' % (os.getpid(), os.getppid()))
else:
    print('我是父进程我的编号是%1s,我刚刚创建了一个子进程,编号是%2s' % (os.getpid(), pid))

输出结果:

我是子进程我的编号是12688,我的父进程的编号是12687
我是父进程我的编号是12687,我刚刚创建了一个子进程,编号是12688

2.使用multiprocessing模块提供的Process、Pool 动态批量创建进程

为什么又要提出一个multiprocessing模块创建进程,单单fork不就OK。

因为。。。因为windows不支持直接fork进程。<font color = red >(划重点,这个要考)</font>而linux/Unix系列支持。(所以,人生苦短,使用mac学习Python)

使用Process创建也很简单。

# 使用process对象进行创建进程

def run_proc(name):
    print('创建进程的名字为%s' % (name))


if __name__ == '__main__':
    print('-----------------------')
    print('创建子进程的父进程ID是%s' % (os.getpid()))
    #run_proc 是进程需要执行的任务的方法名
    #args 是run_proc方法需要的参数
    p = Process(target=run_proc, args=('test',))
    p.start()
    p.join()
    print('执行完了')

运行结果:

-----------------------
创建进程的名字为test
执行完了

创建成功之后,直接<font color= red>p.start()</font>

<font color = red >p.join()</font>用作进程同步(线程中也要用到这个方法)。意为进程此时等待,直到子进程执行完,再继续执行后续代码。

这样就实现了创建进程的代码。很清晰,很清晰,很简单。

接下来,就要进入高级的多进程创建了。

Pool

如果你有多进程的需求,就不要使用上述一个一个的创建了,

使用multiprocessing提供的Pool进程池进行多进程的创建。安全,文明,优雅。

from multiprocessing import Pool
import os, time, random

def long_time_task(name):
    print('Run task %s (%s)...' % (name, os.getpid()))
    start = time.time()
    time.sleep(random.random() * 3)
    end = time.time()
    print('Task %s runs %0.2f seconds.' % (name, (end - start)))


if __name__ == '__main__':
    print('Parent process %s.' % os.getpid())
    p = Pool(2)
    for i in range(5):
        p.apply_async(long_time_task, args=(i,))
    print('Waiting for all subprocesses done...')
    # 必须要先进行close,然后才能进行join()
    p.close()
    p.join()
    print('All subprocesses done.')

执行结果:


Parent process 12917.
Waiting for all subprocesses done...
Run task 0 (12920)...
Run task 1 (12921)...
Waiting for all subprocesses done...
Run task 0 (12922)...
Run task 1 (12923)...
Task 1 runs 0.29 seconds.
Run task 2 (12923)...
Task 1 runs 0.96 seconds.
Run task 2 (12921)...
Task 0 runs 1.01 seconds.
Run task 3 (12920)...
Task 2 runs 1.03 seconds.
Run task 4 (12921)...
Task 3 runs 1.17 seconds.
Task 0 runs 2.22 seconds.
Run task 3 (12922)...
Task 2 runs 2.13 seconds.
Run task 4 (12923)...
Task 4 runs 1.87 seconds.
All subprocesses done.

直接使用p = Pool(2)创建一个进程数为2的进程池。

p.apply_async(long_time_task, args=(i,))

将待执行的任务与进程绑定<font color = red >apply_async</font>。

p.close():
对Pool对象调用join()方法会等待所有子进程执行完毕,
调用join()之前必须先调用close(),
调用close()之后就不能继续添加新的Process了。

项目源码

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容