(1)fork
fork是Linux、Mac、Unix中系统的一个底层接口(Windows没有),像C语言中可以直接使用fork来调用创建多进程。Python中在os模块中也存在fork的功能。
具体实现代码如下:
#coding=utf-8
import os
num = 100
p = os.fork()
if p == 0:
print('子进程pid=%s,ppid=%s,p=%s'%(os.getpid(),os.getppid(),p))
print(num)
num += 100
print(num)
elif p > 0:
print('父进程pid=%s,ppid=%s,p=%s'%(os.getpid(),os.getppid(),p))
print(num)
结果如下:
从结果中可以看到子进程的ppid对应的就是父进程的pid。而且全局变量num在这里是无法作为修改的。
通过fork中加入if判断也可以做到生成多个进程来控制。代码如下:
#coding=utf-8
import os
p = os.fork()
if p == 0:
print('子进程1,pid=%s,ppid=%s,p=%s'%(os.getpid(),os.getppid(),p))
elif p > 0:
print('父进程1,pid=%s,ppid=%s,p=%s'%(os.getpid(),os.getppid(),p))
p2 = os.fork()
if p2 == 0:
print('子进程2,pid=%s,ppid=%s,p2=%s'%(os.getpid(),os.getppid(),p2))
elif p2 > 0:
pass
#print('父进程2,pid=%s,ppid=%s,p2=%s'%(os.getpid(),os.getppid(),p2))
从这里可以看出使用fork这种非常底层的接口来完成进程的操作是比较复杂的。所以Python完成进程的操作一遍较多的使用multiprocessing
(2)multiprocessing
代码如下:
#coding=utf-8
from multiprocessing import Process
import os
from time import sleep
def run_prc(name,age,**kwargs):
print('子进程在运行中,name=%s,age=%s,pid=%s'%(name,age,os.getpid()))
print(kwargs)
sleep(0.5)
if __name__ == '__main__':
print('父进程pid=%s'%os.getpid())
p = Process(target = run_prc, args = ('test',18), kwargs = {'m':20})
print('子进程将要开始执行')
p.start()
sleep(1)
p.terminate()
p.join()
print('子进程结束')
通过使用multiprocessing中的Process可以更好的控制进程数,省去的是对于底层进程的管理,更好的控制程序的逻辑,而且multiprocessing是跨平台的,fork无法在Windows中使用
(3)进程池
当使用fork时,会分出一个同时出现两个进程,这两个进程会保存当时程序进行到某一时刻点的数据状态。这样就会造成一个问题,假如用户请求的非常多,为了满足用户的请求,会使用Process创建多个进程,这样就会造成内存极大的占用,进程多了,也会造成CPU轮换进程速度的降低。从而出现性能瓶颈。所以这里采用了一个叫做进程池的方式来解决这个问题,进程池类似于人过河,假设有10个人要渡河,目前没法及时造出10艘船,可以先用现有的3艘船来轮番渡河。
举例代码如下:
#coding=utf-8
from multiprocessing import Pool
import os,time
def work(i):
t_start = time.time()
print('用户%s上传过河'%i)
t_stop = time.time()
print('耗时%0.9fs'%(t_stop-t_start))
#在进程池中初始化3个进程
po = Pool(3)
for i in range(1,11):
#分配10个任务
po.apply_async(work,(i,))
print('进程开始')
po.close()#表示关闭,不再接受新的任务
po.join()
print('进程结束')