进程的创建-fork
进程VS程序
编写完毕的代码,在没有运行的时候,称之为程序
正在运行着的代码,就成为进程
进程,除了包含代码以外,还有需要运行的环境等,所以和程序是有区别的
fork()
Python的os模块封装了常见的系统调用,其中就包括fork,可以在Python程序中轻松创建子进程:
说明:
·程序执行到os.fork()时,操作系统会创建一个新的进程(子进程),然后复制父进程的所有信息到子进程中
·然后父进程和子进程都会从fork()函数中得到一个返回值,在子进程中这个值一定是0,而父进程中是子进程的id号
在Unix/Linux操作系统中,提供了一个fork()系统函数,它非常特殊。
普通的函数调用,调用一次,返回一次,但是fork()调用一次,返回两次,因为操作系统自动把当前进程(称为父进程)复制了一份(称为子进程),然后,分别在父进程和子进程内返回。
子进程永远返回0,而父进程返回子进程的ID。
这样做的理由是,一个父进程可以fork出很多子进程,所以,父进程要记下每个子进程的ID,而子进程只需要调用getppid()就可以拿到父进程的ID。
getpid()、getppid()
多进程修改全局变量
总结:
·多进程中,每个进程中所有数据(包括全局变量)都各有拥有一份,互不影响
多次fork问题
multiprocessing
如果你打算编写多进程的服务程序,Unix/Linux无疑是正确的选择。由于Windows没有fork调用,难道在Windows上无法用Python编写多进程的程序?
由于Python是跨平台的,自然也应该提供一个跨平台的多进程支持。multiprocessing模块就是跨平台版本的多进程模块。
multiprocessing模块提供了一个Process类来代表一个进程对象,下面的例子演示了启动一个子进程并等待其结束:
说明
·创建子进程时,只需要传入一个执行函数和函数的参数,创建一个Process实例,用start()方法启动,这样创建进程比fork()还要简单。
·join()方法可以等待子进程结束后再继续往下运行,通常用于进程间的同步。
Process语法结构如下:
Process([group [, target [, name [, args [,kwargs]]]]])
·target:表示这个进程实例所调用对象;
·args:表示调用对象的位置参数元组;
·kwargs:表示调用对象的关键字参数字典;
·name:为当前进程实例的别名;
·group:大多数情况下用不到;
Process类常用方法:
·is_alive():判断进程实例是否还在执行;
·join([timeout]):是否等待进程实例执行结束,或等待多少秒;
·start():启动进程实例(创建子进程);
·run():如果没有给定target参数,对这个对象调用start()方法时,就将执行对象中的run()方法;
·terminate():不管任务是否完成,立即终止;
Process类常用属性:
·name:当前进程实例别名,默认为Process-N,N为从1开始递增的整数;
·pid:当前进程实例的PID值;