线程是进程中执行运算的最小单位,是进程中的一个实体,是被系统独立调度和分派的基本单位,线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程,同一进程中的多个线程之间可以并发执行。
1、Windows下实现多线程
与python多进程类似,python的thread模块是比较底层的模块, python的threading模块对thread做了一些包装, 可以更加方便的被使用。
1、创建Thread类的线程对象
2、定义类,让其继承于Thread类,并重写其run(名称不能改)方法,创建定义的类的实例对象
在这种创建多线程的方法中,多个线程之间是并发执行的,要特别注意的是,Thread的子类在初始化时,一定要调用Thread.__init__(self)方法,因为在Thread类中,有一个内置的run方法,在对Thread类的对象进行初始化时,如果不给它的target参数赋值,即不指定子线程的操作内容方法,那么启动这个Thread对象时就会调用它继承来的run方法,因为我们重新定义了一个继承于Thread类的子类,并对继承来的run方法进行了重写,然而,这个子类Thd的__init__是设置了自己特有的属性,重写的run方法只有通过调用的Thread.__init__方法才能自动被调用,否则其无法执行。
从上述代码和执行结果我们可以看出, 多线程程序的执行顺序是不确定的。 当执行到sleep语句时, 线程将被阻塞( Blocked) , 到sleep结束后, 线程进入就绪( Runnable) 状态, 等待调度。 多线程调度算法将选择特定并发数量的个线程来执行。 上面的代码中只能保证每个线程都运行完整的run函数, 但是线程的启动顺序、run函数中每次循环的执行顺序都是不能确定的,与线程的调度算法有关。
总结:
1. 每个线程必定会有一个名字, 若没有指定线程对象的name, python就会自动为线程指定名字。
2. 当线程的run()方法结束时该线程完成。
3. 调度算法控制线程调度程序, 但可以通过别的方式来影响线程调度的方式。
4. 线程的几种状态:
2、多线程共享全局变量
在多进程中,对于全局变量的修改,父进程和子进程是互不影响的,因为子进程相当于对主进程进行了一个深拷贝,而在多线程中,一个子线程和与它同属于一个主线程的子线程之间是共享所有的主线程资源的,那么对于全局变量的修改,是互相受到影响的,因为它们相当于共享了一个引用,下面看一个例子:
可以看出,线程t1对全局变量num和lis分别进行了修改,等线程t1的操作完成后,启动线程t2发现线程t2中的num和lis受到了影响。在多个进程内的所有线程共享全局变量, 能够完成多线程之间的数据共享( 这点要比多进程好的多),但也存在缺点,即线程对全局变量的随意修改可能造成多线程之间全局变量的混乱( 线程非安全)。
3、进程与线程的比较
a、功能:进程和线程均能完成多任务,对于进程而言,比如在同一台电脑上能够同时运行多个QQ,对于线程而言,比如在同一个QQ中可以有多个聊天窗口。
b、定义的不同:进程是系统进行资源分配和调度的一个独立单位.,线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。
c、区别:一个程序至少有一个进程,一个进程至少有零个线程.。线程的划分尺度小于进程(资源比进程少), 使得多线程程序的并发性高。进程在执行过程中拥有独立的内存单元, 而多个线程共享内存, 从而极大地提高了程序的运行效率。线程不能够独立执行, 必须依存在进程中
d、优缺点:线程执行开销小, 但不利于资源的管理和保护; 进程正相反。