进程和线程
进程
进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,是程序在执行过程中分配和管理资源的基本单位,每一个进程都有一个自己的地址空间和内存空间,至少有 5 种基本状态,它们是:初始态,执行态,等待状态,就绪状态,终止状态。
线程
线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。
线程必须依附于进程存在,每个进程中必定会存在一个线程,也就是说每个进程中实际负责执行任务的还是线程.
进程与线程的区别
- 进程是系统进行资源分配和调度的一个独立单位。线程是进程的一个实体,是CPU调度和分派的基本单位。线程自己基本上不拥有系统资源,但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。由于线程比进程更小,基本上不拥有系统资源,线程上下文切换比进程上下文切换要快得多,故对它的调度所付出的开销就会小得多,从而显著提高系统资源的利用率和吞吐量
- 一个程序至少有一个进程,一个进程至少有一个线程。进程在执行过程中拥有独立的内存单元地址空间,而多个线程共享内存,从而极大地提高了程序的运行效率。
- 进程间通信IPC需要特别的方法,线程间可以直接读写进程数据段(如全局变量)来进行通信。
线程共享的环境
- 进程代码段
- 进程的公有数据(利用这些共享的数据,线程很容易的实现相互之间的通讯)
- 进程打开的文件描述符、信号的处理器、进程的当前目录和进程用户ID与进程组ID
各线程独立的资源
- 线程ID:每个线程都有自己的线程ID,这个ID在本进程中是唯一的。进程用此来标识线程。
- 由于线程间是并发运行的,每个线程有自己不同的运行线索,当从一个线程切换到另一个线程上 时,必须将原有的线程的寄存器集合的状态保存,以便将来该线程在被重新切换到时能得以恢复
- 堆栈是保证线程独立运行所必须的。线程函数可以调用函数,而被调用函数中又是可以层层嵌套的,所以线程必须拥有自己的函数堆栈, 使得函数调用可以正常执行,不受其他线程的影响
为什么需要设计线程
设计线程的目的是为了并发,尽可能的使硬件的利用率高,因为比起进程之间的切换,线程之间的切换效率更高。
既然如此,那为什么不直接把进程砍掉,全部换成线程呢.这里又设计到一个隔离.线程切换效率高的原因是因为数据共享,如果没有进程的隔离,在线程执行完,系统需要回收资源的时候,就很容易影响到别的线程的正常执行.
所以才有进程与线程的共存.进程负责隔离,线程负责并发。
并发与并行
并发
当有多个线程在操作时,如果系统只有一个CPU,则它根本不可能真正同时进行一个以上的线程,它只能把CPU运行时间划分成若干个时间段,再将时间 段分配给各个线程执行,在一个时间段的线程代码运行时,其它线程处于挂起状。这种方式我们称之为并发。
并行
当系统有一个以上CPU时,则线程的操作有可能非并发。当一个CPU执行一个线程时,另一个CPU可以执行另一个线程,两个线程互不抢占CPU资源,可以同时进行,这种方式我们称之为并行。
简单来说,并发指的是同一时间间隔同时发生的,并行则是同一时刻同时发生的,两则最大的差别在于时间颗粒度的定义,如果只有一个CPU核心存在,在微观的定义下,只可能存在并发,不可能存在并行,哪怕每个线程执行的时间间隔很短,但是同一时刻只存在一个线程执行.