进程和线程的基本概念
进程(Process)就是一个应用程序在处理机上的一次执行过程,它是一个动态的概念,而线程(thread)是进程中的一部分,进程中包含了多个线程在运行。对于移动端来说,你可以把不同的手机应用当成多个进程,而把每个应用这一进程中执行的网络请求/图片加载等操作当作多个线程来看待。
- 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的一个独立单位。
- 线程是进程的一个实体, 是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源(如虚拟地址空间、文件描述符等)。
- 一个线程可以创建和撤销另一个线程,同一个进程中的多个线程之间可以并发执行。
进程和线程的主要差别在于它们是不同的操作系统资源管理方式。进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序 健壮,但在进程切换时,耗费资源较大,效率要差一些。但对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。
多线程编程
我们都知道在代码运行过程中,最终会变为机器可理解的二进制代码,但是一个cpu一次只能执行一个命令,就如下图所示:
但是对于多处理器和多核计算机来说,利用多线程的程序将一个进程分解为若干个线程,可以在某个线程和其他线程之间反复多次的进行上下文切换,从而实现切换执行cpu命令列,因此看上去就好像1个cpu能够并发执行多个线程一样。而对于真正具有多个cpu的机器来说,多个cpu可以在同时执行命令,是在真正意义上提供了多个cpu以并发执行多个线程任务的功能,有效地利用了多处理器的特性,从而就能提高整个进程的执行速度。而这种做法也就是我们常说的多线程编程。
但是实际上,在多线程编程中容易发生各种问题。比如多个线程更新相同的资源会导致数据不一致(数据竞争)/停止等待事件的线程会导致多个线程相互循环等待(死锁)/使用过多线程会造成内存的大量消耗等一些列的问题。
但是尽管有这么多问题,我们依然要使用多线程编程,这样才能充分利用多处理器的优势提升响应效率,以保证应用程序的相应性能。相对于避免使用多线程编程来说,我们开发者更需要做的是掌握怎样在开发过程中避免上述问题的发生。我们可以对重要数据的读取加锁,使用过程中避免两个或多个线程相互等待,对数据或资源加锁要避免低优先级卡顿高优先级任务的执行,避免创建过多无用的线程,等等解决办法,但是因噎废食,并不可取。
Q&A
一个复杂的计算应该用进程还是线程?
从上述介绍可知,如果你的这次复杂计算是你要执行的整个活动,那么它本身可以算的上是一个进程的概念,但是实际上计算真正执行时是依靠进程进行CPU调度和分派后获取的线程去执行的。对于复杂的计算来说,其特性就在于复杂二字,如果你想要这个复杂的计算流程对主线程干扰降到最低,那么你可以开辟后台线程去执行,获得执行结果后再回到主线程做你要做的事情。这也是并发处理的意义所在:保证整个进程流畅和对多处理器的高效利用。