1.进程&线程
1.1 定义
进程
- 进程是系统中正在运行的
一个程序
(当一个程序进入内存运行时,即成为了一个进程。比如在 iOS 中,一个APP 的启动
就是开启一个进程); - 进程之间是独立的,每个进程都有自己独立的
地址空间
。
线程
- 线程是进程的
基本执行单元
,一个进程的所有任务都在线程中执行; - 进程想要执行任务,必须有线程;
- 程序启动会默认开启一条线程,这条线程被称为
主线程
或者UI 线程
。
1.2 关系
进程和线程之间的关系主要涉及下面两个方面:
地址空间
同一个进程的所有线程共享
进程的地址空间,而进程和进程之间则是独立
的。资源
同一个进程内的线程共享本进程的资源,而进程之间相互独立。
还有其他一些方面有所不同:
健壮性
一个进程崩溃后,不会影响其他进程,但进程中只要有一个线程崩溃,则整个进程崩溃使用场景
进程切换时,消耗的资源大,效率高,但是如果频繁的切换时,使用线程比较合适执行过程
每个进程都有一个程序运行的入口、顺序执行序列和程序入口,但是线程必须依存于程序中线程是处理器调度的
基本单位
,进程不是
1.3 线程和 RunLoop
的关系
关于 RunLoop
的部分,之后会详细介绍,主要有以下几点:
- 线程和
RunLoop
是一一对应的,一个RunLoop
对应一个核心的线程,RunLoop
是可以嵌套的,但是核心的只有一个,它们以key-value
的形式存在一个全局的字典
里 -
RunLoop
是来管理线程的,当线程的RunLoop
被开启后,线程会在执行完任务后进入休眠状态,有了任务就会被唤醒去执行任务 -
RunLoop
会在第一次获取时创建,线程结束时同时被销毁 - 主线程的
RunLoop
在程序启动时就创建了,子线程的RunLoop
是在获取时才会创建
2. 多线程
2.1 原理
对于单核 CPU
,同一时间
CPU 只能处理一条线程,即只有一条线程在工作,所以多线程的本质就是 CPU 在不同的任务中快速切换
,由于 CPU 调度线程的时间足够快,就造成了多条线程”同时“执行的效果。
多线程的意义在于能适当提高程序的执行效率,提高资源的利用率。
但是线程的开辟需要占用一定的内存空间,默认情况下,一个线程占用512KB
,所以如果开启大量线程,会占用内存空间,降低程序的性能,而且多线程程序也会更复杂,比如线程通信,数据共享。
2.2 多线程生命周期
主要分为 5 个部分:新建 - 就绪 - 运行 - 阻塞 - 死亡,如下图所示:
- 新建:实例化线程对象
- 就绪:线程对象调用 start 方法,将线程对象加入可调度线程池,等待 CPU 的调用,也就是调用 start 方法,并不是调用,只是进入了
就绪状态
,等待一段时间后,CPU 调用它时才会从就绪状态变成运行状态 - 运行:CPU 负责调度可调度线程池中线程的执行,在线程执行完之前,其状态可能会在就绪和运行之间来回切换,这个是由 CPU 负责的
- 阻塞:比如调用 sleep,或者加锁时,会
阻塞当前线程
,将线程从可调度线程池中移出 - 死亡:
线程执行完毕,正常死亡;
调用exit
退出,非正常死亡。
简单来说,运行中的线程拥有一段可以执行的时间(时间片):
- 如果时间片用尽,线程就会进入就绪状态
- 如果时间片没有用尽,且需要开始等待某事件,就会进入阻塞状态队列
- 等待事件发生后,线程又会重新进入就绪状态队列
- 每当一个线程离开运行,即执行完毕或者强制退出后,CPU会重新从就绪状态队列中选择一个线程继续执行
线程的
exit
和cancel
方法:
exit
会强行终止线程,后续的代码不会执行
cancel
取消当前线程,但是正在执行的线程,会一直执行到结束
CPU 是根据线程的优先级
来调度的,但并不是说线程的优先级越高,就意味着任务的执行越快,而是说优先级高的线程有更大的可能会被 CPU 调度。
线程执行的快慢,除了要看优先级,还需要看资源的大小,即任务复杂度以及 CPU 调度情况。
2.3 线程池
线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务。线程池维护着多个线程,等待 CPU 调度,主要是为了节省短时间任务的线程创建和销毁的代价,可用线程数量应该取决于可用的并发处理器、处理器内核、内存等,例如,线程数一般取CPU 的数量 + 2
比较合适,线程数过多则会导致额外的线程切换开销。
上面提到的饱和策略,主要有以下四种(在 iOS 中并没有找到以下 4 种策略):
-
AbortPolicy
:直接抛出RejectedExecutionExeception异常来阻止系统正常运行 -
CallerRunsPolicy
:将任务回退到调用者 -
DisOldestPolicy
:丢掉等待最久的任务 -
DisCardPolicy
:直接丢弃任务
2.4 并发和并行
- 并发
在同一时间段内,两个或多个程序执行,有时间上的重叠(宏观上是同时,微观上仍是顺序执行),在任一时刻点上,只有一个程序在处理机上运行 - 并行
系统有一个以上 CPU 时,则线程的操作有可能非并发,两个 CPU 分别执行不同的线程,互不抢占 CPU 资源,可以同时进行
注意:并发是指多个事件在同一时间间隔内发生;并行是指多个事件在同一时刻同时发生。
3. iOS 中的多线程实现方案
主要由 4 中,如图:
4. 线程安全
当多个线程同时访问一块资源时,容易引发数据错乱和数据安全问题,有以下两种解决方案:
互斥锁(即同步锁):
@synchronized
确保同一时间,只有一条线程能执行;
加了互斥锁的代码,当新线程访问时,如果发现其他线程正在执行锁定的代码,新线程就会进入休眠
;
互斥锁的锁定范围,应该尽量小,锁定范围越大,效率越差。自旋锁
自旋锁与互斥锁类似,但它不是通过休眠使线程阻塞,而是在获取锁之前一直处于忙等
(即原地打转,称为自旋)阻塞状态;
锁持有的时间短,且线程不希望在重新调度上花太多成本时,就需要使用自旋锁,属性修饰符atomic
,本身就有一把自旋锁;
加了自旋锁,当新线程访问代码时,如果发现有其他线程正在锁定代码,新线程会用死循环的方法,一直等待锁定的代码执行完成,即不停的尝试执行代码,比较消耗性能。
5. 线程间通讯
直接消息传递:通过
performSelector
的一系列方法,可以实现由某一线程指定在另外的线程上执行任务。因为任务的执行上下文是目标线程,这种方式发送的消息将会自动的被序列化全局变量、共享内存块和对象:必须使用锁或其他同步机制仔细保护共享变量,以确保代码的正确性
条件执行:条件是一种同步工具,可用于控制线程何时执行代码的特定部分。您可以将条件视为关守,让线程仅在满足指定条件时运行。
Runloop sources
:一个自定义的Runloop source
配置可以让一个线程上收到特定的应用程序消息。由于Runloop source
是事件驱动的,因此在无事可做时,线程会自动进入睡眠状态,从而提高了线程的效率Ports and sockets
:基于端口的通信是在两个线程之间进行通信的一种更为复杂的方法,但它也是一种非常可靠的技术。更重要的是,端口和套接字可用于与外部实体(例如其他进程和服务)进行通信。为了提高效率,使用Runloop source
来实现端口,因此当端口上没有数据等待时,线程将进入睡眠状态。需要注意的是,端口通讯需要将端口加入到主线程的Runloop
中,否则不会走到端口回调方法消息队列:传统的多处理服务定义了先进先出(
FIFO
)队列抽象,用于管理传入和传出数据。尽管消息队列既简单又方便,但是它们不如其他一些通信技术高效Cocoa
分布式对象:分布式对象是一种Cocoa
技术,可提供基于端口的通信的高级实现。尽管可以将这种技术用于线程间通信,但是强烈建议不要这样做,因为它会产生大量开销。分布式对象更适合与其他进程进行通信,尽管在这些进程之间进行事务的开销也很高