步入并发编程的大门,我个人一直觉得这是一个奇妙、复杂又诡异的世界,很多时候它的各个部分都让人难以理解。这对入门者来说是很痛苦的,进入一个陌生的领域首先要理解一些基础的概念或者逻辑,在这个基础上才能继续向深处走。
“复杂的积木本质上就是大量简单积木的组合。”
同步和异步
同步通常用来形容一次方法调用。同步方法一开始,调用者必须等到方法调用返回后,才能继续后续的行为。
异步更像是一个消息传递,一旦开始,方法调用就会立即返回,调用者就可以继续执行后续操作了。这时候你会想既然调用就立即返回 那调用这个方法还有什么意义?? 实际上异步的方法里的内容 通常会在另一个线程中真实的执行 执行完之后,如果需要返回结果 它会通知调用者 执行完成了 结果你拿走。
并发和并行(Concurrency and parallelism)
很容易被混淆的两个概念。
并发是多个任务交替执行,而多个任务直接有可能还是串行的。
并行是真正意义上的同时执行。
实际上如果系统只有一个CPU,而使用多进程和多线程任务,那么真实环境中这些任务不可能是真实并行的,因为它一次只能执行1条命令,真实的并行也只可能 出线在多核CPU中。
临界区
临界区用来表示一种公共资源或者说共享数据,可以被多个线程使用,但是每一次,只能有一个线程使用它,一旦临界资源被占用,其他线程想要使用这个资源就必须等待。
阻塞和非阻塞
阻塞和非阻塞常用来形容多线程之间的相互影响。比如一个线程占用了临界区资源,那么其他所有需要这个资源的线程就必须在这个临界区中进行等待。等待会导致线程挂起,这种情况就是阻塞。(一群人同时来到一台饮料机前面买水喝 一个正在挑该买哪个 其他人只能等着) 如果占用资源的线程一直不愿意释放资源,那么其他阻塞在这个临界区的线程都不能工作
非阻塞相反,它强调没有一个线程可以妨碍其他线程执行。 所有线程都会尝试不断前向执行。
死锁 饥饿 活锁
死锁是最糟糕的一种情况,多个线程互相占用了另一个的资源 谁都不愿意释放自己的资源,这个状态会永远维持下去。
饥饿 是一个或者多个线程因为种种原因,无法获得所需要的资源,导致一直无法执行。比如它的线程优先级可能太低,而高优先级的线程不断的抢占它所需要的资源。导致它一直在等待资源的状态。跟死锁相比好一点的是 如果很长一段时间后比它级别高的线程全执行完了,它就可以正常运行了。
并发级别:
或许你已经发现了,由于临界区的存在,多线程之间的并发必须收到控制,不然就乱套了。
我们把并发级别大致分类:1 阻塞、2 无饥饿、3 无障碍、4 无锁、5 无等待。
1 一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续进行。
2 如果线程之间是有优先级的(我是说如果),那么线程调度总会倾向于满足高优先级的线程,对同一个资源的分配是不公平的。(比如食堂打饭 长的好看的妹子 没事喜欢插个队 男生也不说什么 )
如果是公平锁 所有线程先来后到乖乖排队 意味着所有线程都有机会执行。
3 无障碍是一种很弱的非阻塞调度,就是说 在无障碍的情况下的线程,他们不再受阻塞的限制,大家都可以进入临界区获取资源了,这时候风险就产生了,一起修改共享数据改坏了怎么办?对于无障碍的线程来说一旦检测到这种情况,它会立即对自己所做的修改进行回滚 确保数据的安全。如果没有数据竞争发生,那么线程就可以顺利完成自己的工作,各自相安无事,退出临界区。
4 无锁的并行都是无障碍的,在无锁的情况下,所有的线程都能尝试对临界区进行访问,但是不同的是,无锁的并发保证必然有一个线程能够在有限步内完成操作临界区。
一个典型特点就是 可能会包含一个无穷循环,在这个循环中,线程会不断的尝试修改共享变量。如果没有冲突,修改成功,那么程序退出,否则继续尝试修改。
5 无等待和无锁的区别是:无锁只要求 有一个线程可以在有限步内完成操作,无等待是在它的基础上 进一步拓展。
它要求所有的线程都必须在有限步内完成,这样就不会引起饥饿问题。如果限制这个步骤上限,还可以分为多种不同情况,他们的区别就是循环次数的不同。
一种无等待结构就是RCU,它的基本思想就是,对数据的读可以不加控制,因此所有的读线程都是无等待的,不会引起任何突出。但是在写数据的时候,先取得原始数据的副本,接着只修改副部,最后在“合适”的时机回写数据。
进程
进程时计算机的程序 关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位。
进程可以容纳若干个线程。可以理解为他是一个线程的容器,多个线程在进程中可以健康的运行 但是也可能会出现上述的阻塞 饥饿 死锁这些行为。