并发和并行
- 并发 两个或两个以上的任务在一段时间内执行
- 并行 两个或两个以上的任务同一时刻被同时执行
CSP 并发模型
- go 实现并发有两种形式:
1、多线程共享内存。类似于java、c++等多线程并发
2、 CSP 并发模型。不要以共享内存的方式来通信,相反,要通过通信来共享内存
线程
线程是操作系统调度执行的最小单元。而操作系统根据资源访问权限的不同,体系架构可分为用户空间和内核空间;
- 内核空间:主要操作CPU资源、I/O资源、内存资源等硬件资源。为上层应用程序提供最基本的基础资源。
- 用户空间:是上层应用程序的固定活动空间,用户空间不可以直接访问资源,必须通过“系统调用”、“库函数”、“shell脚本”来调用内核空间提供的资源。
go 线程实现模型MPG
- M 指的是Machine,一个M直接关联了一个内核线程。
- P 指的是processor,代表了M所需要的上下文环境,也是处理用户级代码逻辑的处理器。 它的主要用途就是用来执行goroutine的,一个P代表执行一个Go代码片段的基础(可以理解为上下文环境),所以它也维护了一个可运行的goroutine队列,和自由的goroutine队列,里面存储了所有需要它来执行的goroutine。
- G 指的是goroutine,实际的数据结构(就是你封装的那个方法),并维护者goroutine 需要的栈、程序计数器以及它所在的M等信息
- Seched 代表着一个调度器 它维护有存储空闲的M队列和空闲的P队列,可运行的G队列,自由的G队列以及调度器的一些状态信息等。
MPG
宏观
- p 的作用
- 一个线程不能同时执行代码和系统调用,阻塞时,此线程M需要放弃当前上下文环境,以便可以让其他的goroutine被调度执行。
M处理完成后,就会偷一个上下文,如果不成功,M就把它的goruotine go 放到一个全局的runqueue中,然后自己放入线程池或转入休眠状态。
- 均衡的分配工作
p 会定期检查全局的goroutine队列中的goroutine,以便自己有事可做。当全局goroutine队列中没有goroutine时,就会从其他运行的p的runqueue里偷。
每个P中的Goroutine不同导致他们运行的效率和时间也不同,在一个有很多P和M的环境中,不能让一个P跑完自身的Goroutine就没事可做了,因为或许其他的P有很长的goroutine队列要跑,得需要均衡。
- 让出资源
go 的并发不是抢占式的,由协程主动交出控制器,也就是说,发生IO操作时,并不是调度器强制切换执行其他的协程,而是当前协程交出控制权,调度器才去执行其他的协程。goroutine可能切换的点:
- I/O, select
- channel
- 等待锁
- runtime.Gosched()
这些点是go 协程可能切换的地方,但是并不是一定切换的。
线程是操作系统层面的多任务,而go的协程属于编译器层面的多任务,go有自己的调度器来调度。一个协程在哪个线程上是不确定的,这个是由调度器来决定的,多个协程可能在一个或多个线程上运行。
参考资料
https://studygolang.com/articles/11825
https://www.jianshu.com/p/e4a38a6d233c