模型概述
1 .每一个os线程都有一个固定各大小的内存块来做栈,这个栈会用来存储当前正在被调用或者挂起的的函数内部变量
2 .这个栈是可大可小的,2M对于一个小的goroutine来说是很大的,但是对于一个复杂任务来说又是很小的。所以设计成是可扩展的。
3 .在go中,每一个goroutine是一个独立的执行单元,相对于每个os线程固定分配的2M大小,goroutine的栈采用了动态扩容的方式,初始大小仅为2kb,随着任务执行按需增长,最大可达1GB,而且完全由go自己的调度器来实现调度
4.此外,GC还会周期性的将不在使用的内存回收,收缩栈空间。
5.任何用户线程最中肯定是需要由OS线程来执行的,但是G并不是直接绑定os线程运行,而是使用P来作为两者的中介
6 .
线程模型
1 .线程是处理器调度和分配的基本单位,线程是进程内部的一个执行单元,每个进程至少有一个主执行线程,无需用户主动创建,是由系统创建的,用户需要的是在应用程序内部创建其他线程,多个线程并发的运行与一个进程中
2 .进程是资源拥有的基本单位。每个进程是由私有的虚拟地址空间,代码,数据和其他各种系统资源组成
3 .语言的并发模型,到了操作系统层面,一定是以线程形态存在的。
4 .线程可以看成是进程中的控制流,一个进程至少会包含一个线程,因为其中至少有一个控制流持续运行
5 .一个进程的第一个线程一定会随着这个进程的启动而创建,创建的方法就是系统调用pthread create函数
6 .拥有多个线程的进程可以并发执行多个任务,如果某个任务被阻塞,也不会影响其他任务的正常执行。
7 .线程不能独立于进程存在,他的生命周期不能逾越所属的进程的生命周期
8 .事实上Go调度器有一个复用机制,每次使用go关键字的时候它会检查当前结构体M中的P中,是否有可用的结构体G。如果有,则直接从中取一个,否则,需要分配一个新的结构体G。如果分配了新的G,需要将它挂到runtime的相关队列中,但是调度器却没有限制goroutine的数量,这在瞬时性goroutine爆发的场景下就可能来不及复用G而依然创建了大量的goroutine,
进程
1 .正在执行的程序。是CPU资源分配和调度的独立单位
2 .进程分为三个部分:程序,数据集,进程控制块三部分
3 .进程的局限是创建,撤销和切换的开销比较大
线程
1 .线程是进程之后发展而来的概念,也叫轻量级进程,是程序执行中最小的执行单元
2 .一个进程可以包含多个线程,线程的有点事减小了程序并发执行的开销,提高了操作系统的并发性能
3 .缺点是线程没有自己的系统资源,只有运行时必不可少的资源,同一进程的各个线程可以共享进程所拥有的系统资源
4 .某些独占性资源存在锁机制,处理不当会产生死锁
协程
1 .一种用户态的轻量级线程,又叫微线程
2 .协程的调度完全由用户控制。一旦完成任务,协程就会退出
3 .协程最大的有点事轻量级,可以创建上万个而不会导致系统资源枯竭
4 .协程执行效率高,没有线程切换的开销。线程数量越多,协程的性能优势越明显
G
1.表示goroutine,每个goroutine对应一个G结构体,g存储goroutine的运行栈,运行状态以及任务函数
2.可重用。
3.g并非执行体,必须绑定到p上才能被调度执行
4.g的眼里只有p,在g的眼里,p提供了g运行的一切资源和环境,p就是他的“CPU”
P
1.一个抽象的资源或者上下文,表示一个逻辑处理器一个p绑定一个os线程
2.对于M来说,p提供相关的执行环境,如内存分配,任务队列等
3.p的数量决定了系统最大可并行的G的数量,p的数量是由GOMASXPROCS决定的,但是最大值为256
M
1.os线程抽象,代表真正可以执行计算的资源,在绑定有效的P后,进入调度器循环
2.循环机制就是从全局队列,p的本地队列以及等待队列中获取G,切换g的执行栈上面执行g的函数
3.调用goexit做清理工作并回到M,如此反复,m并不保留g的状态,这是g可以跨M调度
4.m数量是不固定的,为了防止创建太多os线程导致调度不过来,最大显示为10000
调度模型
https://user-gold-cdn.xitu.io/2018/6/11/163edf32b179eb4a?imageslim
1.go调度器工作时会维护两种用来保存G的工作队列,一个是全局队列,一个是每个p的本地队列
2.当使用go关键字创建一个新的gogroutine时,他会优先被放入本地的p队列
3.为了运行g,m需要绑定一个p,接着m会启动一个os线程,循环从p的本地队列里面取出一个g并且执行。
4.当m执行完p的本地队列中的所有g之后,p就会先去全局队列找一下,如果没有的话,就去另外的一个p,从他的队列拿走一半的p到自己的队列中去执行
5.调度阻塞的情况
5.1.用户态的阻塞
1.当goroutine因为channel操作或者net work i/o操作而阻塞的时候,对应的G会被放到某个wait队列中,改G的状态由gruning变为gwaiting,M会跳过这个g去执行下一个g
2 .golang已经用netpooler实现了goroutine网络io阻塞,这个不会导致m被阻塞,仅仅会阻塞g
3 .当阻塞的g被另一端的g2唤醒的时候,如channel的可读和写通知,g被标记为runable,尝试加入g2所在的p的runnext,然后在世p的本地队列 和全局队列
5.2.系统调用阻塞
1 .当g被阻塞到某个系统调用上时,g会阻塞在gsyscall状态,m处于block on syscall状态,注意,此时的m可被抢占式调度的,执行该G的m会与p解绑。p会尝试与其他idle的m绑定,继续执行剩余的g
2 .如果没有其他运行的m,但是p的本地队列任然有g需要执行,则新建一个M
3 .系统调用完成之后,g会重新尝试获取一个运行的p进入他的本地队列恢复执行,如果没有g会被加上runable标记,加入全局队列
4 .抢占式调度的原理让runtime有机会检查是否需要执行抢占调度。这种解决方案只能说局部解决了“饿死”问题,对于没有函数调用,纯算法循环计算的G,scheduler依然无法抢占
5 .如果此时没有idle的M,则会新创建一个M,这就是为何大量I/O操作导致大量Thread被创建的原因
5.3 .如果一个goroutine在某个操作上阻塞,Go运行时会调度另外一 个goroutine。即使成千上万的Goroutine被创建了出来,如果它们阻塞在某个操作上,也不会浪费系统资源。从操作系统的视角来看,你的程序的行为就像是一个事件驱动的C程序似的
6 .将创建的goroutine按照一定的算法放到“CPU”上执行的程序就称为goroutine调度器或者goroutine scheduler
7 .一个go程序对操作系统来说只是一个用户级程序,对操作系统来说,并不知道goroutine的存在
8 .goroutine的调度全靠go自己完成,实现go程序内goroutine之间公平的竞争cpu资源
9 .将goroutines按照一定算法放到不同的操作系统线程中去执行。这种在语言层面自带调度器的,我们称之为**原生支持[并发]
10 .
抢占式调度G的细节
1 .和操作系统按时间片调度线程不同,go没有时间片的概念,如果某个p没有被system call调用,没有io操作,没有阻塞在一个channel上面,m停下当前g执行下一个g的方式,也是抢占式调度
2 .除非无限循环或者死循环,否则只要g调用函数,go runtime就有抢占g的机会。
3 .go程序启动的时候,runtime会启动一个名为system的m,执行以下操作
1 .每隔20us-10ms启动一次
2 .释放闲置唱过5分钟的物理内存
3 .如果超过2分钟没有垃圾回收。强制执行
4 .将长时间未处理的netpoll结果添加到 任务队列中
5 .向长时间运行的g任务发出抢占式调度 10ms这么长的执行时间
6 .收回因syscall长时间阻塞的p
M-G出现的问题
1 .单一全局互斥锁和集中状态存储的存在导致所有的goroutine相关操作,比如创建和重新调度,都需要上锁
2 .goroutine传递问题,m需要经常在M之间传递可运行的goroutine,这导致调度延迟增大以及额外的性能损耗
3 .每个M做内存缓存,导致内存占用过高,数据局部性较差
4 .由于syscall调用而形成的剧烈的worker thread阻塞和解除阻塞,导致额外的性能损耗
5 .最后的调度实现
1 .每个P维护一个本地的G队列
2 .当一个G被创建出来,或者变为可执行状态时,就放到本地的p可执行队列中
3 .当一个g在M里面执行结束后,p会从队列中把G取出,如果此时p的队列为空,P也不会就这么在那躺尸啥都不干,它会先尝试从Global队列寻找G来执行,如果Global队列为空,它会随机挑选另外一个P,从它的队列里中拿走一半的G到自己的队列中执行