并发(concurreny)和并行(parallellism)
并发是指两个或者两个以上的任务在一段时间内被执行,我们不关心这些任务在某一个时间点是否同时执行,可能同时执行也可能不是,我们只关心在一段时间内,是否执行解决了两个或者两个以上的任务
并行:两个或者两个以上的任务在同一时刻被执行
并发说的是逻辑上的概念,并行强调的物理运行状态,并发包含并行
Go实现了这两种并发形式:第一种是普遍认知的多线程共享内存,
还有一种就是csp并发模型,csp讲究通过通信共享内存
其实无论语言层面怎么实现到了操作系统层面,一定是通过线程的形态存在的,而操作系统根据访问权限的不同,体系架构可以分为用户空间和内核空间,内核空间主要负责访问cpu资源,io,内存等硬件资源,为上层应用提供最基础的基础资源,用户空间就是上层应用程序的固定活动空间,用户空间不可以直接访问资源,必须通过系统调用,库函数或者shell脚本来调用内核空间提供的资源
其实线程也是有区别的操作系统内核态的线程(kse)和用户态的线程
多个用户态的线程对应着一个内核线程,程序线程的创建,终止,切换或者同步等工作必须自身来完成
这种模型就是直接调用操作系统的内核线程,所有的创建,终止,切换,同步等操作,都有内核完成,c++就是这种
两级线程模型是一种介于用户级别线程和内核级别线程之间的一种线程模型,一个进程可以对应多个内核级别的线程,但是进程中间的线程又不是和内核线程一一对应,这种的模型首先会创建多个内核级别的线程,然后用自身的用户级别线程对应创建的多个内核级别线程,
Go的MPG模型
M:machine只的是一个M直接关联一个内核级别的线程
P:processor,代表的是所需要的上下文环境,也是处理用户级别代码逻辑的处理器
G:goroutine,其实本质也还是一种轻量级的线程
我的理解就是M其实就是相当于内核级别的线程(相当于映射过来,就和数据库的表映射成struct),p相当于用户级别的线程,等待执行的就是一个队列runqueues
需要这个p就是当内核级别的线程阻塞的时候可以保存上下文环境挂载到其他的m下面
如果挂载不成功就会放入一个全局的等待执行队列,自己的队列执行完毕,全局的也没了,就去其他m下面拿g过过来执行
Go自带的内存管理,主要是内存池和垃圾回收两部分,因为其对内存管理在性能和空间利用率上的高效,大多数情况不需要用户自己管理内存
- Go的内存分配基于tcmalloc(thred cache malloc线程缓存分配器),这种模式的内存管理分为线程内存和中央堆两部分,在并行程序下分配小对象(<=32k macos为64k)效率很高(是google gperftools组件之一)[我就是直接认为是栈空间和堆空间]
- 核心思想:是把内存分成多级来降低锁的粒度,每个线程都有一个cache,用于无锁分配小对象,当内存不足分配小对象就去central申请,然后不足就去heap申请,heap最终可能向操作系统申请,这样的分配模型维护着一个用户态的内存池,不仅提高了内存在频繁分配,释放时的效率,而且有效的减少了内存碎片
- 内存划分:
初始化的时候,会申请一段连续的地址,并切分成三个部分(spans,bitmap,arean): 64位系统中间
Go中间一个指针大小是8byte
在go中间的对应关系就是:
arean区域就是heap,是供分配维护的内存池,对应区域大小是512G
bitmap用来表示arena中哪些地址保存了对象以及对象中间是否包含了指针,一个byte(8bit)对应arean中间4个指针大小的内存,就是2bit对应一个指针(8byte),对应大小是16GB
span是页管理单元,是内存分配的基本单位,一个指针对应arena中间1个虚拟地址页的大小(8kb),对应大小为512M