内存分配器是各类应用中最基础的底层组件之一,好的内存分配器不仅能提升分配性能,而且能够帮助用户查找内存泄漏、访问越界等问题。
windows平台内存分配
virtualalloc和heapalloc都是windows向用户提供的最底层的接口,heapalloc对virtualalloc做了封装,
malloc 和 free是 C 对底层内存分配的再封装,也方便了跨平台,new 和 delete 操作符则是C++进一步的封装。
替换现有的内存分配器
如果只是从C++的角度替换,那么重载operator new 操作符
调用自己的分配器的self_malloc()、self_free()即可
如果从C的角度替换,原理上就是把malloc的函数指针hack成自己的指针即可,我也没尝试过,自行检索。
极简的内存分配器结构
这是一个最简单的内存分配器,有以下规则
- 设定一个阈值,大于阈值的直接分配一整块内存。小于阈值的则在TreeNode(std::map)去查找,看是否有合适block,找到后扣除分配大小继续加入到TreeNode中
- 在一个实际的内存分配器当中,每个node里面肯定会有元数据相关的head,这个head是用于存储当前内存块的分配状态(已分配、未分配),block的大小,同一个物理页连续block之间的前后指针(用于合并空闲内存块和释放page),相同未使用块的前后指针(方便快速查找可用的block) 还有就是内存非法访问 内存泄漏等信息都可以放在head中。通俗来讲就是分配一个int字段,4字节,实际上占用的内存为sizeof(head) + 4字节 内存分配函数的调用者得到的地址是int的启始地址,启始地址-sizeof(head)即可得到内存块的各种元信息以及辅助信息。
总结,最简单的内存分配器就是简单的连续储存空间块(page) + 链表结构(list) + 辅助检索数据结构(map)
小细节
- 内存分配器的block head unused和used的字段可能是不一样的,我们可以使用union来压缩空间,并且release版本对比debug版本也可做简化
- 内存分配器是要考虑多线程的支持问题的,通常会上锁,锁的粒度会影响到并发的性能。
mimalloc 内存分配器(微软开源库)
参考资料
以上是mimalloc相关的文档,资料2主要讲mimalloc内存分配器的设计原理以及为何该分配器的效率高
在设计思路上,mimalloc有以下特点
1.保证了内存的局部性,相同大小的对象尽可能分配在同一个page(64kb)区域,提升代码的局部性,让CPU访问内存效率更高(如上图,在多次分配和释放内存后一段程序相同大小的对象分布L2 Cache丢失率mimalloc更低)
2.多线程支持性更好,性能高,每个线程一个堆,并且没有使用锁,大部分操作都是使用原子操作swap方式实现的
3.mimalloc在分配内存的时候避免了尽可能减少分支的数量,而且会周期性(一定的分配次数后freelist不足)的调用垃圾回收算法
4.多场景测试矫正,保证通用性能(针对缓存 CPU分支预测做了大量优化)。
宏观理解mimalloc
mimalloc实际上就是基础的内存分配器 + 内存池(多线程性能好,内部碎片小(最坏12.5%),内存池伸缩性能好【自带池回收,以及扩张策略,一次不构建所有的block防止RSS过高】)
如上图所示
- heap则是thread local变量 存储了线程堆的元信息、所有池(page)以及根据对象大小快速索引池的hash(pages_direct)
- page对象可以理解成为内存分配器上层封装的单个对象池(block大小是指定的)
- segment则是page与操作系统打交道的中介,申请实际的内存空间并切分成slice给page使用