传统的内存申请释放函数malloc/free 每申请一次内存或者释放一次内存都会触发内存管理调度。频繁的分配和回收内存会严重降低程序的性能,主要原因就是默认内存管理功能是通用的,这些通用的内存管理功能有部分是不需要的。大量的内存申请会造成严重的内存碎片,最终导致内存被耗尽。基于以上两点考虑,如果需要大量申请内存的话,malloc/free对于CPU 内存效率都比较低,解决方法就是采用内存池技术。
内存池技术工作原理:提前申请一块连续的内存空间,自己管理申请的大块内存,用户再向内存池申请释放内存,释放完内存后其它用户可以继续使用。这就解决了内存碎片,一次申请,触发的内存管理也只有一次。
按内存池内存块存储方式可以分为堆内存池 链表内存池两种。如果要对内存池块中的数据进行求TOPN问题,可以采用堆内存池方式。对两种实现内存池的方式进行性能测试,二者性能相差不大。
按内存池块的长度是否固定可以分为定长内存池和非定长内存池。如果要申请的内存池数据相对接近可以采用定长内存池,比如mempool,好处就是方便内存释放。对于要申请内存的数据长度不固定,相差较大,就必须采用非定长内存池,非定长内存池有APR_pool(这种是在apache上采用的 缺陷:内存释放有问题) ARP_pool优点是内存池套着内存池,可以被不同的用户使用,SVBSMP(自适应变长块内存池) 这种的话是我们采集可以参考的。
如下图所示是SVBSMP内存池的结构图,固定内存池中每申请一块内存内存的长度是固定,SVBSMP所申请的内存长度不是固定的,解决办法就是在block下挂结点。
根据arp_pool 和svbsmp内存池设计出适应采集需求的内存池。内存池中的内存块是相对固定的,这种场景可以采用arp_pool内存池下挂内存池的方法,事先只有申请一块大内存就可以了。如果采用这种方法的话可能能够替换掉汇聚缓存。分流模块内存池设计如下。
内存长度之间偏差相大,所以采用svbsmp的思想内存池为不定长内存池,如下为不定长内存池的结构,最重要的是free_head,内存申请时看释放内存资源链表是否有足够的资源,如果有,直接从释放内存资源链表中申请,如果没有直接从内存池中用malloc申请。free_head保存着释放内存资源链表的头结点。Block_num保存着申请的内存块个数,free_num保存着释放内存块个数,通过比较这两个值就可以知道是否有内存泄露。
如下图是内存块的设计,node_head 是内存块的头结点,node_tail是内存块尾结点。Node_num保留了一个内存块中有多少个结点。
如下图所示为内存块下结点的数据结构,采用联合体的主要原因是小包负载体较多,只要基本结点就行 NODE_SIZE个大小,较大的情况就需要采用多个结点。
因为分流的线程较多,对速度要求较高,新申请的内存块不会加入 内存块链表,用完了用释放结点链表来保存就行。