glibc malloc原理简析

wangshuo2021-01-27glibcmalloc

1 概述

内存分配器ptmalloc,即glibc中的malloc,实现了 malloc(),free()以及一组其它的函数,以提供动态内存管理的支持。分配器处在用户程序和内核之间,它响应用户的分配请求,向操作系统申请内存,然后将其返回给用户程序。 为了保持高效的分配,分配器一般都会预先分配一块大于用户请求的内存,并通过某种算法管理这块内存。来满足用户的内存分配要求,用户释放掉的内存也并不是立即就返回给操作系统,相反,分配器会管理这些被释放掉的空闲空间,以应对用户以后的内存分配要求。也就是说,分配器不但要管理已分配的内存块,还需要管理空闲的内存块,当响应用户分配要求时,分配器会首先在空闲空间中寻找一块合适的内存给用户,在空闲空间中找不到的情况下才分配一块新的内存。

2 malloc数据结构

2.1 内存管理结构

2.1.1 chunk

chunk原意是块,用在内存中表示的意思就是一块内存,chunk是glibc内存管理的最小单位,其数据结构如下图所示

chunk中几个关键的成员有prev_size、mchunk_size、fd和bk,其作用分别为:

prev_size:
如果前一个chunk是free chunk,则这个内容保存的是前一个chunk的大小。 如果前一个chunk是allocated chunk,则这个区域保存的是前一个chunk的用户数据;


mchunk_size:
当前chunk的大小。最后的 3 位作为标志位,具体为:
第0比特位用于表示前一个chunk是否为allocated chunk,而当前是不是chunk allocated可以通过查询下一个chunk的这个标志位来得知;
第1比特位用于标记该chunk是否是通过系统调用申请的(子线程是mmap,主线程则是通过 brk)。如果是,则该chunk不再由后续将会介绍的内存管理数据结构来标记,申请释放流程将简化;
第2比特位用于标记该chunk是否属于主分配区,关于分配区将在下文详细介绍。


fd:
前向指针,即指向当前chunk在同一个bin的下一个chunk的指针,仅chunk未使用的时候存在。


bk:
后向指针,即指向当前chunk在同一个bin的上一个chunk的指针,仅chunk未使用的时候存在。

2.1.2 arena

arena一般称为分配区,是一个结构体,内含指向各自类型内存块的指针等元素,每个线程在申请内存时会获取一个。分配区分为主分配区和thread分配区,前者仅有一个,其余均为thread分配区。当新创建的线程需要申请内存时,将从一个全局的链表中获取一个空闲的分配区,如果没有得到且分配区数量没有超过最大值(M_ARENA_MAX),malloc将会新建一个。

2.2.3 heap

heap包括帧头和内存块, glibc以heap为单位从操作系统批量申请和释放内存。 主分配区有一个heap,thread分配区在刚创建时也只有一个,当超过一定大小时会新增heap,heap直接以链表形式相连,数量没有限制,单个heap最大默认64M。新建heap时里面只有一个chunk,称为top chunk,每次申请内存时都会从top chunk中分裂出一块chunk,而top chunk本身则始终位于heap的末端。

下图是只有一个heap的main arena和thread arena的内存分布图: 下图是一个thread arena中含有多个heap的情况: 从以上两图可以看出,thread arena只含有一个arena,却有两个heap_info(即 heap header)。由于两个heap是通过mmap从操作系统申请的内存,两者在内存布局上并不相邻而是分属于不同的内存区间,所以为了便于管理,glibc的malloc将第二个heap_info结构体的prev成员指向了第一个heap_info结构体的起始位置(即ar_ptr成员),而第一个heap_info结构体的ar_ptr成员指向了arena,这样就构成了一个单链表,方便后续管理。

2.2 内存管理链表

glibc提供了几种链表来管理不同大小的chunk。其中,除tcache外,其余均为arena结构体中的成员变量。

2.2.1 tcache

tcache是glibc为了提升小块内存申请释放性能引入的缓存机制。单个tcache有64个链表项,每一项里面最多可保存7块大小相同的chunk,tcache链表本身的数据结构从分配区管理的heap中申请,线程退出时释放回原heap,由于tcache是线程变量,每个线程都会有一个自己的tcache,因此理论上数量无上限。

2.2.2 fastbin

fastbin为管理小块chunk(64位为160字节)的链表,应对频繁申请小块内存的场景。链表项管理的chunk值按一定规律递增,可通过一定的算法算出指定大小的chunk所在的链表项索引,从而找到对应大小的chunk。

2.2.3 unsortedbin

fastbin中整合的chunk和small chunk、 large chunk free之后的chunk被放入unsortedbin,加速内存申请释放,unsortedbin管理的chunk值无规律。

2.2.4 smallbin、largebin

smallbin和largebin管理的chunk值按一定规律递增,可通过一定的算法算出指定大小的chunk所在的链表项索引,从而找到对应大小的chunk。

3 malloc原理分析

3.1 malloc缓存模型

为了兼顾性能和内存占用,glibc的malloc通过一系列的内存管理链表实现了一套复杂的内存缓存机制,其基本思想可以由如下两图概括。 可以看出,当用户需要申请内存时,malloc会先向操作系统申请一个heap,然后对该heap进行切分,根据切分后的内存块的大小交由不同的链表管理。在后续内存申请时,会按照tcache→fastbin→unsortedbin→smallbin/largebin的顺序来获取内存。内存释放过程则与此相反。

3.2 malloc工作流程

3.2.1 内存申请流程



3.2.2 内存释放流程



4 参数配置

4.1 参数列表

glibc提供了一系列的可调参数,用户可以通过设置环境变量的方式调节这些参数从而改变malloc的一些行为。

参数名默认值取值范围作用
M_MMAP_MAX
65536
>= 0
使用mmap分配的最大chunk数,取0时,相当于不使用mmap功能
M_MMAP_THRESHOLD
128 * 1024(字节)
0 ~ 32M
所有大于该值的chunk都使用mmap分配内存。如果未设置此参数且未禁用动态调整时,该值将会被动态调整,具体表现为如果上次申请的内存大于该值,则该值将随之增大;如果用户手动设置了这一参数,则将同时禁用动态调整,该值始终保持不变。
M_TOP_PAD
0
-
内存申请和释放时额外保留的内存量,避免过多的系统调用
M_TRIM_THRESHOLD
128 * 1024(字节)
-
收缩阈值,当arena的top值超过收缩阈值将触发收缩操作把多余的内存还给操作系统。如果未设置此参数且未禁用动态调整时,该值将会被动态调整,具体表现为当M_MMAP_THRESHOLD更新时,该值随之更新为前者的两倍;如果用户手动设置了这一参数,则将同时禁用动态调整,该值始终保持不变。
M_ARENA_MAX
CPU核数 * 8
-
arena最大数量
M_ARENA_TEST
8
-
限制arena数量,只有当进程现有的arena不足且需求量超过M_ARENA_TEST时才会触发修改arena数量上限的动作。如果设置了M_ARENA_MAX,将忽略M_ARENA_TEST
tcache_count
7
>= 0
设置tcache的链表bin数量,当取0时,多余的chunk不会放到tcache里面,相当于关闭了tcache,如:
export GLIBC_TUNABLES=glibc.malloc.tcache_count=0
tcache_unsorted_limit
0
>= 0
限制tcache从unsorted bin中获取chunk的数量,当取0时,不做限制



4.2 使用环境变量设置参数

4.2.1 兼容模式环境变量

这一方式与低于2.26版本的glibc兼容,但是没有tcache相关的设置。 示例:

# export MALLOC_ARENA_MAX=1  



4.2.2 tunables模式环境变量

这一方式适用于2.26及以上的glibc版本,默认使用

示例:

# GLIBC_TUNABLES=glibc.malloc.mmap_max=1:glibc.malloc.top_pad=1



5 调测工具

malloc_stats是glibc提供的一个可用统计本进程具体的内存使用情况的接口,精确到字节, malloc_stats()函数声明如下:

#include<stdlib.h>  
#include<malloc.h>  
void malloc_stats(void);  

malloc_stats()可以在编写代码时加入编译宏来使用,也可以在gdb中直接调用。malloc_stats()执行结果如下:

Arena 0:                      //分配区编号,这里只有一个线程
system bytes     =     135168 //本线程从操作系统获得的动态内存,这里是132KB  
in use bytes     =       1152 //本线程在使用的动态内存,1152字节  
Total (incl. mmap):           //总的使用情况,各个线程使用动态内存的累加值  
system bytes     =     135168 //本进程从操作系统获得的动态内存,这里是132KB  
in use bytes     =       1152 //本进程在使用的动态内存,1152字节  
max mmap regions =          0 //使用mmap区域的个数  
max mmap bytes   =          0 //mmap区域对应内存大小  

【免责声明】本文仅代表作者本人观点,与本网站无关。本网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。本文仅供读者参考,由此产生的所有法律责任均由读者本人承担。