如何优化压测工具发压能力 -- 提升cpu使用率
压测工具工作流程
压测工具一般在性能压测过程中用于对被压的系统产生压力,压测工具的发压能力的大小是影响一个性能工程中压测的成本以及效率相关的重要因素。因此对于一款压测工具,如何优化其发压能力是在开发压测工具是需要重点考虑的内容。
压测工具的工作流程如图所示:
一个压测工具的运行周期为:
- 启动时初始化相关的配置以及系统资源参数;
- 读入或者本地生成相关的压力数据;
- 执行具体的发压逻辑操作;
- 每个发压操作完成时需要每个操作逻辑做一定的指标信息收集;
- 进行统计信息汇总;
- 执行完发压过程之后需要清理相关的资源。
那么在优化发压能力的cpu使用时,就需要从发压的上下文,以及在发压执行过程中去考虑。在发压的上文主要做的事就是要读入或者生成执行发压操作时需要的数据,那么上文优化需要考虑的就是尽可能快地把需要地数据给到cpu(cpu缓存读,内存读,外部缓存读等),如果数据是执行过程中生成的,则生成数据的操作不能太耗费cpu。在发压的操作完成的下文要做的事是将操作的采样数据进行收集汇总,那么下文优化时考虑如何快速的收集采样数据,如果时需要实时汇总数据则指标汇总的操做不能占用太多发压操作的cpu。在发压过程中时,为了保证发压的操作尽可能地占用cpu,可以考虑为其分配独占的cpu,避免其他的进程间争抢cpu。
cpu相关的性能指标
cpu 使用率相关的性能指标:
- user(通常缩写为 us),代表用户态 CPU 时间。注意,它不包括下面的 nice 时间,但包括了 guest 时间。
- nice(通常缩写为 ni),代表低优先级用户态 CPU 时间,也就是进程的 nice 值被调整为 1-19 之间时的 CPU 时间。这里注意,nice 可取值范围是 -20 到 19,数值越大,优先级反而越低。
- system(通常缩写为 sys),代表内核态 CPU 时间。
- idle(通常缩写为 id),代表空闲时间。注意,它不包括等待 I/O 的时间(iowait)。
- iowait(通常缩写为 wa),代表等待 I/O 的 CPU 时间。
- irq(通常缩写为 hi),代表处理硬中断的 CPU 时间。
- softirq(通常缩写为 si),代表处理软中断的 CPU 时间。
- steal(通常缩写为 st),代表当系统运行在虚拟机中的时候,被其他虚拟机占用的 CPU 时间。
- guest(通常缩写为 guest),代表通过虚拟化运行其他操作系统的时间,也就是运行虚拟机的 CPU 时间。guest_nice(通常缩写为 gnice),代表以低优先级运行虚拟机的时间。
cpu的总体使用率表示为:除了空闲时间外的其他时间占总 CPU 时间的百分比,
一般在分析cpu使用情况时主要从以下几个方面进行考虑:
- 用户(%user)、Nice(%nice):用户 CPU 和 Nice CPU 高,说明用户态进程占用了较多的 CPU。
- 系统(%system) :系统 CPU 高,说明内核态占用了较多的 CPU,说明内核调用或内核线程占用过多。
- 等待 I/O(%iowait) :I/O 等待 CPU 高,说明等待 I/O 的时间比较长,一般与存储系统 I/O 性能有关。
- 中断(%irq)以及软中断(%softirq): 软中断和硬中断高,说明软中断或硬中断的处理程序占用了较多的 CPU。
Linux 中的软中断包括网络收发、定时、调度、RCU 锁等各种类型,可以通过查看 /proc/softirqs 来观察软中断的运行情况。
cpu 性能优化的方法
上面介绍了从应用进程角度优化cpu的整体思路。那从cpu的角度出发,具体优化cpu的方法有哪些呢?
在当今"冯诺依曼"体系架构下,cpu 作为计算机的核心计算单元,除了需要执行计算逻辑之外,cpu还需要从内存读取或者写出数据,所以cpu优化的整体思路有:优化本身的计算逻辑,以及提高cpu 读入和写出数据的速度。
从优化本身的逻辑的角度,即应用程序角度cpu的优化的思路时: 排除所有不必要的工作,只保留最核心的逻辑。比如减少循环的层次、减少递归、减少动态内存分配等等。具体的优化方法有:
- 编译器优化,通过在编译时开启编译器优化的选项,可以获得编译器的优化。
- 算法优化,使用复杂度更低的算法。
- 异步处理,避免程序因为等待某一个资源而发生阻塞,提升程序的并发处理能力。
- 多线程代替多进程,线程切换的成本低于进程切换的成本。
- 善用缓存,将经常访问的数据或计算过程中的步骤,放到内存中缓存起来。
在提高cpu 的使用方面从系统的角度出发,一方面要充分利用cpu缓存的本地性,加速缓存的访问;另一方面要控制进程的cpu使用情况,减少进程间的相互影响。具体常见的优化方法有:
- cpu 绑定,将进程绑定到一个或多个cpu上,可以提高cpu缓存的命中率,减少跨cpu调度带来的上下文切换的问题。
- cpu 独占,与绑定类似,进一步将cpu分组,通过cpu的亲和机制为其分配进程,CPU 就由指定的进程独占,不允许其他进程再来使用这些 CPU。
- 优先级调整:使用 nice 调整进程的优先级,正值调低优先级,负值调高优先级。
- 为进程设置资源限制:使用 Linux cgroups 来设置进程的 CPU 使用上限,可以防止由于某个应用自身的问题,而耗尽系统资源。
- NUMA(Non-Uniform Memory Access)优化:支持 NUMA 的处理器会被划分为多个 node,每个 node 都有自己的本地内存空间。NUMA 优化,其实就是让 CPU 尽可能只访问本地内存。
- 中断负载均衡:无论是软中断还是硬中断,它们的中断处理程序都可能会耗费大量的 CPU。开启 irqbalance 服务或者配置 smp_affinity,就可以把中断处理过程自动负载均衡到多个 CPU 上。