1.CPU各项指标
可以从 /proc/stat中查看CPU的各项指标
/proc/stat提供的就是系统的 CPU 和任务统计信息
/proc/[pid]/stat看单个进程的CPU使用情况
# 只保留各个 CPU 的数据
$ cat /proc/stat | grep ^cpu
user(通常缩写为 us),代表用户态 CPU 时间。注意,它不包括下面的 nice 时间,但
包括了 guest 时间。
nice(通常缩写为 ni),代表低优先级用户态 CPU 时间,也就是进程的 nice 值被调整
为 1-19 之间时的 CPU 时间。这里注意,nice 可取值范围是 -20 到 19,数值越大,优
先级反而越低。
system(通常缩写为 sys),代表内核态 CPU 时间。
idle(通常缩写为 id),代表空闲时间。注意,它不包括等待 I/O 的时间(iowait)。
iowait(通常缩写为 wa),代表等待 I/O 的 CPU 时间。
irq(通常缩写为 hi),代表处理硬中断的 CPU 时间。
softirq(通常缩写为 si),代表处理软中断的 CPU 时间。
steal(通常缩写为 st),代表当系统运行在虚拟机中的时候,被其他虚拟机占用的
CPU 时间。
guest(通常缩写为 guest),代表通过虚拟化运行其他操作系统的时间,也就是运行虚
拟机的 CPU 时间。
guest_nice(通常缩写为 gnice),代表以低优先级运行虚拟机的时间。
2.CPU 使用率计算公式
CPU 使用率就是除了空闲时间外的其他时间占总 CPU 时间的百分比
性能工具计算 CPU 使用率:
取一段间隔计算平均的使用率,不同的性能工具间隔差不同
3.如何查看CPU使用率
3.1从/proc/stat 和 /proc/[pid]/stat中看
3.2 使用性能工具TOP,PS
top 显示了系统总体的 CPU 和内存使用情况,以及各个进程的资源使用情况。
ps 则只显示了每个进程的资源使用情况。
3.3 pidstat查看每个进程 CPU 使用情况
4.CPU过高如何分析
4.1使用top、ps、pidstat 等工具,找到 CPU 使用率较高的进程。
4.2使用 perf 进程里的具体函数
用户 CPU 和 Nice CPU 高,说明用户态进程占用了较多的 CPU,所以应该着重排查进
程的性能问题。
系统 CPU 高,说明内核态占用了较多的 CPU,所以应该着重排查内核线程或者系统调
用的性能问题。
I/O 等待 CPU 高,说明等待 I/O 的时间比较长,所以应该着重排查系统存储是不是出现
了 I/O 问题。
软中断和硬中断高,说明软中断或硬中断的处理程序占用了较多的 CPU,所以应该着重
排查内核中的中断服务程序
4.3
execsnoop 分析短时进程
使用场景:
第一,应用里直接调用了其他二进制程序,这些程序通常运行时间比较短,通过 top 等工具也不容易发现。
第二,应用本身在不停地崩溃重启,而启动过程的资源初始化,很可能会占用相当多的CPU。