cpu是影响linux性能的主要因素之一。
vmstat命令,vmstat命令可以显示各种关于系统资源之间相关性能的简要信息,住要用他来看cpu的一个负载情况。
对上面的每项输出解释如下
-
procs重点
- r列表表示运行和等待cpu时间片的进程数,这个值如果长期大于系统cpu的个数,说明cpu不足,需要增加cpu。
- b列表表示等待资源的进程数,比如正在等待I/O或者内存交换等。
-
memory
- swpd是切换到内存交换区的内存数量(以kb为单位)。如果swpd的值不为0,或者比较大,只要si、so的值长期为0,这种情况下一般就不用担心,他不会影响系统性能。
- free列表表示当前空闲的物理内存数量(以kb为单位)
- buff列表示缓冲区缓存的内存数量,一般对块设备的读写才需要缓冲。
- cache列表示页面缓存的内存数量,一般作为文件系统缓存,频繁访问的文件都会被缓存,如果cache值较大,说明缓存的文件数较多,如果此时io中bi比较小,说明文件系统效率比较好。
-
swap
- si列表示由磁盘调入内存,也就是内存进入内存交换区的数量
- so列表示由内存调入磁盘,也就是内存交换区进入内存的数量。
一般情况下,si,so的值都为0.如果si、so的值不为0,则表示系统内存不足,需要增加系统内存。
-
io项显示磁盘读写状况
- bi列表示从块设备读入数据的总量(既读磁盘)(每秒kb)
- bo列表示写入到块设备的数据总量(既写磁盘)(每秒kb)
这里设置的bi+bo参考值为1000,而且wa值较大,则表示系统磁盘i/o有问题,应该考虑提高磁盘的读写性能。
-
system显示采集间隔内发生的中断次数。
- in列表示在某一段时间间隔中观测到的每秒设备中断次数
- cs列表示每秒产生的上下文切换次数
上面这两个值越大,会看到由内核占用cpu的时间会越多。
-
cpu项显示了cpu的使用状态重点
- us列显示了用户进程占用cpu的时间百分比,us的值比较高时,说明用户进程占用的cpu的时间多,但是如果长期大于50%,就需要考虑优化程序或算法。
- sy显示了内核进程占用cpu的时间百分比,sy的值较高时,说明内核消耗的cpu资源很多。
根据经验,us+uy的参考值为80%,如果us+uy大于80%说明可能存在cpu资源不足。
- id列显示了cpu处在空闲状态的时间百分比
- wa列显示了i/o等待所占用的cpu时间百分比。wa值越高,说明i/o等待越严重。根据经验,wa的参考值为20%,如果wa超过了20%,说明i/o等待严重,引起i/o等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘或者磁盘控制器的带宽瓶颈造成的(主要是块操作)。
sar命令
sar命令对系统的cpu统计输出
- %user列显示了cpu处在空闲状态的时间的百分比
- %nice列显示了运行正常进程占用cpu的时间百分比
- %System 列显示了系统进程占用cpu的时间百分比
- %iowait列显示了i/o等待所占用cpu的时间百分比
- %steal列显示了在内存中相对紧张的环境下pagein强制对不同的页面进行的steal操作
- %idle列显示了cpu处在空闲状态的时间百分比
这个输出是对系统整体cpu使用状况的统计,每项输出都非常直观,最后一个是汇总行,是上面统计信息的一个平均值。
在一个多cpu的系统中,如果程序使用单线程,会出新这样一个现象,cpu的整体使用率不高,但是系统应用响应缓慢。这可能是程序使用单线程的原因,单线程只使用一个cpu,导致这个cpu占用率100%,无法处理其他请求,而其他的cpu却闲置,这就导致了整体cpu使用率不高,而应用缓慢现象的发生。
针对这个问题,可以系统的每个cpu分开查询,统计每个cpu使用的情况。
sar中对cpu的计数是从0开始的,表示对系统的第一颗cpu进行统计,依此类推。
uptime命令
uptime是监控系统性能最常用的一个命令,主要用来统计系统当前的运行状况。输出的信息依次为:系统现在的时间、系统从上次开机到现在运行了多长时间、有多少用户登陆、系统在1分钟内,5分钟内,15分钟内的平均负载。
注意:load average的三个值长期大于系统中cpu个数,说明cpu很繁忙,负载很高,可能会影响系统性能,但是偶尔大于系统中cpu个数,也不用担心,一般不会影响系统性能,相反,load average的三个值长期小于系统中cpu个数**,则表示cpu还有空闲时间片,cpu是非常空闲的。
推荐文章:https://www.jianshu.com/p/e80dd95a039d
- 邮箱 :ithelei@sina.cn
- Good Luck!