一、top命令
常见用法:
- top
查看CPU负载、内存占用、buffer/cache、swap情况 - top -Hp pid
查看当前进程线程数、线程占用的资源情况(一般定位线程CPU飙高的场景) - top交互式命令
-m 按内存倒排输出
-P 按CPU占用倒排输出
-c 展示进程的完整路径
详细请看: https://www.cnblogs.com/peida/archive/2012/12/24/2831353.html
二、free命令
常见用法:
- free -k|-m
按KB,MB展示内存 - 查看内存占用情况
[root@10 /data/home/jerrikyang]# free -m
total used free shared buffers cached
Mem: 64198 47069 17129 0 247 870
-/+ buffers/cache: 45950 18247
Swap: 2039 1615 424
如果free很大,一般不用关注,如果used很大,但是buffers,cached占用很大,一般情况下没有问题,linux会自动回收这部分缓存。如果linux由于某些问题不能回收(文件缓存太多导致),这样就很容易导致内存爆满而不能登录机器。考虑在不影响业务的情况下清理系统cache。如果swap中的used为0,说明没有使用虚拟内存,否则需要关注内存不足的情况。
echo 1 > /proc/sys/vm/drop_caches
echo 2 > /proc/sys/vm/drop_caches
echo 3 > /proc/sys/vm/drop_caches
下面推荐一款查看linux buffer/cache的小工具-htop.
有需要的可以取github下载执行文件. https://github.com/djhuahao/hcache
三、iostat命令
Linux系统中的 iostat是I/O statistics(输入/输出统计)的缩写,iostat工具将对系统的磁盘操作活动进行监视
常见用法:
- iostat -d -m 1
每隔1秒查看磁盘的读取和写入情况(-d是表示disk,-m显示MB)
Device: tps MB_read/s MB_wrtn/s MB_read MB_wrtn
sda 25.39 0.00 1.87 145820 88053728
- iostat -c -m 1
每隔1秒查看磁盘、CPU使用率情况(-c是表示cpu,-m显示MB)
avg-cpu: %user %nice %system %iowait %steal %idle
19.14 0.00 5.56 0.02 0.00 75.28
其中iowait表示CPU等待输入输出完成时间的百分比,如果其值比较大(如果超过30),则认为硬盘性能存在问题,可以针对磁盘写入做特定优化或者升级硬盘。
四、vmstat命令
vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、CPU活动进行监控。
参数说明:
r: 运行队列中进程数量
b: 等待IO的进程数量
Memory(内存):
swpd: 使用虚拟内存大小
free: 可用内存大小
buff: 用作缓冲的内存大小
cache: 用作缓存的内存大小
Swap:
si: 每秒从交换区写到内存的大小
so: 每秒写入交换区的内存大小
IO:(现在的Linux版本块的大小为1024bytes)
bi: 每秒读取的块数
bo: 每秒写入的块数
系统:
in: 每秒中断数,包括时钟中断。
cs: 每秒上下文切换数。
CPU(以百分比表示):
us: 用户进程执行时间(user time)
sy: 系统进程执行时间(system time)
id: 空闲时间(包括IO等待时间),中央处理器的空闲时间 。以百分比表示。
wa: 等待IO时间
常见用法:
- vmstat -S m 1
每秒查看一次,单位为MB
[root@TENCENT64 /data/home/jerrikyang]# vmstat -S m 1
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 1 22537 457 8314 0 0 0 6 0 0 3 1 96 0 0
0 0 1 22538 457 8314 0 0 0 0 53958 37303 4 2 95 0 0
- 查看系统的slab信息
vmstat -m
五、dstat命令
dstat相比其它命令提供了更加丰富的功能,其常见用法如下:
- dstat 1
每秒查看一次(不带选项默认为-cdngym);如果想一次性看更多信息,可以执行dstat -cdlmnpsy
- dstat -cyl --proc-count --top-cpu
查看CPU的使用情况
[root@VM_32_173_centos ~]# dstat -cyl --proc-count --top-cpu
----total-cpu-usage---- ---system-- ---load-avg--- proc -most-expensive-
usr sys idl wai hiq siq| int csw | 1m 5m 15m |tota| cpu process
0 0 100 0 0 0| 708 1033 | 0 0.02 0.05| 156|sap1002 0.1
0 0 100 0 0 0| 766 1066 | 0 0.02 0.05| 156|
0 0 100 0 0 0| 704 944 | 0 0.02 0.05| 156|java 0.1
0 0 100 0 0 0| 744 991 | 0 0.02 0.05| 156|sap1002 0.1
- dstat -glms --top-mem
查看内存的使用情况
[root@VM_32_173_centos ~]# dstat -glms --top-mem
---paging-- ---load-avg--- ------memory-usage----- ----swap--- --most-expensive-
in out | 1m 5m 15m | used buff cach free| used free| memory process
0 0 | 0 0.02 0.05|2213M 284M 12.8G 143M| 0 0 |java 994M
0 0 | 0 0.02 0.05|2213M 284M 12.8G 143M| 0 0 |java 994M
0 0 | 0 0.02 0.05|2213M 284M 12.8G 143M| 0 0 |java 994M
- dstat --tcp --socket
查看tcp连接数(包括已经建立连接,关闭,time_wait下的链接);
查看tcp,udp链接数;
[root@VM_32_173_centos ~]# clkear^C
[root@VM_32_173_centos ~]# clear
[root@VM_32_173_centos ~]# dstat --tcp --socket
----tcp-sockets---- ------sockets------
lis act syn tim clo|tot tcp udp raw frg
7 7 0 0 0|191 14 5 0 0
7 7 0 0 0|191 14 5 0 0
分别代表listen, established, syn, time_wait, close状态.
total, tcp, udp, raw, ip-fragments
- dstat -dn --top-io --disk-util
查看磁盘、网络、最耗io的进程以及磁盘的忙碌状态
[root@VM_32_173_centos /data/home/jerrikyang]# dstat -dn --top-io --disk-util
-dsk/total- -net/total- ----most-expensive---- sda-
read writ| recv send| i/o process |util
2002B 142k| 0 0 |init 1512k 2553k|0.10
0 72k|2328k 4086k|java 350k 1019k| 0
六、其它命令
# 清理虚拟内存
echo 3 > /proc/sys/vm/drop_caches
# 查看线程数
cd /proc/x/task
top -Hp pid -> tasks
# 查看网卡带宽
ethtool eth1
# 查看网络连接状态(connected,listen)
netstat -nalp
#查看tcp
netstat -nltp
#查看udp
netstat -nlup
#查看进程打开的文件
lsof -p pid
#查看服务器硬件信息
dmidecode
#查看主板型号
lspci
#查看cpu型号
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
#查看实际cpu数量(物理)
grep 'physical id' /proc/cpuinfo | sort | uniq | wc -l
#查看物理CPU的核心数
cat /proc/cpuinfo |grep "cores"|uniq
#查看CPU主频
cat /proc/cpuinfo |grep MHz|uniq
#查看CPU相关信息
lscpu
#查看CPU运行模式
getconf LONG_BIT -- 64
#dstat配置快捷命令
alias dstat='dstat -cdlmnpsy'
#查看系统内核日志
/var/log/dmesg -> dmesg
#系统日志(IO 错误、网络错误和其他系统错误都会记录到这个文件中)
/var/log/messages
#查看服务器tcp状态(dstat --tcp --socket)
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
#测试硬盘读写性能
hdparm -t /dev/vdb1
#测试硬盘iops
fio -filename=/dev/sda -direct=1 -iodepth 1 -thread -rw=randrw -rwmixread=70 -ioengine=psync -bs=16k -size=200G -numjobs=30 -runtime=100 -group_reporting -name=my_test
七、strace
参数:
-c 统计每一系统调用的所执行的时间,次数和出错的次数等.
-d 输出strace关于标准错误的调试信息.
-f 跟踪由fork调用所产生的子进程.
-ff 如果提供-o filename,则所有进程的跟踪结果输出到相应的filename.pid中,pid是各进程的进程号.
-F 尝试跟踪vfork调用.在-f时,vfork不被跟踪.
-h 输出简要的帮助信息.
-i 输出系统调用的入口指针.
-q 禁止输出关于脱离的消息.
-r 打印出相对时间关于,,每一个系统调用.
-t 在输出中的每一行前加上时间信息.
-tt 在输出中的每一行前加上时间信息,微秒级.
-ttt 微秒级输出,以秒了表示时间.
-T 显示每一调用所耗的时间.
-v 输出所有的系统调用.一些调用关于环境变量,状态,输入输出等调用由于使用频繁,默认不输出.
-V 输出strace的版本信息.
-x 以十六进制形式输出非标准字符串
-xx 所有字符串以十六进制形式输出.
-a column
设置返回值的输出位置.默认 为40.
-e expr
指定一个表达式,用来控制如何跟踪.格式如下:
[qualifier=][!]value1[,value2]...
qualifier只能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用来限定的符号或数字.默认的 qualifier是 trace.感叹号是否定符号.例如:
-eopen等价于 -e trace=open,表示只跟踪open调用.而-etrace!=open表示跟踪除了open以外的其他调用.有两个特殊的符号 all 和 none.
注意有些shell使用!来执行历史记录里的命令,所以要使用\\.
-e trace=set
只跟踪指定的系统 调用.例如:-e trace=open,close,rean,write表示只跟踪这四个系统调用.默认的为set=all.
-e trace=file
只跟踪有关文件操作的系统调用.
-e trace=process
只跟踪有关进程控制的系统调用.
-e trace=network
跟踪与网络有关的所有系统调用.
-e strace=signal
跟踪所有与系统信号有关的 系统调用
-e trace=ipc
跟踪所有与进程通讯有关的系统调用
-e abbrev=set
设定 strace输出的系统调用的结果集.-v 等与 abbrev=none.默认为abbrev=all.
-e raw=set
将指 定的系统调用的参数以十六进制显示.
-e signal=set
指定跟踪的系统信号.默认为all.如 signal=!SIGIO(或者signal=!io),表示不跟踪SIGIO信号.
-e read=set
输出从指定文件中读出 的数据.例如:
-e read=3,5
-e write=set
输出写入到指定文件中的数据.
-o filename
将strace的输出写入文件filename
-p pid
跟踪指定的进程pid.
-s strsize
指定输出的字符串的最大长度.默认为32.文件名一直全部输出.
-u username
以username 的UID和GID执行被跟踪的命令