主要工具:vmstat
主要工具:free
主要工具:iostat、sar
主要工具:ifstat
主要工具:top

vmstat 命令结果分析:
r 运行和等待CPU时间片的进程数,。
b 等待资源的进程数。
si 每秒从磁盘读入虚拟内存的大小。
so 每秒虚拟内存写入磁盘的大小。
us 用户进程CPU使用率。
sy 系统CPU使用率。
id 空闲CPU使用率。
id + us + sy = 100。
经验:
procs:r 如果长期大于CPU的个数,说明CPU遇到瓶颈。procs:b 值越高,系统压力越大。swap:si 如果这个值大于0,表示物理内存不够用或者内存泄露了。cpu:us 值越高,说明用户进程消耗CPU时间越多,如果长期大于50%,需要考虑优化程序。cpu:sy 如果太高,表示系统调用时间长,例如是IO操作频繁。
如果 us + sy 大于80%,说明可能存在CPU不足。

free 命令重点指标:free(应用程序可用内存数量)。
经验:

iostat 命令结果分析:
rkB/s 每秒读取数据量kBwkB/s 每秒写入数据量kBsvctm I/O请求的平均服务时间,单位毫秒await I/O请求的平均等待时间,单位毫秒,值越小,性能越好util 1秒中有百分几的时间用于I/O操作。接近100%时,表示磁盘带宽跑满。经验:
rkB/s 和 wkB/s 的值如果长期较高,说明持续有大量数据读写,需要警惕。svctm 和 await 值相近时,说明几乎没有I/O等待,磁盘性能好。如果 await 远高于 svctm,说明I/O队列等待太长,需要优化程序或更换磁盘。
ifstat 命令结果分析:
RX Pkts/Rate 数据包接收流量RX Errs/Drop 丢包TX Pkts/Rate 数据包发送流量RX Data/Rate 数据接收流量TX Data/Rate 数据发送流量
top 命令重要指标:load average,表示任务队列的平均长度(1分钟、5分钟、15分钟前到现在平均值)。
经验:
这3个值的大小一般不能大于系统CPU的核数,如果长期大于CPU的核数,说明CPU很繁忙,负载很高。
例如图中有2个CPU,那么健康值为:load average < 2。

原文:https://www.cnblogs.com/yogoup/p/11980757.html