已上线的服务要配置自动化监控,做到在问题出现之前发现问题,解决问题,防患于未然。当然,定期对服务器进行一次全面检查也是不可缺少的。针对服务器检查,我整理了一下常用的命令。
使用命令 vmstat 2 10
或者使用命令 top
使用命令 free -m
使用命令 df -m
使用以下命令,检查是否有报错信息
cat /var/log/messages|grep ERROR
dmesg |grep ERROR
使用命令 sar -d 2 10
使用命令 ulimit -a
确认操作系统限制数均已改为最大
使用命令 date
查看是否有时间同步,保持所有服务器一个时间
cat 日志文件 |grep -e ERROR -e error
执行前请注意日志大小,若日志文件非常大,建议使用tail -1000
检查脚本中的JVM参数配置
cat /xxx/jetty/bin/jetty.sh |grep JAVA_OPTIONS
cat /xxx/startup.sh |grep JVM_OPTS
一般是通过 java 或者JVM 作为关键词来查找,单独的应用可根据脚本中定义的应用名字来查询,同时也可查看JVM参数
ps -ef |grep java
登入redis后,执行 info
主要检查内容:
grep ‘^[^#]‘ redis.conf
主要检查内容
日志文件位置请根据配置检查中 logfile 的具体定位具体日志文件
cat redis.log |grep -e ERROR -e error
执行前请注意日志大小,若日志文件非常大,建议使用 tail -1000 。
cat ./conf/zoo.cfg
主要检查确认是否包含自动清理快照的配置,防止因快照太多导致磁盘爆满。
先统计生产环境中子节点数,用zkcli.sh连接后
统计命令:
get /000/xxx/user/lock/certificate
子节点数为numChildren
节点数量统计完成后,可以考虑清除大于20W的节点
cat zookeeper.out |grep -e ERROR -e error
执行前请注意日志大小,若日志文件非常大,建议使用 tail -10000
sh mqadmin clusterList -n 10.253.125.97:19878
确认节点数量正常,状态正常。
cat broker-a.properties
确认以下配置是否已修改
cat broker.log |grep -e ERROR -e error
cat namesrv.log |grep -e ERROR -e error
cat /etc/my.cnf
主要检查
默认超时时间需要设置为 1209600, 慢日志建议打开。
若不清楚慢日志输出在哪儿,可通过执行下面的sql确认慢日志的路径
mysql> show variables like ‘%slow_query_log%‘;
查看慢日志,确认是否存在运行性能较差的sql
确认mysql数据库备份逻辑, 根据实际情况,要求每晚都能做一次备份。 且备份文件要求保留一周。
主从同步查看,确认主从同步进程运行正常。
mysql> show slave status\G ... Slave_IO_Running: Yes Slave_SQL_Running: Yes
原文:https://www.cnblogs.com/zjfjava/p/10836248.html