在cdh执行任务时,发现资源严重不足,但同时又没跑着其他大型任务
先通过top命令 ,再按M查看
发现这种进程(cdh的监控采集进程)占据了大量资源,再查看其的父pid发现是系统1号进程,所以判断可能是异常宕机等导致了这些进程未关闭由系统1号进程接管,但已经无法正常工作,也未正常关闭,占用着大量资源
#查看 ps aux|head -1;ps aux|grep -v PID|sort -rn -k +4|head
#kill僵尸进程 ps -ef|grep collect_host_stats.py|awk ‘{print $2}‘|xargs kill
清理僵尸进程后
原文:https://www.cnblogs.com/huangguoming/p/13159398.html