服务器间歇性 CPU 100%,出问题的时候 ssh 连不上,等连上了现象已经消失了。
所以想问一下,这种情况下怎么定位问题呢? sar 只能看到历史系统信息,不能定位到是哪个进程出了问题。
看现象是有个 system 进程一直在读 io
1
feather12315 2019-09-08 10:44:23 +08:00 via Android
|
2
patx 2019-09-08 10:54:01 +08:00
nmon 工具,有采集数据的功能
|
3
cdlnls 2019-09-08 11:02:06 +08:00
有一个 sar 的日志,应该是你需要的
|
4
cdlnls 2019-09-08 11:03:21 +08:00
尴尬😅
|
5
mikeguan 2019-09-08 11:07:38 +08:00 via Android
这个 IO 高的时间也不短了,人肉注意一下应该能抓到搞事的进程
|
6
azh7138m 2019-09-08 11:14:52 +08:00
@feather12315 这种机翻 so 的垃圾站也贴出来
|
7
feather12315 2019-09-08 11:28:10 +08:00 via Android
@azh7138m #6 没注意,搜了下这看看觉得挺好,就贴出来了。
|
8
Hconk 2019-09-08 12:06:47 +08:00 via iPhone
|
9
miao666 2019-09-08 12:08:36 +08:00 via iPhone
套路☁️控制面板
|
10
LZSZ 2019-09-08 12:15:31 +08:00
是不是被挖矿了哦
|
11
Enya 2019-09-08 12:42:34 +08:00 via iPhone
参考命令:
watch -n 60 ‘ps -elf &> /var/log/watch.out;echo t > /proc/sysrq-trigger &> /var/log/sysrq.out’ & 大概是这样,手机敲的,自己先验证一下吧 |
12
BigDogWang OP 感谢各位回复~容我试试
|
13
ackoly 2019-09-08 16:26:40 +08:00 via iPhone
看 /var/message 日志
|