没有啥实际经验 业务运维经验 一直做到服务器硬件运维 大哥们这个问题应该怎么回答 软件方面的问题
1
seers 2023-01-03 16:17:41 +08:00 via Android
大概率是为什么程序、接口、数据库没反应了
|
2
kokutou 2023-01-03 16:18:45 +08:00 via Android
更新的同时保证业务。。。
|
3
AntonChen 2023-01-03 16:21:53 +08:00
OOM 、服务假死....
|
4
kindom 2023-01-03 16:49:49 +08:00
端口佔用、服務耗用資源突升排查、多隔離服務器校時、內網 DNS
|
5
opengps 2023-01-03 16:50:36 +08:00
慢
|
6
gold2022 2023-01-03 16:56:40 +08:00
内网 dns 失效,oom
|
7
lambdaq 2023-01-03 17:02:47 +08:00
端口炸了 线程炸了 进程炸了 cgroup 炸了 pod 炸了 磁盘炸了 跳板机炸了
|
8
andyskaura 2023-01-03 17:07:59 +08:00
@lambdaq #7 机房炸了
|
9
xmumiffy 2023-01-03 17:09:52 +08:00 via Android 2
机房空调坏了导致消防喷淋?
|
10
wei2629 2023-01-03 17:10:23 +08:00
重启就好了
|
12
yaron 2023-01-03 17:30:25 +08:00
登录不上了
|
13
salmon5 2023-01-03 17:36:40 +08:00
难道不是硬盘爆了?
|
14
ladypxy 2023-01-03 17:37:00 +08:00 via iPhone
硬盘满了
|
15
salmon5 2023-01-03 17:37:01 +08:00
难道不是 java 内存爆了?
|
16
yongp 2023-01-03 17:39:39 +08:00
大概率就是想让你说一种故障,然后回答解决方案、如何监控、以及后续的优化方案吧
|
17
sampeng 2023-01-03 17:44:23 +08:00
没经验就说不知道。。不丢人
|
19
sampeng 2023-01-03 18:16:33 +08:00
@spr1ngs 面试是一个双向筛选的过程,尤其是运维,你靠网上问?就算面试过了,试用期但凡组长较真,试用期就过不去。太多细节了
|
20
cnoder 2023-01-03 18:28:23 +08:00
top1 硬盘满了
|
21
myd 2023-01-03 18:49:44 +08:00
磁盘满了说明运维根本没干活
|
22
aaa5838769 2023-01-03 18:50:37 +08:00
数据查询慢,业务宕了。
|
23
xderam 2023-01-03 18:52:18 +08:00
变更啊,90%以上的故障都是变更引起的。
|
24
asilin 2023-01-03 18:57:06 +08:00 via Android
遇到最多的问题,就是给别人擦屁股
|
25
89ao 2023-01-03 19:03:20 +08:00 1
这是个开放问题,就是让你找个你最熟悉最牛逼的场景来秀技术,这不顺杆子爬吗
|
26
89ao 2023-01-03 19:30:07 +08:00
重点不在于什么问题,在于怎么秀。哪怕磁盘满,也可以从问题分析,影响面排查,监控发现,自动清理,故障恢复,应急预案等方面去展开
|
27
cndns 2023-01-03 19:45:24 +08:00
就说在项目文档里面把 Linux 拼写成 Linxu ,其他没什么大问题
|
28
wu67 2023-01-03 19:52:32 +08:00 1
硬盘爆的见的最多....数据量大又不优化, 然后那个日志越来越大越来越大, 有一次把一台机给直接整挂了, 嘻嘻嘻 /dog
|
30
zhangyichent 2023-01-03 19:59:09 +08:00
显卡驱动掉了
|
31
snuglove 2023-01-03 20:20:47 +08:00
cpu 高的 内存高的 一些软件跑着跑着连不上的 一般都是看程序日志以及重启解决.
|
33
deorth 2023-01-03 23:40:09 +08:00 via Android
rm -rf /
|
34
earneet 2023-01-04 09:09:43 +08:00
硬件频繁故障,服务部署在了自己公司机房,40 个物理机,两个月内两个 cpu 挂逼,三个硬盘挂逼。 找采购要说法,采购说也智能是照章程办事,后来迁移到了阿里云服务器上。
|
35
8355 2023-01-04 09:32:54 +08:00
你回答完之后楼上的回答之后下一个问题就问你怎么处理的?怎么排查为什么会这样以后你怎么避免再次出现你又说不出来了
上面让你踏踏实实直说你还不想....运维有没有经验连个后端都能问死你 |
36
proxychains 2023-01-04 09:44:37 +08:00
@earneet 第一次见 CPU 挂的
|
37
MoYi123 2023-01-04 10:05:42 +08:00
最多的肯定是更新代码更新出 bug 吧.
|
38
dog82 2023-01-04 10:21:15 +08:00
慢 节点挂 重启
|
40
earneet 2023-01-04 13:20:54 +08:00
@proxychains 公司配给我的开发机 cpu 就挂过一个了
|
41
cshlxm 2023-01-04 18:41:32 +08:00
日志把数据盘打满了,数据库把数据盘打满了,新来的运维 rm -rf /*** 了, 服务器网断了,断电重启后服务没起来,硬盘挂了,硬盘挂载不上, 数据损坏造成服务启动不了,升级造成依赖库不可用了,端口冲突造成服务不可用了。。。
|
42
xiaochong2020 2023-01-05 12:37:22 +08:00
假如有一堆 4k 的小文件,占满了 90g 磁盘,你会怎么清理?
|
43
apois 2023-01-05 16:08:08 +08:00
实际经验,翻周报,我们这边周报都会有记录问题和解决方案,如果是商业软件出现新问题的话,先联系售后技术支持解决,可以分担一半责任。
|
46
xyjincan 2023-01-06 09:17:20 +08:00
@xiaochong2020 迁移服务,格盘咋样
|