V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
spr1ngs
V2EX  ›  Linux

公司要求写 Linux 故障一天一个,我只能想到几个

  •  1
     
  •   spr1ngs · 2022-11-19 11:51:43 +08:00 · 8385 次点击
    这是一个创建于 722 天前的主题,其中的信息可能已经有所发展或是发生改变。

    故障解决方案最好长点的,太短不行,但是我想不到多少故障,百度搜索也就几个,大哥们帮忙想想办法吧

    最好是 linux 故障 软硬件都行 tomcat 也行 我实在凑不够数

    46 条回复    2022-11-25 08:44:17 +08:00
    securityCoding
        1
    securityCoding  
       2022-11-19 11:57:32 +08:00
    这是吃了不得消啊,没啥价值,还不如从业务场景找找 cpu/内存 /线程 case
    treo
        2
    treo  
       2022-11-19 12:05:35 +08:00   ❤️ 1
    人为故障:rm -rf /*
    解决方案:跑路
    ho121
        3
    ho121  
       2022-11-19 12:07:27 +08:00 via Android
    ho121
        4
    ho121  
       2022-11-19 12:08:16 +08:00 via Android
    zfyp
        5
    zfyp  
       2022-11-19 12:10:31 +08:00
    这是要写故障分析报告?没故障发生的就瞎写?
    edis0n0
        6
    edis0n0  
       2022-11-19 12:12:14 +08:00   ❤️ 2
    故障:业务太稳定了
    解决方案:没事干就随手 systemctl restart docker
    spr1ngs
        7
    spr1ngs  
    OP
       2022-11-19 12:12:16 +08:00
    @zfyp 每天一天 有时候 1 天 3 条
    edis0n0
        8
    edis0n0  
       2022-11-19 12:13:20 +08:00
    @edis0n0 #6 update:
    故障:业务太稳定了,领导太闲了要没事找事干
    解决方案:没事干的时候就随手 systemctl restart docker
    zfyp
        9
    zfyp  
       2022-11-19 12:18:32 +08:00
    每天 1-3 次,估计都是相似的、重复的故障现象了,总结一下故障现象,深入排查提出解决方案把问题解决了。
    adoal
        10
    adoal  
       2022-11-19 12:18:45 +08:00 via iPhone   ❤️ 6
    混沌工程搞起来,没故障也要有故障。
    创造条件,创造条件。
    spr1ngs
        11
    spr1ngs  
    OP
       2022-11-19 12:28:52 +08:00
    @zfyp 没办法,我头都大了 需要不重复的写 70 条
    SimonOne
        12
    SimonOne  
       2022-11-19 12:31:47 +08:00
    @zfyp #9 是要求 op 写 linux 的故障和解决方案,一天写一个,不是有 linux 故障一天 1-3 次要 op 解决。
    op 就是因为没有遇到那么多问题,所以才苦恼写不出来。
    cmdOptionKana
        13
    cmdOptionKana  
       2022-11-19 12:36:48 +08:00
    去 StackOverflow 找找看?
    xyjincan
        14
    xyjincan  
       2022-11-19 12:55:43 +08:00   ❤️ 1
    1.硬盘坏了
    2.硬盘坏了,不上电
    3.内存坏了,内核崩溃
    4.内存坏了,不能开机
    4.内存坏了,卡 bios
    5.光模块坏了,灯不亮
    6.日志满了,系统崩溃
    7.软件内存溢出 bug ,系统内存满了
    8.第三方服务假死崩溃,调用堵塞卡死
    9.raid 卡坏了,,,,
    10.mysql 文件损坏,疯狂报错
    Andreas8
        15
    Andreas8  
       2022-11-19 12:57:56 +08:00   ❤️ 3
    我第一反应是:奇葩公司😁
    Foxkeh
        16
    Foxkeh  
       2022-11-19 13:22:40 +08:00   ❤️ 1
    无法开机: 没插电源
    zhangxs1989
        17
    zhangxs1989  
       2022-11-19 13:25:38 +08:00
    是不是想逼你辞职啊
    lwjef
        18
    lwjef  
       2022-11-19 13:36:00 +08:00 via iPhone
    比如配置错误故障,能写好多吧
    spr1ngs
        19
    spr1ngs  
    OP
       2022-11-19 14:03:19 +08:00
    @zhangxs1989 和甲方要钱 一条故障最少 300
    spr1ngs
        20
    spr1ngs  
    OP
       2022-11-19 14:07:48 +08:00
    @zhangxs1989 主要甲方估计给的钱很多,但是系统这里体现不出工作量,就只能一天一条这么写
    gchust
        21
    gchust  
       2022-11-19 14:42:35 +08:00   ❤️ 2
    https://sadservers.com/ 这里有十几条
    chengs
        22
    chengs  
       2022-11-19 15:39:53 +08:00
    @edis0n0 如果是集群呢?
    aphrodite
        23
    aphrodite  
       2022-11-19 15:55:29 +08:00
    猫咬坏了猫
    spr1ngs
        24
    spr1ngs  
    OP
       2022-11-19 16:13:12 +08:00
    @chengs 是 HBASE SPARK
    zhaogaz
        25
    zhaogaz  
       2022-11-19 16:15:22 +08:00
    领导挺好,写了交上去,你们不会被干掉。
    spr1ngs
        26
    spr1ngs  
    OP
       2022-11-19 17:49:51 +08:00
    @zhaogaz 问题哪里弄这么多故障啊
    liuxingdeyu
        27
    liuxingdeyu  
       2022-11-19 17:54:19 +08:00
    建议买一本红帽教材,很多知识点都能写
    msaionyc
        28
    msaionyc  
       2022-11-19 19:57:05 +08:00 via iPhone
    编故障也是个技术活…瞎编到时候随机挑几个要复盘,要纪要,你们咋编,总不能几十个都编出来等着吧
    8zip
        29
    8zip  
       2022-11-19 19:59:51 +08:00 via Android
    老鼠把网线咬断了
    superrichman
        30
    superrichman  
       2022-11-19 20:00:46 +08:00 via Android
    下个 aida64 ,每个硬件的参数都给成异常不就是了
    0bing
        31
    0bing  
       2022-11-19 20:04:55 +08:00
    HDD, 0:0 坏了,0:1 坏了,0:10 坏了...你懂了没?
    还有那些热拔插的,大把!
    spr1ngs
        32
    spr1ngs  
    OP
       2022-11-19 20:07:26 +08:00
    @msaionyc 每个都有纪要的 我现在就在补记录,2022 年差不多 500 个 还都要写详细问题 详细解决方法 还要打印出来装订
    oneisall8955
        33
    oneisall8955  
       2022-11-19 21:46:06 +08:00 via Android
    从软件层好多可以写,基础组件方向,例如:
    mysql ,jvm ,redis ,mongodb ,es ,nacos ,nginx ,mq 等等等
    ration
        34
    ration  
       2022-11-19 22:31:35 +08:00 via Android
    软件升级打补丁?安全漏洞方面?
    freshmanc
        35
    freshmanc  
       2022-11-19 23:46:44 +08:00
    最近似乎不偶然的。。。PCIE 设备挂掉然后让 CUP 报错机器 shutdown 了。。
    解决方式:掉电重启。。。。
    danhahaha
        36
    danhahaha  
       2022-11-20 04:05:29 +08:00
    去搜索各种 linux 未解决,无人回答的问题, 然后解决方案一律是"赋予文件权限之后问题解决" , 轻松够你用一年, 还挑不出毛病
    zhaogaz
        37
    zhaogaz  
       2022-11-20 09:30:35 +08:00
    你去搜翻翻那个 开源软件的 bugfix 呗。读一读,抄一抄,改一改。
    反正你大概知道怎么回事儿,你能讲出来,别人讲不出来就行。。。
    spr1ngs
        38
    spr1ngs  
    OP
       2022-11-20 09:50:24 +08:00
    @zhaogaz 主要是 linux 系统和 tomcat 然后 这些东西我怎么写 故障描述啊 不是很好写啊
    qeqv
        39
    qeqv  
       2022-11-20 13:35:53 +08:00
    老说运维是个没用的部门,原来还有这种方式刷存在感
    cnbatch
        40
    cnbatch  
       2022-11-20 21:07:37 +08:00
    如果连 OpenSSH 都算的话,那就找一下 OpenSSH 的各种“故障”,然后把答案翻译成中文。
    之所以加双引号,是因为其实很多“故障”其实不是故障,而只是没配置好而已。例如什么证书过期之类的,防火墙没打开相应端口,等等。
    按照这个思路,可以把 Linux 的常见服务都列出来,然后去 serverfault superuser 进入 Linux 标签,把一些热门问题翻译成中文当成故障。
    bjzhush
        41
    bjzhush  
       2022-11-21 10:27:01 +08:00
    造点呗,比如 crash 了,升级 or 打补丁后修复了
    比如偶发网络故障,丢包,优化参数后修复了
    反正看这个报告的人也看不懂,随便忽悠
    libook
        42
    libook  
       2022-11-21 12:03:57 +08:00
    看项目上用了啥,比如 MySQL ,就去搜索引擎搜索“MySQL 故障“,参考各种博客文章。

    看系统里用了哪些软件包,然后去 Arch Wiki 上搜对应的词条,拉到最下面看 Troubleshooting ,绝大部分信息主流发行版通用。

    另外逛 Stackoverflow 和 Super User ( StackExchange 旗下的)也可以。
    yklaxds
        43
    yklaxds  
       2022-11-22 12:19:25 +08:00   ❤️ 2
    建议随便找一个 Linux 相关贴吧,里面全都是各种故障。只有你想不到没有他没有的。
    JohnBull
        44
    JohnBull  
       2022-11-23 16:14:53 +08:00
    真空衰变导致了宇宙再一次终结,服务下线无法恢复
    levenwindy
        45
    levenwindy  
       2022-11-25 02:09:28 +08:00 via Android
    @yklaxds 确实,每天去红迪逛一逛
    故障:标题
    方案:评论
    spr1ngs
        46
    spr1ngs  
    OP
       2022-11-25 08:44:17 +08:00
    @levenwindy 并不是是故障 我就能用的上 就敢写上去
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3012 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 13:56 · PVG 21:56 · LAX 05:56 · JFK 08:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.