V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jonsmith
V2EX  ›  程序员

PVE 故障 500,虚拟机无法重启,如何处理?

  •  
  •   jonsmith · 3 天前 · 1800 次点击

    PVE 今天突然故障了,请教下如何处理?现象如下:

    • SSH 可以正常连接,但有些命令无法执行,reboot 重启也无效,虚拟机和宿主机都无法关机或重启
    • PVE 管理页面 local-lvm 报错:no such logical volume pve/data(500),如图

    示例图片

    第 1 条附言  ·  2 天前
    是一台 AMD 小主机,配的一块 M2 固态。用了快一年了,一直没动过。
    34 条回复    2025-01-16 16:51:52 +08:00
    yc8332
        1
    yc8332  
       3 天前
    是不是额外的磁盘没挂上,重新挂一下看看,不然就是磁盘有问题
    xiaoranj
        2
    xiaoranj  
       3 天前
    no such logical volume pve/data(500) 磁盘掉了/坏了 ?
    991547436
        3
    991547436  
       2 天前
    实体机看看 raid 挂了没
    qW7bo2FbzbC0
        4
    qW7bo2FbzbC0  
       2 天前
    开 ssh ,我帮你远程看下
    coldle
        5
    coldle  
       2 天前
    感觉是盘挂了,建议描述下硬件情况
    jonsmith
        6
    jonsmith  
    OP
       2 天前
    @yc8332 最近没动过硬盘,怎么重新挂载?
    jonsmith
        7
    jonsmith  
    OP
       2 天前
    @xiaoranj 别啊,这个 AMD 小主机,刚用了没一年呢
    jonsmith
        8
    jonsmith  
    OP
       2 天前
    @qW7bo2FbzbC0 内网机器不方便远程呢
    jonsmith
        9
    jonsmith  
    OP
       2 天前
    @coldle AMD 小主机,配的一块 M2 固态 1T ,常年开着,跑一些 docker ,平时开发用
    aru
        10
    aru  
       2 天前
    看下主机在线时间,如果没重启过,就是硬盘坏了
    aru
        11
    aru  
       2 天前
    大概率硬盘挂了,重新接下 m2 再开机吧
    如果开不了,那只能换硬盘重装系统了
    totoro625
        12
    totoro625  
       2 天前
    目测 SSH 能连接,fdisk 把 locla-lvm 分区容量扣 10G 下去
    jonsmith
        13
    jonsmith  
    OP
       2 天前
    @aru 如果是硬盘坏了,为啥 SSH 能连接,文件内容也能看到。好奇怪
    jonsmith
        14
    jonsmith  
    OP
       2 天前
    @totoro625 怎么执行?在 pve 终端执行命令都返回:-bash: /usr/bin/*: Input/output error
    kokutou
        16
    kokutou  
       2 天前
    df -h
    pvs
    vgs
    lvs -a
    fdisk -l
    lsblk
    blkid
    都贴一下吧
    kkk123
        17
    kkk123  
       2 天前
    dmesg
    journalctl -e
    看看日志里的 error
    jonsmith
        18
    jonsmith  
    OP
       2 天前
    jonsmith
        19
    jonsmith  
    OP
       2 天前
    @kkk123 上面是日志,麻烦看下
    aru
        20
    aru  
       2 天前
    @jonsmith
    -bash: /usr/bin/*: Input/output error 这就是硬盘读取失败最明显的信息
    硬盘坏了,但是常用文件在内存缓存内,所以直接读内存返回了
    别挣扎了,就是硬盘故障。如果有重要的小文件,可以尝试备份下
    然后关机重新接下硬盘,看能不能恢复(有时候接口问题或硬盘、控制器过热,重新接下可能会恢复)
    aru
        21
    aru  
       2 天前
    你的日志也指向了硬盘故障
    不信群里大佬的分析,你就让 AI 分析日志吧
    guanzhangzhang
        22
    guanzhangzhang  
       2 天前
    终端上 Input/output error 就是盘坏掉了,而且你这前面的路径是系统盘路径。
    vm 上能 ssh 就 ssh 上去把数据备份下。然后准备一个 ISO 的 Linux 启动到内存修复下 pve 的系统盘试试
    1462326016
        23
    1462326016  
       2 天前
    前段时间刚坏过一块硬盘,也是一样的 Input/output error ,只不过我的是数据盘,不是系统盘,也是一块固态,所以确定是硬盘坏了,不要重启,抓紧时间备份换硬盘吧,重启了可能就起不来了
    snoopygao
        24
    snoopygao  
       2 天前
    有一定概率重启自动 fsck 就好了
    jonsmith
        25
    jonsmith  
    OP
       2 天前
    @1462326016 测试机,倒没什么重要数据,就是要重新安装一遍,烦。这吊固态没有 nas 的机械盘稳
    jonsmith
        26
    jonsmith  
    OP
       2 天前
    @snoopygao 嗯嗯,晚点我试试
    SSang
        27
    SSang  
       2 天前
    大概率是你改了 ip 或者 hostname 导致的
    SSang
        28
    SSang  
       2 天前
    不对,应该就是磁盘掉了,不一定是磁盘问题,也有可能是主板问题。

    你应该 fsck 先尝试修复,不行的话,试试换到别的主板上。如果别的主板也不行,那就是磁盘换了
    kkk123
        29
    kkk123  
       2 天前
    pve -> Disk/磁盘下看看 SMART 状态,有可能是死期到了
    jonsmith
        30
    jonsmith  
    OP
       2 天前
    @kkk123 强制关电源重启,又恢复正常了,哈哈。SMART 状态健康,硬盘没问题。这个问题真奇怪。
    https://minio.hoopan.net/lobe/files/482485/5772a536-3060-4df4-9b41-5d9de1cf306f.png
    XiaoBu1
        31
    XiaoBu1  
       2 天前
    推荐用 pbs ,出问题直接删了虚拟机再恢复
    comlewin
        32
    comlewin  
       1 天前
    你这问题我前两天刚遇到过,报错日志一样,不过宿主机无法 ssh 登录,只能重启,重启后恢复正常。网上查了下资料应该是掉盘了,要么是硬盘问题要么是电源的问题,ssd 是三星的 990OPRO 新的用了不到一个月,网上有反馈 990pro 有掉盘的缺陷,但是我的应该是电源问题,我前段时间在主板 bios (华硕 b650M )上开启了最大节省电能的开关。
    jonsmith
        33
    jonsmith  
    OP
       1 天前
    @comlewin 我高兴早了,读写稍微多一点,磁盘 IO 速度会变慢、甚至超时。监测了硬盘温度不高,搞不清楚啥问题。晚点把硬盘拆下来测试下。
    jonsmith
        34
    jonsmith  
    OP
       1 天前
    @XiaoBu1 嗯嗯,以后加上备份
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2930 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 03:53 · PVG 11:53 · LAX 19:53 · JFK 22:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.