V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
lzz2394677796
V2EX  ›  NAS

速求标准答案,谢谢:群晖 raid5 增加一块硬盘正扩容中,预计 40 小时后 100%。但接通知今晚公司会检修断电,到时群晖异常断电会不会影响 raid5 内原数据??

  •  
  •   lzz2394677796 · 2020-09-11 13:54:31 +08:00 · 12699 次点击
    这是一个创建于 1532 天前的主题,其中的信息可能已经有所发展或是发生改变。

    是否可以现在提前正常关机?( btw 无 ups )

    107 条回复    2020-09-22 14:36:59 +08:00
    1  2  
    crc8
        1
    crc8  
       2020-09-11 14:09:13 +08:00   ❤️ 2
    这个问题我觉得发明 RAID5 的时候已经有人想过了,不过呢,我看到群晖二字后,有点忐忑。
    Ariver
        2
    Ariver  
       2020-09-11 14:10:20 +08:00   ❤️ 1
    你可以现在直接把新加的硬盘拔下来看看会发生什么。
    Tink
        3
    Tink  
       2020-09-11 15:46:02 +08:00 via Android
    Tink
        4
    Tink  
       2020-09-11 15:46:15 +08:00 via Android
    现在赶紧买 ups,还来得及
    Osk
        5
    Osk  
       2020-09-11 16:02:25 +08:00 via Android   ❤️ 1
    @Tink 买 ups 也悬,接 ups 首先要把 nas 插头拨了吧 /doge/
    elfive
        6
    elfive  
       2020-09-11 16:04:28 +08:00 via iPhone
    不确定,我组的是 Raid10,重建过程中正常关机,重启后从头重建,没有啥问题。

    但你这个是扩容,涉及到数据资料在硬盘间的移动,可能会出问题,建议赶紧电话联系群晖工程师,直接问得到的答案会比较靠谱。

    如果联系不到,也没买到 UPS (实际买了不一定有用,UPS 要能撑过检修的那段时间,价格可能也不菲了),你可以尝试进 DSM,在右上角用户那里点击关机,如果有警告提示,则按提示操作(提示不允许那就是不能关机),如果没有提示(在不需要我负责的情况下)可以尝试关机……
    mhycy
        7
    mhycy  
       2020-09-11 16:14:52 +08:00
    会,基于 MDADM 的群晖甚至会写花
    可以确定的是,掉电过后,原始数据和扩容数据一并乱套,且如果直接开机会导致数据有永远不可挽回的丢失
    mhycy
        8
    mhycy  
       2020-09-11 16:16:42 +08:00
    正确做法是,准备好灾难恢复:
    把磁盘一个个独立接入到某个 PC,并准备好目标写入的磁盘(大于或等于阵列可用容量)
    然后写脚本手动解析阵列元数据,并分段重建
    mhycy
        9
    mhycy  
       2020-09-11 16:17:10 +08:00
    补充:此灾难恢复我做过,所以我非常清楚这东西有多折腾
    mhycy
        10
    mhycy  
       2020-09-11 16:18:02 +08:00
    另补充:阵列卡有同样问题
    raptor
        11
    raptor  
       2020-09-11 16:34:31 +08:00
    所以个人的人生经验就是:不要用 RAID5
    terrancesiu
        12
    terrancesiu  
       2020-09-11 16:44:49 +08:00
    ups 没用啊,顶不了多久。赶快买发电机+油。
    sunziren
        13
    sunziren  
       2020-09-11 16:51:34 +08:00
    点进系统,然后暂停扩容,明天来了继续扩容
    laminux29
        14
    laminux29  
       2020-09-11 16:52:21 +08:00
    又是 X-Y 问题。

    你的问题并不是说断电会不会影响 raid 5 内的原始数据,而是扩容以及其他存储结构调整之类的事情,本身就是高风险操作,做这种操作之前,都应该提前做数据备份。做了备份后,就算扩容期间遇到突然断电,甚至操作设备突然故障,都不怕了。
    qwerthhusn
        15
    qwerthhusn  
       2020-09-11 16:53:05 +08:00
    柴油机,油,现在开车去买,不晚
    springz
        16
    springz  
       2020-09-11 16:54:16 +08:00
    没事,事先关机就行。
    springz
        17
    springz  
       2020-09-11 16:55:11 +08:00
    我这么干过一次,不信可以马上关机开机看看,进度都会保存。群晖的是软 raid,没关系的。
    loading
        18
    loading  
       2020-09-11 16:55:56 +08:00 via Android
    群晖客服电话,都付钱了,白裙你有啥好害羞的?
    springz
        19
    springz  
       2020-09-11 16:56:19 +08:00
    突然掉电不知道啥情况,但是中间关机是没问题的。
    shyy06
        20
    shyy06  
       2020-09-11 16:57:19 +08:00   ❤️ 1
    我来回答下,在虚拟机环境中少量数据模拟软 RAID 扩容,过程中强制关闭虚拟机模拟断电,重新开机后数据不丢失,进度不丢失.
    正式环境下使用群辉扩容没测试过,理论上,RAID 卡比软 RAID 应该更靠谱.
    另外分享一条经验:业务服务器尽量不要采用 RAID5 阵列,RAID5 虽然磁盘利用率高,日常使用没问题,但是一旦有硬盘损坏或者需要扩容时候,由于 RAID5 的 I/O 性能限制,重建的时间会比较久,且需要对硬盘进行全盘擦除写入,这时候硬盘损坏概率要远高于平时,这个时候一旦有硬盘故障,将会是致命的。
    testver
        21
    testver  
       2020-09-11 17:11:51 +08:00
    可以暂停的啊
    lzz2394677796
        22
    lzz2394677796  
    OP
       2020-09-11 17:18:17 +08:00 via iPhone
    @testver 完蛋了!没有暂停按钮,不能暂停。关机操作,提示不能关机,有 volume 操作进行中!听天由命了
    jones2000
        23
    jones2000  
       2020-09-11 17:30:04 +08:00
    用 UPS, 可以顶 1-2 个小时。
    xianqin
        24
    xianqin  
       2020-09-11 18:02:36 +08:00   ❤️ 3
    连 UPS 一起搬回家
    ferock
        25
    ferock  
       2020-09-11 18:08:09 +08:00   ❤️ 1
    @lzz2394677796 #22

    所以,说能暂停和关机的,都是键盘侠吧
    loarland
        26
    loarland  
       2020-09-11 18:18:53 +08:00
    单盘用户表示无所畏惧
    superrichman
        27
    superrichman  
       2020-09-11 18:19:22 +08:00 via iPhone
    都这个点了,不如去烧个香 /doge
    lzz2394677796
        28
    lzz2394677796  
    OP
       2020-09-11 18:25:06 +08:00 via iPhone
    如果 raid5 扩容逻辑严密,现在应该这样: 正在对新加入硬盘预填数据,老硬盘们数据进行拆分。等新硬盘 100%完成,老硬盘们进入新模式,丢弃重复数据。如果异常中断,则老硬盘们也不丢数据。
    ntgeralt
        29
    ntgeralt  
       2020-09-11 18:38:07 +08:00
    建议你现在直接右上角-关机,群晖有关机指令,远好过断电
    caltong
        30
    caltong  
       2020-09-11 19:11:47 +08:00
    本来没 UPS,要上的话还是得断电一次的
    felixcode
        31
    felixcode  
       2020-09-11 21:03:35 +08:00 via Android
    至少得正常关一下机,突然断电后 raid 的状态谁都不敢确定
    sampeng
        32
    sampeng  
       2020-09-11 21:21:16 +08:00 via iPhone
    raid5 ? 40 小时数据?等着修数据吧。50%概率坏掉
    geekvcn
        33
    geekvcn  
       2020-09-11 21:34:11 +08:00 via iPhone
    说了多少遍了用 raid1,就是不听用 raid5,raid5 比单盘还麻烦
    tim1103
        34
    tim1103  
       2020-09-11 22:00:09 +08:00
    关机总比突然断电好
    gabon
        35
    gabon  
       2020-09-11 22:03:54 +08:00 via Android
    插眼,希望明天分享一下经验,以后吸取教训
    ttimasdf
        36
    ttimasdf  
       2020-09-11 22:11:56 +08:00 via Android
    😂如果对磁盘性能没要求,等重建以后改 mergerfs 吧,灾后重建就是把坏
    SuzutsukiKaede
        37
    SuzutsukiKaede  
       2020-09-11 22:16:51 +08:00
    希望硬盘没事
    HertzHz
        38
    HertzHz  
       2020-09-11 22:29:34 +08:00
    默哀
    LokiSharp
        39
    LokiSharp  
       2020-09-11 22:42:48 +08:00
    实际使用的话 raid5 和 raid0 没啥区别其实。。。
    lzz2394677796
        40
    lzz2394677796  
    OP
       2020-09-11 23:55:08 +08:00 via iPhone
    结果暂未知!通知明天上午检修,短电确切时间不知,重新计算粗略 40 小时有误,至 17 时是 8 小时完成 30%,精确时间可推算。周一启动看结果(ー ー;)
    lzz2394677796
        41
    lzz2394677796  
    OP
       2020-09-11 23:57:58 +08:00 via iPhone
    真服了群晖!找不到一个能联系到的电话,狗屁 400
    morize
        42
    morize  
       2020-09-12 00:03:10 +08:00
    去年去群晖的台湾总部开放日参观,介绍过这种情况,说丢了但是后来搞了半天给客户恢复了。
    jzphx
        43
    jzphx  
       2020-09-12 00:04:16 +08:00
    @lzz2394677796 等待开奖
    morize
        44
    morize  
       2020-09-12 00:04:25 +08:00
    @lzz2394677796 没有的,当时问这块说,全球的客服都是台湾接的,就那么十来个人,只有工作日接。
    mosliu
        45
    mosliu  
       2020-09-12 00:11:11 +08:00
    等下周一看结果 很好奇 希望楼主好运
    lzz2394677796
        46
    lzz2394677796  
    OP
       2020-09-12 00:18:24 +08:00 via iPhone
    6 盘位,2 到 5 号位四块红盘。留 1,6 盘位。目前 1 盘位放了 ssd 加速,今天动 6 盘位扩容中。到时容量再告急,就换动 1 盘位。
    LokiSharp
        47
    LokiSharp  
       2020-09-12 00:39:09 +08:00 via iPhone
    @lzz2394677796 可能会重建失败,认不出,不过大概率能找客服修好
    KasuganoSoras
        48
    KasuganoSoras  
       2020-09-12 00:48:20 +08:00
    🙏希望硬盘没事
    lzz2394677796
        49
    lzz2394677796  
    OP
       2020-09-12 00:51:40 +08:00 via iPhone
    如果至 17 时是 8 小时完成 31%,精确时间可推算:终需 25 小时,至 17 时还剩 17 小时,也就是明天上午 10 时 100%。从下午粗略估算到傍晚估算,实际扩容速度不会慢于估算时间。假设实际提早半小时,也就是明日上午 9 时 30 分 100%。检测工作算 9 时开始,估计不会马上断电,还是有机会 finis h 的。只能这样了
    seakwan
        50
    seakwan  
       2020-09-12 00:53:25 +08:00 via Android
    周一看结果
    lzz2394677796
        51
    lzz2394677796  
    OP
       2020-09-12 00:57:46 +08:00 via iPhone
    其二,如果没 finish 前异常断电,我猜测,大概率是开机重 0 新计算新增加硬盘,只是废时。因为显示扩容中提示,设备总容量仍旧显示着就容量。功能设计时机制应该是考虑到的
    lzz2394677796
        52
    lzz2394677796  
    OP
       2020-09-12 01:02:55 +08:00 via iPhone
    原本设想 1 号闲置盘位放一个更大容量 basic 独立硬盘,为 raid5 做定时备份。后来想想都 raid5 了,还备份什么啊
    lzz2394677796
        53
    lzz2394677796  
    OP
       2020-09-12 01:15:12 +08:00 via iPhone
    qnap 时 raid1 闪灯一个盘坏过,取出后插上新盘 nn 小时后恢复正常,很方便。所以群晖我用了 raid5,说是闪灯了同样操作,也可以重建,只是计算时间更长,省容量但废重建时间也没觉得不好。
    elfive
        54
    elfive  
       2020-09-12 07:17:53 +08:00 via iPhone
    @lzz2394677796 #53 尽量别用 RAID5,重建过程中,硬盘容量越大,失败几率越高,这点在 V 站和很多地方是能够找到准确数据支持的。加上如果是用的同批次的硬盘(寿命接近)那么失败几率进一步提高……
    YAFEIML
        55
    YAFEIML  
       2020-09-12 08:42:41 +08:00
    群晖硬盘管理太渣,适合 0 折腾
    geniussoft
        56
    geniussoft  
       2020-09-12 09:04:49 +08:00
    1. 能用 UPS 解决的问题,不用 UPS 。
    2. 不用 UPS,提前关机也能解决的问题,非要不关机。(上面好几个人都告诉你了)
    3. 非要作死,那就可能会死。
    4. 说阵列卡更好的,那只是因为阵列卡上的电池。
    lzz2394677796
        57
    lzz2394677796  
    OP
       2020-09-12 09:30:27 +08:00 via iPhone
    @geniussoft 回答过了,dsm 无法进行暂停和关机操作。不能关机,ups 能顶过多久?
    lzz2394677796
        58
    lzz2394677796  
    OP
       2020-09-12 09:35:26 +08:00 via iPhone
    对了,大家有经验吗??一般 raid5 装全新红盘 7*24 多久开始有故障?撑的过两年吗?
    DopaminePlz
        59
    DopaminePlz  
       2020-09-12 09:41:58 +08:00 via Android
    @qwerthhusn 买了也没有用,怎么把市电切换为后备用电?备用电源在停电几分钟前跟市电同时供电?万一两者相位相反柴油机供电和市电电路形成回路,两个都毁了。
    ryd994
        60
    ryd994  
       2020-09-12 10:22:53 +08:00 via Android
    @DopaminePlz 那人家机房后备电源怎么做的?
    ATX 电源标准要求断电后有零点几秒的维持能力。备用电源在这点时间内接上就行。这点时间当然不可能足够发电机启动,所以需要基于电池的 UPS,然后等发电机稳定后再切发电机。反向馈电当然有可能,也当然需要安装转换开关。

    换成楼主的例子:UPS 是必须的。找人 24 小时值班。如果停电,把 UPS 拔下来插到发电机上去。小型发电机启动很快的。


    如果要实现绝对不断电,也有。在线式 UPS 。输入电源整流成直流电,再逆变输出。电压频率相位全都无所谓。断电就直接从电池逆变输出。
    或者更好的,高级的服务器电源内置电池。能撑个几分钟。就算 UPS 出问题也能顶一下。我就试过拔了插头还在跑的撞鬼场景。当然一直不插电还是会挂的。
    ryd994
        61
    ryd994  
       2020-09-12 10:27:44 +08:00 via Android
    @lzz2394677796 你就看看现在用多少时间,再想想重建要多少时间? raid5 就是赌这段时间不会挂第二块?实际上呢?怕什么就会来什么。
    你肯定没有演练过。比如没事突然拔掉一块盘这种事。
    neroxps
        62
    neroxps  
       2020-09-12 11:18:19 +08:00
    楼主感觉你还是先把数据备份了。断电就真 GG 了
    DopaminePlz
        63
    DopaminePlz  
       2020-09-12 11:22:05 +08:00 via Android
    @ryd994 问题是后备电源是预先安装好的。楼主这里机器已经在运行了呀。
    gamexg
        64
    gamexg  
       2020-09-12 11:52:43 +08:00
    备用电源目前的情况应该也能加上

    先带电并接一个 双电源自动转换开关,主电源接到目前的市电上面,备电源接到 ups 。
    然后掐断未经过转换开关的市电线路,使得电完全走转换开关。

    注意转换开关需要选择 pc 级别的,也就是切换时间小于 30ms 的。
    lzz2394677796
        65
    lzz2394677796  
    OP
       2020-09-12 12:02:49 +08:00 via iPhone
    临时抢备份是可行的,目前 raid5 数据都是可读可写的,usb3 上去可复制。但容量大速度慢,几十 t 数据 25 小时内抢不下来
    lzz2394677796
        66
    lzz2394677796  
    OP
       2020-09-12 12:04:48 +08:00 via iPhone
    @gamexg 30ms,这么专业
    mhycy
        67
    mhycy  
       2020-09-12 12:12:05 +08:00
    @lzz2394677796
    几十 T 的数据还用 R5 就不吐槽了,基本是灾难,那么距离掉线还有多久?网络是比 U 盘更快的选择
    看下来回答的人里面似乎就我一个做过这东西的数据恢复,然而你无视了
    geniussoft
        68
    geniussoft  
       2020-09-12 12:18:01 +08:00 via iPhone
    @lzz2394677796 问题 1 我没法保证自己记忆准确,已经问了客服。
    红盘小容量是叠瓦,慎用。
    还是用 Hc510 之类的型号比较合理。
    盘多尽量 Raid6,不差那一块盘。
    lzz2394677796
        69
    lzz2394677796  
    OP
       2020-09-12 12:20:16 +08:00 via iPhone
    上午 9 点通知的检修开始,不知道几点断的电。等周一按电源键看结果了(ー ー;)
    lzz2394677796
        70
    lzz2394677796  
    OP
       2020-09-12 12:26:14 +08:00 via iPhone
    我猜大概率群晖设计扩容时应该是考虑到的,毕竟群晖价格高三分之一,之前一直用 qnap,一直对 qnap 技术就很满意了。
    mhycy
        71
    mhycy  
       2020-09-12 12:42:24 +08:00
    @lzz2394677796
    群晖基于 MDADM,别说考虑到,别自动给你 resync 就烧高香了
    mhycy
        72
    mhycy  
       2020-09-12 12:43:12 +08:00
    @lzz2394677796
    另外,基于 MDADM 的系统按电源键就是赌博,一旦开始 RESYNC 你的数据是无法挽回的丢失
    mhycy
        73
    mhycy  
       2020-09-12 12:43:59 +08:00
    @lzz2394677796
    再次声明,这东西我修过!!别无视正确答案啊!!
    lzz2394677796
        74
    lzz2394677796  
    OP
       2020-09-12 12:49:06 +08:00 via iPhone
    @lzz2394677796 我还有一个支持这个不破毁原数据原理的理由,就是选择扩容时,记得好像是二选一,满速检测硬盘和快速不检测,因为是新硬盘我就选了快速。按照这个逻辑,如果我放了一块半坏盘,并选择了快速不检测,扩容时遇到异常失败应该会进入恢复状态
    lzz2394677796
        75
    lzz2394677796  
    OP
       2020-09-12 12:53:19 +08:00 via iPhone
    @mhycy 谢谢🙏
    mhycy
        76
    mhycy  
       2020-09-12 12:53:31 +08:00
    坐等看戏
    Yangz
        77
    Yangz  
       2020-09-12 14:55:22 +08:00
    强烈建议联系售后 ww
    wanguorui123
        78
    wanguorui123  
       2020-09-12 15:49:22 +08:00 via iPhone
    买几个移动硬盘赶紧备份重要资料
    coala
        79
    coala  
       2020-09-12 16:20:14 +08:00
    Reid5 非企业盘非常危险。重组成功率感人 ,还是早日 Reid10 Reid6
    楼主这种情况... 期待结果
    reus
        80
    reus  
       2020-09-12 17:03:14 +08:00
    raid5 差不多等于无 raid,就是恢复时非常可能受到连击
    dddxm
        81
    dddxm  
       2020-09-12 17:41:26 +08:00 via iPhone
    @shyy06
    @raptor
    raid5 不让用,但 raid1 空间砍半太浪费了,还有其他建议吗?
    ETiV
        82
    ETiV  
       2020-09-12 17:48:32 +08:00 via iPhone
    去买把锁头,给你们配电间加一把私锁,让他们没法检修不就完了。
    lzz2394677796
        83
    lzz2394677796  
    OP
       2020-09-12 18:55:05 +08:00 via iPhone
    5 盘位 raid5,如果将来一盘报错换新,rebuild 一盘大概多久??可能要一周吗?
    bclerdx
        84
    bclerdx  
       2020-09-12 20:05:37 +08:00
    @laminux29 提前做什么样的备份呢?
    bclerdx
        85
    bclerdx  
       2020-09-12 20:07:51 +08:00
    @shyy06 那组 RAID 几呢?
    bclerdx
        86
    bclerdx  
       2020-09-12 20:13:44 +08:00
    @YAFEIML 那威联通呢?
    howellz
        87
    howellz  
       2020-09-12 20:16:44 +08:00
    一路看下来,发现现在能认真把帖子看仔细、问题想清楚的人越来越少了,这还不是啥繁琐的技术问题。
    让人家备份的,没看看现在无法中止操作了。
    提醒用 UPS 的,没看看一是无法中止关机接上 UPS 了,而是人家也在不断提醒 UPS 能提供多长时间供电。
    bclerdx
        88
    bclerdx  
       2020-09-12 20:17:11 +08:00
    @ryd994 推荐个在线式 UPS,谢谢。
    xcp3555
        89
    xcp3555  
       2020-09-12 21:08:27 +08:00
    你这扩容系统不能中止吗?终止也行啊
    ericww
        90
    ericww  
       2020-09-12 21:28:13 +08:00 via iPhone
    @lzz2394677796 单盘 3T 6 个小时
    yousabuk
        91
    yousabuk  
       2020-09-13 08:48:38 +08:00 via iPhone
    学了一招:要进行如此重要如此长时间的数据操作前务必使用双供电系统线路,哪怕第二路不接(但是需要时可以直接接入),哪怕第二路使用柴油发电机呢。
    raptor
        92
    raptor  
       2020-09-13 11:32:44 +08:00
    @dddxm 用空间换可靠性是最好的,当然如果一定要省空间,还有 RAID6 可选,相对来说比 RAID5 可靠性高很多。
    ferock
        93
    ferock  
       2020-09-13 19:20:52 +08:00
    持续关注中
    kxuanobj
        94
    kxuanobj  
       2020-09-13 20:55:36 +08:00
    额。。为什么不试试休眠( hibernate )呢。。
    enjoyCoding
        95
    enjoyCoding  
       2020-09-14 09:08:15 +08:00
    周一了 数据还好嘛
    lzz2394677796
        96
    lzz2394677796  
    OP
       2020-09-14 09:09:22 +08:00
    报告下情况如图: https://i.postimg.cc/52ZFNR84/image.png
    教训是:UPS 对于 nas 还是重要的,不管撑半小时也好,断电时怀一起抱着上车找电源。
    whenwind
        97
    whenwind  
       2020-09-14 09:29:51 +08:00
    结果当天就重建好了,今天才断的电?😂
    lzz2394677796
        98
    lzz2394677796  
    OP
       2020-09-14 10:34:04 +08:00 via iPhone
    @whenwind 不可能的,我要分析一下日志
    MrYELiex
        99
    MrYELiex  
       2020-09-14 10:38:29 +08:00
    QNAP 用户 经历过重建断电

    重建断电大概率会重建失败 重启后提示异常可以 resync 但是这个时候断电....我的结果是数据好 但是主板烧了

    UPS 还是正解 如果可预期的断电且时间久 而且无法停止同步的话 那就只能先边同步边拷数据了
    shyy06
        100
    shyy06  
       2020-09-14 11:37:34 +08:00
    @dddxm #81 想要安全,读写有保障,上 raid10,舍不得孩子套不得狼
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   964 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 21:47 · PVG 05:47 · LAX 13:47 · JFK 16:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.