程序热启动方案讨论

redis 队列试用于实时性要求高，但允许数据丢失的情形，比如抢票，秒杀这种也就几秒钟有用处的情形。

一般有硬盘 io backup 的队列系统读写都会慢不少，我用 beanstalk 读取一个 job 就要好几秒，这显然不能满足延时低低场景，但好处是宕机了再次启动 job 还在那里。

实际应用当然是看环境来取舍了。

qq450255457

2017 年 5 月 31 日

@zhengxiaowai 少了个描述，每次处理完队列后，会更新到数据库信息，再加入到新的队列中。在处理队列信息时，如果重启服务，这些数据不还是丢失了么？

qq450255457

2017 年 5 月 31 日

@reus 如何优雅的重启，这是个关键的问题，如何实现优雅的重启呢？ nginx 一直会接受新的链接，A 服务不处理，B 服务也会处理，因为他们用的是同一个 Redis，都可以取到数据。所以我就想着分开 redis，通过 nginx 热更新不给 B 服务分配链接。这样子一个一个地重启服务。
确实，如果 Redis 挂了，存放在 Redis 中的队列数据就没了。之后的数据会存放在 python 自定义的队列中。

qq450255457

2017 年 5 月 31 日

@sylecn

qq450255457

2017 年 5 月 31 日

@enenaaa 新的链接一直有过来，你想怎么保存好状态数据？存放 SQL ？

qq450255457

2017 年 5 月 31 日

@freestyle 处理完任务？由于后台服务要一直保持开启，然后总会有新的链接过来，这链接我放哪去？

qq450255457

2017 年 5 月 31 日

@zjsxwc 事实上我每处理完一个队列都会更新相关数据库信息，所以数据还在，但重启后，python 服务不会再继续处理之前的数据~

qq450255457

2017 年 5 月 31 日

每次处理完队列后，会更新到数据库信息，再加入到新的队列中。不过在处理队列的过程中，如果重启服务，数据还是会丢失的。

roricon

2017 年 5 月 31 日

首先你要实现楼上各位大大提到的 graceful shutdown (restart)
假设这是你的 Nginx 配置 (配置 1)

https://gist.github.com/soloradish/fd5a39b9e7126588e2bb55be682a208b

比如你要重启 8080 端口的这个服务, 可以在这个服务的重启脚本里面增加一步, 使用下面的配置 (配置 2) 替换原本的配置文件并 reload

https://gist.github.com/soloradish/9323db526e52667f3078f9e32fefbf54

然后等待 graceful restart

之后再把原本的配置 1 替换回来并 reload.

大概原理是这样, 这样可以避免在你重启的时候 nginx 还继续转发 requests 过来.

sylecn

2017 年 5 月 31 日 via Android

合理的 shutdown 流程：正在关闭 /重启的进程，收到 SIGTERM 先停止 redis subscribe，继续处理完已经收到的事件，然后结束进程。

如果你停止时是 kill -9，那就没什么可设计的了。肯定会丢至少一个请求。

type

2017 年 5 月 31 日

SLB

qq450255457

2017 年 5 月 31 日

@roricon 这个 graceful restart 有何好建议吗？

qq450255457

2017 年 5 月 31 日

@sylecn 停止 redis subscribe ？我的是线程循环地从指定的队列中取数据哦，跟这个有关系？

lightening

2017 年 5 月 31 日

同一楼意见，用 RabbitMQ。这是典型的应用场景。RabbitMQ 用 3 个进程 subscribe 一个 queue，queue 设置成要求
ack，一次取一个任务。完成后写入数据库，并发送 ack。如果 worker 进程在发送 ack 前挂了，RabbitMQ 会自动把失败的任务分配给其他活着的 worker。只有收到 ack 后，RabbitMQ 才会放心的认为任务完成，彻底清理掉。

sylecn

2017 年 5 月 31 日 via Android

@qq450255457 那就是要在 shutdown 的时候停止循环啊。不然如果一直有新请求你就一直没法关闭了。

队列都是这样处理。redis 和 rabbitmq 都得这样。你得在某个时刻停止从队列取消息，才可能做到重启进程不丢消息。

SlipStupig

2017 年 6 月 1 日

目前我就在用 redis，目前出现过数据全部丢失的情况，redis 3.0+可以用 aof+rdb 持久化保持，用了之后数据几乎没出现过丢失，但是如果你是单机模式千万不要用，性能下降的厉害，如果是 cluster 可以用 slave 节点做 aof，应该是能保证节点数据不丢失，关于自动重启，redis 可以做到，3.2+支持 supervised