windows 是按需启动的实例,完成后就会被销毁。
从来做过这么复杂的东西,现在原型是运行起来了,但是日志很乱,甚至有的没有。
各个组件之间的接口也很乱,单元测试也还没有啊!!!
基本功能要全部完成了,下一步打算整理重构整个系统,现在想问一下大家有没有什么日志、可用状态监控的方案推荐?
现在追加一个功能最头疼的就是错误处理部分,出错了怎么标识出来,一个任务涉及到多个语言,时长3-120分钟不等...
现在是每个组件都通过django向任务的log字段写日志,出错直接中断整个任务。
但是很多其他组件的日志也没有搜集,状态监控也没有,挂了都不知道...
例如:celery 出现 工作者 卡在那里不接受新任务,也许是跨洋网络不稳定...
现在想把同一用户、同一任务在不同系统的日志全部关联起来,出现问题也好定位。同时还有各个服务状态也需要监控起来,出错好能够处理...
1
wklken 2015-06-01 11:56:21 +08:00 1
进程监控神马的, 上supervisor
错误日志收集, sentry应该够了 业务日志收集? logstash |