V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
cevincheung
V2EX  ›  Linux

乃们用啥做 Linux 上的 daemon 监控?sphinx 挂了都不知道。 - -#

  •  
  •   cevincheung ·
    cevin · 2014 年 10 月 28 日 · 4151 次点击
  •   查看本主题需要登录
    这是一个创建于 4113 天前的主题,其中的信息可能已经有所发展或是发生改变。
    很简单,挂了自动重启那种。
    29 条回复    2014-10-30 06:50:08 +08:00
    bitwing
        1
    bitwing  
       2014 年 10 月 28 日
    supervisor 有这种功能的吧
    julyclyde
        2
    julyclyde  
       2014 年 10 月 28 日
    init-daemontools
    用SIGCHLD串一串
    frankzeng
        3
    frankzeng  
       2014 年 10 月 28 日
    这种对于做运维的太简单了,可以先检测,发现不正常kill掉,然后重启,把这功能做成脚本放到crontab里,5分钟运行一次。
    cevincheung
        4
    cevincheung  
    OP
       2014 年 10 月 28 日
    @frankzeng 最好有一个工具会更好吧,比如

    /sbin/daemon-mointer searchd xxxxxxxx
    然后就万事大吉了。
    eriale
        5
    eriale  
       2014 年 10 月 28 日
    supervisor可以自动重启挂掉的应用。
    wuxqing
        6
    wuxqing  
       2014 年 10 月 28 日
    可以试试monit
    frankzeng
        7
    frankzeng  
       2014 年 10 月 28 日
    你要是会用shell,这比工具简单多了。
    20150517
        8
    20150517  
       2014 年 10 月 28 日
    @frankzeng 我去,你们运维就是这样不管3721不正常就kill吗?代码发来看看,哈哈
    frankzeng
        9
    frankzeng  
       2014 年 10 月 28 日
    @20150517 对于不正常的进程,首先上去就是重启,你别说,重启能解决90%的问题。
    cevincheung
        10
    cevincheung  
    OP
       2014 年 10 月 28 日
    @frankzeng 这个我同意,这是能最大化节省运维时间和成本的方法,与其消耗100分钟的时间去查原因,还不如直接花1秒时间重启服务来得快。
    Jaylee
        11
    Jaylee  
       2014 年 10 月 28 日
    supervisor
    binux
        12
    binux  
       2014 年 10 月 28 日   ❤️ 1
    sarices
        13
    sarices  
       2014 年 10 月 28 日
    supervisor +1
    est
        14
    est  
       2014 年 10 月 28 日
    @frankzeng 直接跑个while true ? 也是个好思路。。。。
    pubby
        15
    pubby  
       2014 年 10 月 28 日
    @est while true +1

    写过一个服务,一直跑下去会出现奇葩问题,所以.....自带主动停止功能 ^-^
    bearice
        16
    bearice  
       2014 年 10 月 28 日
    daemontools拯救世界(不是那个虚拟光驱)
    ryd994
        17
    ryd994  
       2014 年 10 月 29 日 via Android
    骚年学学systemd吧
    maemual
        18
    maemual  
       2014 年 10 月 29 日
    居然还有这么多人不知道supervisor
    ericls
        19
    ericls  
       2014 年 10 月 29 日 via Android
    pip install supervisor
    frankzeng
        20
    frankzeng  
       2014 年 10 月 29 日
    @est 为什么要用while true,5分钟之类的跑一次不行么,要是代码逻辑有问题,瞬间就把机器弄死了。
    laputaprince
        21
    laputaprince  
       2014 年 10 月 29 日
    就我一个人用 upstart 么。。
    msg7086
        22
    msg7086  
       2014 年 10 月 29 日 via iPhone
    就我一个人用 god 么。。
    mulog
        23
    mulog  
       2014 年 10 月 29 日
    @laputaprince
    you are not alone :P
    clino
        24
    clino  
       2014 年 10 月 29 日
    supervisor +1
    hzqim
        25
    hzqim  
       2014 年 10 月 29 日 via Android
    @msg7086
    @laputaprince
    @bearice
    @ryd994
    谢谢您们的介绍!
    codeninja
        26
    codeninja  
       2014 年 10 月 29 日 via Android
    monit
    hq
        27
    hq  
       2014 年 10 月 29 日
    用supervisord也要注意server重启后supervisor自己会自动运行,不然负责监控的死了
    http://supervisord.org/running.html#running-supervisord-automatically-on-startup
    julyclyde
        28
    julyclyde  
       2014 年 10 月 29 日
    @maemual python-supervisor不能保证它自己不死啊
    jpuyy
        29
    jpuyy  
       2014 年 10 月 30 日 via iPhone
    直接用forever,还可以根据不同的日志输出到不同文件里方便排查问题
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1146 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 18:17 · PVG 02:17 · LAX 10:17 · JFK 13:17
    ♥ Do have faith in what you're doing.