V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
saytesnake
V2EX  ›  程序员

遇到可能假死的 Spring Cloud 应用, Nginx 的负载均衡应该怎么做?

  •  
  •   saytesnake · 2020-07-06 18:19:16 +08:00 · 2470 次点击
    这是一个创建于 1601 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不是开发人员,情况是这样的,

    一个 Spring Cloud 应用配置了 nginx upstream,

    upstream favresin{
          ip_hash;
          server 10.0.0.1:8080 max_fails=3 fail_timeout=30s;
          server 10.0.0.2:8080 max_fails=3 fail_timeout=30s;
          server 10.0.0.3:8080 backup;
    }
    

    遇到一个问题是,10.0.0.1:8080 假死了,但端口还是通的,而 Nginx 不知道它挂了,后端飘到 10.0.0.1:8080 后,系统也理所当然挂了。

    谷歌也可以查到一些关于 Spring Cloud 健康检查的一些内容,不过我好奇,如果纯粹以运维的角度,在不修改代码的情况下,能否做到更好的负载均衡?

    在 Nginx Plus 似乎看到一些相关的,不知道是否有用。

    10 条回复    2020-07-07 19:19:10 +08:00
    myCupOfTea
        1
    myCupOfTea  
       2020-07-06 18:26:19 +08:00 via Android
    额,spring cloud 不是有 gateway 吗,加上熔断把经常调用失败的服务给熔断掉
    joesonw
        2
    joesonw  
       2020-07-06 18:30:47 +08:00
    https://docs.nginx.com/nginx/admin-guide/load-balancer/http-health-check 可以不侵入业务代码, 只要有 http 接口可以被访问即可, 返回 4xx 也可以, 可以指定接受的 status 范围
    miao1007
        3
    miao1007  
       2020-07-06 20:11:22 +08:00 via iPhone
    用 consul sidecar 来规避
    StevenTong
        4
    StevenTong  
       2020-07-06 21:23:58 +08:00
    既然不能修改代码增加 actuator health,那么把 nginx healthcheck 指定到某个简单的业务接口?
    nieqibest
        5
    nieqibest  
       2020-07-06 21:49:41 +08:00 via Android
    有第三方的 nginx 模块
    wupher
        6
    wupher  
       2020-07-06 21:54:25 +08:00
    可以通过第三方模块或者 actuator health check 来判活。偷懒点,定时重启服务也是可以的。

    不过,讲真应该通过 GC log,heap dump 等工具查明为什么会出现假死,解决假死才是第一位吧。
    Oktfolio
        7
    Oktfolio  
       2020-07-07 10:38:14 +08:00
    nginx -> gateway -> api,降级、熔断
    saytesnake
        8
    saytesnake  
    OP
       2020-07-07 14:47:41 +08:00
    @joesonw
    @StevenTong

    这个是 Nginx Plus 的功能吧,不过看楼下似乎是有个第三方模块。
    saytesnake
        9
    saytesnake  
    OP
       2020-07-07 14:51:26 +08:00
    joesonw
        10
    joesonw  
       2020-07-07 19:19:10 +08:00
    @saytesnake This article describes how to configure and use HTTP health checks in NGINX Plus and NGINX Open Source.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1577 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 17:11 · PVG 01:11 · LAX 09:11 · JFK 12:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.