最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。
目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。
需要的功能:
1
DearTanker 2020 年 10 月 8 日
插眼标记,同样需要,不喜欢自建,倾向国外的收费服务,目前在用 hetrixtools.com
|
2
Dragonish3600 2020 年 10 月 8 日 via iPhone
微软的 system manager
|
3
yongligua 2020 年 10 月 8 日
zabbix
|
4
xabc 2020 年 10 月 8 日 via iPhone
prometheus
|
5
Ephzent 2020 年 10 月 8 日
prometheus + grafana
|
6
Aksura 2020 年 10 月 8 日
ganglia
|
7
DoctorCat 2020 年 10 月 9 日
规模不是很大(<千台)的情况下,zabbix 足够了
|