只了解到现在比较常用的监控系统有 Graphite 和 TICK ,自己也写了个 总结 。但总感觉不对,所以特来发帖,请教各位 dalao 都是怎么做的?
1
zhangfan 2016-07-21 14:54:58 +08:00
cacti
|
2
9hills 2016-07-21 15:04:28 +08:00
现在的开源监控方案,都不是很完美,传统的就不说了,新兴的 TICK ,这个的缺点是 InfluxDB 开源版本以后只有单机版,扩展性&性能非常成问题,其他的 TCK 也比较新兴,可能需要大量的二次开发。 哦中间的 Chrograf 建议换成 Grafana
还有 Prometheus ,这个项目还没来得及了解,看文档还可以 此外这种完整解决方案基本没有了,都是一些零散的模块,需要大量的二次开发和整合,比如 OpenTSDB (只存储时间序列) |
3
knightdf 2016-07-21 15:19:09 +08:00
nagios,graphite
|
4
m31271n OP @9hills 确实 InfluxDB 0.11 以前还有集群设置的文档,到 0.13 就完全剔除了。马上就要发 1.0 了,希望能再次出现。感谢你的回复。
|
6
c0878 2016-07-21 16:12:52 +08:00
直接买监控宝 自己架设太麻烦
|
7
m31271n OP @9hills 你所说的在业务层做 sharding ,是指 “针对某一特定部分的业务架设一个 InfluxDB ”,然后再 “针对另一部分的业务架设一个 InfluxDB ” 吗?
|
8
daocheng 2016-07-21 18:12:14 +08:00
额。。就用的之前推广的 OneAPM, 我是低端玩家
|
9
Tony1ee 2016-07-21 19:02:23 +08:00 via Android
只有我看成 dadiao 吗…
|
10
huson 2016-07-21 19:20:25 +08:00
zabbix
|
11
jhaohai 2016-07-21 19:22:19 +08:00 via iPhone
prometheus ,搭配各种 sd
|
13
jhaohai 2016-07-21 20:02:29 +08:00 via iPhone 1
@m31271n 服务发现, prometheus 可以配合 consul , etcd , zookeeper 之类的工具自动获取监控目标
|
14
mytsing520 2016-07-21 20:04:45 +08:00
zabbix
|
15
shiny 2016-07-21 20:06:46 +08:00 1
分两块,系统运行状态的监控和应用状态的监控, APM 类以及云服务器自带的系统监控
|
17
pc10201 2016-07-22 09:10:27 +08:00
小米的监控系统
|
18
Ryan817 2016-07-22 11:17:46 +08:00 1
open-falcon
prometheus influxdb 0.12 以后的版本就是坑,弃用 |