1
wxd21020 OP 没人么
|
2
ellipsecheung 119 天前
多大规模的,什么显卡,要监控哪些数据
|
3
gesse 119 天前
nvidia-smi
|
4
wxd21020 OP @ellipsecheung 千卡级 A100 起步
|
5
mgrddsj 119 天前 via Android
用过某高校的 HPC ,也是好多的 GPU 服务器,是用 Grafana 搭的资源占用监控。
|
8
ellipsecheung 118 天前
@wxd21020 加个 wx 聊一下?
|
9
Mi1kTea 116 天前
https://github.com/utkuozdemir/nvidia_gpu_exporter?tab=readme-ov-file
nvidia exporter 获取数据+Prometheus 整合数据+grafana 展示 |