我已使用Prometheus,AWS EC2 Auto发现和节点导出程序设置了监视系统。使用以下公式获取CPU利用率:
100 - (avg by (instance) (irate(node_cpu_seconds_total{instance="instancexyz",mode="idle"}[5m])) * 100)
但是,在一个特定的ASG中,我得到的CPU百分比为大负值。我打开了instance:9100 / metrics链接,发现空闲值是大的指数值。这是我得到的一个值:
node_cpu_seconds_total{cpu="0",mode="idle"} 4.25766215e+06
除少数实例外,这些指标对我所有实例均正常运行。知道发生了什么事吗?