J'ai une alerte dans ma configuration Prometheus qui envoie une alerte lorsque someMetric > 100
est valide pendant 5m
et renvoie ensuite l'alerte toutes les 24h
selon la configuration ci-dessous:
prometheus-alert.yml
` - alerte: TestAlert
expr: someMetric > 100
pour: 5m
`
alertmanager-config.yml
` repeat_interval: 24h
`
Cependant, someMetric
a un comportement où il peut être "stable" au-dessus de 100 (ce qui signifie qu'une alerte est active), mais de temps en temps il tombe à quelque chose en dessous de 100 pour un seul raclage avant de remonter au-dessus de 100. Cela va causer une alerte active de devenir inactive (résolue) puis revenir à en attente et active à nouveau après 5 minutes. Cela forcera Prometheus à renvoyer l'alerte, ce que je veux éviter.
Y a-t-il un moyen de configurer Prometheus pour avoir quelque chose de similaire à for: 5m
, mais pour la transition active -> inactive (résolue) ?