
На что стоит обратить внимание
Metrics
- Размер очереди
- Поток сообщений
- мониторить надо количество не акнутых сообщений
- мониторить надо время - полной обработки сообщения, время исполнения консьюмера
- количество повторов/потерь/отказов
Alerts
- Если больше 80% заполненность диска
- Если больше 80% заполненность памяти
- Если Размер очереди больше 1000мб.
- Поток сообщений в течении 3минут больше 20
- Разница между поступающими сообщениями и обработанными в течении 3х минут и она больше 100 то слать алерт
- Кол-во ожидающих обработки ACT сообщений больше 10 в течении 5 минут
- Кол-во повторов больше 10 в течении 5 минут
- Процент: Если больше 50% повторных доставкок сообщений потребителем Nats