На что стоит обратить внимание

Metrics

  • Размер очереди
  • Поток сообщений
  • мониторить надо количество не акнутых сообщений
  • мониторить надо время - полной обработки сообщения, время исполнения консьюмера
  • количество повторов/потерь/отказов

Alerts

  • Если больше 80% заполненность диска
  • Если больше 80% заполненность памяти
  • Если Размер очереди больше 1000мб.
  • Поток сообщений в течении 3минут больше 20
  • Разница между поступающими сообщениями и обработанными в течении 3х минут и она больше 100 то слать алерт
  • Кол-во ожидающих обработки ACT  сообщений больше 10 в течении 5 минут
  • Кол-во повторов больше 10 в течении 5 минут
  • Процент: Если больше 50% повторных доставкок сообщений потребителем Nats