#Victoria_Metrics

2025-05-26

Какие есть альтернативы Prometheus, если для метрик его стало недостаточно

Prometheus прекрасно подходит для краткосрочного мониторинга, но у этого решения есть свои ограничения по масштабу, и если вы столкнулись с высоким потреблением памяти/CPU, снижением скорости запросов или вам требуются уникальные лейблы вида user ID, то стоит подумать над внедрением альтернатив. На наш взгляд следующими после Prometheus в линейке стоят Thanos , Cortex , Mimir или VictoriaMetrics . Объективное, насколько это возможно, сравнение характеристик этих решений мы и проведем ниже. СОДЕРЖАНИЕ 0. В каких случаях нужно задуматься о замене Prometheus 1. Обзор решений для долгосрочного хранения метрик 2. Сравнение решений: Thanos, Cortex, Mimir и VictoriaMetrics 3. Как выбрать подходящее решение 3.1. Что важнее: простота или масштаб? 3.2. Стоимость 3.3. Надёжность и высокая доступность 3.4. Насколько подходит по задачам? 4. Миграция с Prometheus на долгосрочное хранилище 5. Сохранение алертов и дашбордов 6. Как избежать потери данных при миграции 6.1. Параллельный запуск и проверка 6.2. Мониторинг очередей remote_write 6.3. Аккуратное отключение Prometheus 6.4. Резервное копирование 6.5. Тестирование 7. Лучшие практики эксплуатации долгосрочного хранилища метрик 8. Высокая доступность и избыточность 9. Мониторинг состояния хранилища метрик 10. Обработка долгосрочных запросов и типовые ошибки 10.1 Используйте recording rules для тяжёлых агрегаций 10.2 Не злоупотребляйте лейблами с высокой кардинальностью 10.3 Downsample старые точки данных 10.4 Осторожно с федерацией Prometheus 11. Обслуживание и обновления (Maintenance & Upgrades) 12. Итого. Как жить с продакшн-наблюдением

habr.com/ru/companies/itsumma/

#Prometheus #альтернативы_Prometheus #Cortex #Mimir #Thanos #Victoria_Metrics #мониторинг #инфраструктура #переезд #апдейт #руководство #чеклист

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst