#%D0%98%D0%BD%D1%84%D1%80%D0%B0%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D0%B0

2025-06-05

Продолжаем строительство дата-центров в Мытищах и Марфино

Привет! Продолжаем понемногу рассказывать о том, как мы строим собственные ЦОД. Под катом — коротко о том, что мы сделали за минувший месяц.

habr.com/ru/companies/cloud4y/

#контейнерный_цод #облачные_сервисы #инфраструктура #датацентр

2025-06-03

Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений

Привет, меня зовут Михаил Шпаков, я руковожу разработкой в Timeweb Cloud — это крупный облачный провайдер с большой командой и множеством внутренних и внешних продуктов. Последние несколько лет в работе стало больше менеджмента: процессы, планирование, встречи, координация команд. Со временем я начал ловить себя на мысли, что очень хочется что-то поделать руками . Вернуться к коду, попробовать собрать продукт от начала и до конца, пройти путь не как менеджер, а как разработчик и автор идеи. Заодно — погрузиться в продуктовую часть, потрогать всё: интерфейсы, фичи, маркетинг, пользовательский опыт. Так родился statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. Я хотел сделать его: — с минималистичным и понятным интерфейсом, — ориентированным в первую очередь на разработчиков, девопсов, админов , — с набором действительно нужных фич, ничего лишнего. В этой статье я расскажу, как вечерами и на выходных делал Statuser (и продолжаю делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.

habr.com/ru/companies/timeweb/

#statuser #мониторинг #инфраструктура #nestjs #nextjs #инциденты #уведомления #пользователи #отчеты #timeweb_статьи

2025-05-26

Какие есть альтернативы Prometheus, если для метрик его стало недостаточно

Prometheus прекрасно подходит для краткосрочного мониторинга, но у этого решения есть свои ограничения по масштабу, и если вы столкнулись с высоким потреблением памяти/CPU, снижением скорости запросов или вам требуются уникальные лейблы вида user ID, то стоит подумать над внедрением альтернатив. На наш взгляд следующими после Prometheus в линейке стоят Thanos , Cortex , Mimir или VictoriaMetrics . Объективное, насколько это возможно, сравнение характеристик этих решений мы и проведем ниже. СОДЕРЖАНИЕ 0. В каких случаях нужно задуматься о замене Prometheus 1. Обзор решений для долгосрочного хранения метрик 2. Сравнение решений: Thanos, Cortex, Mimir и VictoriaMetrics 3. Как выбрать подходящее решение 3.1. Что важнее: простота или масштаб? 3.2. Стоимость 3.3. Надёжность и высокая доступность 3.4. Насколько подходит по задачам? 4. Миграция с Prometheus на долгосрочное хранилище 5. Сохранение алертов и дашбордов 6. Как избежать потери данных при миграции 6.1. Параллельный запуск и проверка 6.2. Мониторинг очередей remote_write 6.3. Аккуратное отключение Prometheus 6.4. Резервное копирование 6.5. Тестирование 7. Лучшие практики эксплуатации долгосрочного хранилища метрик 8. Высокая доступность и избыточность 9. Мониторинг состояния хранилища метрик 10. Обработка долгосрочных запросов и типовые ошибки 10.1 Используйте recording rules для тяжёлых агрегаций 10.2 Не злоупотребляйте лейблами с высокой кардинальностью 10.3 Downsample старые точки данных 10.4 Осторожно с федерацией Prometheus 11. Обслуживание и обновления (Maintenance & Upgrades) 12. Итого. Как жить с продакшн-наблюдением

habr.com/ru/companies/itsumma/

#Prometheus #альтернативы_Prometheus #Cortex #Mimir #Thanos #Victoria_Metrics #мониторинг #инфраструктура #переезд #апдейт #руководство #чеклист

2025-05-23

Как подключить виртуальные сетевые диски к выделенному серверу

Обычно данные

habr.com/ru/companies/selectel

#selectel #выделенные_серверы #сетевые_диски #облачная_платформа #инфраструктура

2025-05-22

Выкрутили автоматизацию на максимум: с чем кроме инвентаризации помог переход на NetBox

Привет, Хабр! На связи команда K2 Cloud — ведущий сетевой инженер Сергей Алексеев и инженер-разработчик Александр Гнатюк. Мы расскажем о нашем пути к инвентаризации и автоматизации огромной сети ЦОД, каких результатов достигли усилиями сетевых инженеров службы эксплуатации и разработки. Надеемся, что этот опыт будет полезен тем, кто хочет автоматизировать свою работу и сделать инфраструктуру прозрачнее.

habr.com/ru/companies/k2tech/a

#netbox #инвентаризация #автоматизация #napalm #инфраструктура #сетевые_сервисы #сетевая_безопасность #сетевая_диагностика #автоматизация_управления

2025-05-22

Выкрутили автоматизацию на максимум: с чем кроме инвентаризации помог переход на NetBox

Привет, Хабр! На связи команда K2 Cloud — ведущий сетевой инженер Сергей Алексеев и инженер-разработчик Александр Гнатюк. Мы расскажем о нашем пути к инвентаризации и автоматизации огромной сети ЦОД, каких результатов достигли усилиями сетевых инженеров службы эксплуатации и разработки. Надеемся, что этот опыт будет полезен тем, кто хочет автоматизировать свою работу и сделать инфраструктуру прозрачнее.

habr.com/ru/companies/k2tech/a

#netbox #инвентаризация #автоматизация #napalm #инфраструктура #сетевые_сервисы #сетевая_безопасность #сетевая_диагностика #автоматизация_управления

2025-05-20

Дата-центр на орбите: технические особенности футуристической концепции

Недавние проекты — от китайской «Трёхтелесной вычислительной констелляции» с ИИ-спутниками до коммерческих инициатив вроде Lumen Orbit и Lonestar Data — наглядно демонстрируют, что идея «ЦОД в космосе» вышла за рамки научной фантастики. Предыдущая статья вызвала множество комментариев и споров по этой теме, поэтому я решил изучить этот вопрос подробнее — опираясь не на громкие ИТ-тренды, а на реальные научные исследования и практику (ссылки на первоисточник проставлены по тексту). Эта статья не источник для споров и не личный опыт автора, а база для обмена мнениями. Кто знает, может именно в комментариях «Хабра» родится истина о том, как настроить работу ЦОДов в космосе.

habr.com/ru/companies/ruvds/ar

#цод #хостинг #данные #датацентры #облака #серверы #GPU #IT #инфраструктура #будущее #тренды #ruvds_статьи

2025-05-20

Как построить инфраструктуру, которая не подведет: главное с митапа по отказоустойчивости

23 апреля на OMNI Infrastructure Meetup эксперты из Авито, Магнит OMNI, Лаборатории Касперского и Cloud.ru обсудили, как создавать системы, устойчивые к любым сбоям. Рассказываем о самых важных инсайтах. В московском офисе Магнита и онлайн собрались DevOps-инженеры, платформенные специалисты и разработчики, чтобы разобрать реальные кейсы повышения отказоустойчивости. Гибридный формат позволил присоединиться участникам из разных городов — дискуссия получилась по-настоящему живой. Делимся видео и презентациями докладов.

habr.com/ru/companies/magnit/a

#devops #devops_инженер #инфраструктура #отказоустойчивость #отказоустойчивые_системы #отказоустойчивые_решения #observability

2025-05-15

Интервью без стресса: как в Рунити нанимают DevOps-инженеров

Привет, Хабр! Мы в Рунити верим, что собеседование — не гонка за правильными ответами, а диалог на равных. В этом интервью расскажем, как мы нанимаем DevOps-инженеров в команду. Внутри о том, что мы предлагаем кандидатам вместо стресс-интервью, замысловатых тестовых и бесконечных этапов отбора. От нас — внимание к глубине опыта и интерес к подходам кандидата. Эксперты Рунити — Анна Попова, рекрутмент-партнер, и Тимур Парфенов, директор департамента эксплуатации, поделятся тем, как мы оцениваем инженеров, на что смотрим в резюме и какие навыки стоит подсветить. Приятного «разворачивания» статьи!

habr.com/ru/companies/runity/a

#devops #sre #sreинженер #devopsинженер #поиск_работы #интервью #cicd #kubernetes #gitops #инфраструктура

2025-05-13

ЦОД 2050: три реалистичные концепции развития дата-центров

Что будет с дата-центрами, когда физические пределы достигнуты? Когда PUE упадёт ниже единицы, а каждая новая стойка будет выходить в минус? Ответ уже начинает проявляться. Новый виток эволюции ЦОДов не в росте плотности или увеличении каналов. Он — в изменении самой парадигмы: дата-центр не как здание, а как среда, экосистема, организм. В статье представил три сценария будущего дата-центров. Спойлер: ни одна из описанных ниже концепций не является фантастикой. Все они — логическое продолжение уже происходящих процессов.

habr.com/ru/companies/ruvds/ar

#цод #хостинг #данные #датацентры #облака #серверы #GPU #IT #инфраструктура #будущее #тренды #ruvds_статьи

2025-05-07

Коалиция штатов США подала в суд на администрацию Трампа из-за заморозки миллиардов долларов, выделенных Конгрессом на зарядные станции для электромобилей. Штаты заявляют о незаконности действий и ущербе для отрасли.

Детальніше: newsua.us/node/5694

2025-05-01

Тысяча и одна проблема в работе с 1С

Классические проблемы в инфраструктуре при работе с 1С — периодические «падения» сервера из-за устаревшего оборудования или сбоя в электропитании или ограниченный офисной сетью доступ к базе. Еще и администратор может быть перегружен или недоступен в критический момент. В итоге бухгалтерия не может вовремя закрыть месяц, менеджеры не видят актуальной информации по продуктам, а IT-отделу приходится бороться с инфраструктурными проблемами вместо того, чтобы заниматься техническими задачами. Привет! Я — Даниэль Манчанда, менеджер по развитию бизнеса и IT-инфраструктуры. Год назад мы выпустили

habr.com/ru/companies/selectel

#selectel # #инфраструктура #серверы

2025-04-25

Защита подводных интернет-кабелей: новый вызов или старая песня?

17 и 18 ноября 2024 года в Балтийском море случился неприятный инцидент: были повреждены два телекоммуникационных кабеля. Один BCS East-West Interlink, соединяющий Литву и Швецию, и C-Lion1 — между Финляндией и Германией. Это вызвало серьезные проблемы с доступом к интернету для некоторых пользователей.

Работоспособность одного кабеля оперативно устранили, буквально через 10 дней, и проблема с доступом разрешилась. Но остался открытым вопрос: что это было? Диверсия или случайное повреждение? Политики поспешили обвинить в этом Россию и Китай — особенно с учетом того, что маршрут судна Yi Peng 3 как раз проходил в этом районе.

И это далеко не единичный случай. Например, в январе 2025 года тот же кабель C-Lion1 повредило якобы уже судно, перевозившее нефть. Давайте посмотрим, насколько это серьезная угроза и как защищают подводные кабели в целом.

habr.com/ru/companies/first/ar

#кабели #кабели_связи #информационная_безопасность #инфраструктура #системы_связи #сетевые_технологии #сетевое_оборудование #сетевая_инфраструктура #сетевая_безопасность #история_it

2025-04-24

DevOps инфраструктура для стартапов ч.1

Мы — команда студентов из ИТМО, которая прошла путь от хакатонов до продуктовой разработки. На собственном опыте расскажем, как выстроили инфраструктуру, способную масштабироваться, переживать сбои и не стоить как полкоманды в найме. Когда ты только начинаешь делать стартап, инфраструктура кажется чем-то второстепенным. Важнее MVP, фичи, дизайн, пичдек. Но в какой-то момент всё внезапно перестаёт помещаться на одном сервере, руками деплоить становится больно, SSL не обновляется, а продакшн падает из-за перегрузки или забытого docker-compose up . Kubernetes? Слишком сложно, долго и дорого. Монолит? Неудобно масштабировать. Мы искали третий путь — и нашли его.

habr.com/ru/articles/904234/

#инфраструктура #devops #docker #kubernetes #стартап #Portainer #docker_swarm #Traefik #docker_compose #ssl

2025-04-24

Варианты усиления фальшпола для ЦОД

Современные потребности в Центрах Обработки Данных достигли невероятных масштабов, превратив их проектирование и строительство в практически рутинный процесс. Каждый заказчик стремится получить больше, чем просто стандартное решение: им нужны ЦОД, которые соответствуют принципу «Больше, выше сильнее». Больше машзалов, выше потолки, мощнее охлаждение. Иногда эти запросы доходят до экзотических решений, таких как размещение ЦОД в регионах с холодным климатом, например, в Скандинавии, где естественная вечная мерзлота используется для охлаждения серверов, или даже подводные дата-центры, которые погружаются на дно океана для снижения затрат на охлаждение. Однако, несмотря на такие необычные подходы, большинство проектов ЦОД остаются довольно типичными. Тем не менее, каждый из них имеет свои уникальные особенности и нюансы, которые возникают из-за классической дилеммы: «Быстрее, лучше, дешевле — выбери только два». При разработке проекта часто приходится выбирать между тем или иным решением, обосновывая свою позицию экономией средств или большей надежностью. Эта проблема становится ключевой при разработке любого проекта, заставляя инженеров и архитекторов постоянно искать компромиссы. Например, приходится выбирать между более дорогим, но надежным оборудованием и бюджетными решениями, которые могут сэкономить средства, но потребуют дополнительных усилий для обеспечения стабильной работы. Каждый выбор требует тщательного обоснования, будь то экономия ресурсов или повышение надежности инфраструктуры.

habr.com/ru/companies/lure_it/

#цод #инженерные_решения #датацентр #проектирование_цод #инфраструктура #LURE_IT

2025-04-23

Зачем Switch построила ЦОД в пустыне, а IBM — в бывшей рудной шахте: 10 необычных локаций дата-центров

Спрос на услуги дата-центров растёт. По прогнозам , к 2030 году мировой рынок ЦОДов достигнет $409,1 млрд. Это обусловлено тем, что всё больше компаний переводят операции в облаках, работают с ИИ, большими данными и требуют от инфраструктуры скорости, надёжности и энергоэффективности. Именно поэтому дата-центры появляются не только в привычных индустриальных зонах, но и в самых неожиданных местах — от подземных шахт до дна океана. Рассмотрим необычные локации и попытаемся выяснить, почему компании выбрали такие базы для серверов.

habr.com/ru/companies/ruvds/ar

#цод #данные #датацентры #облака #серверы #GPU #IT #инфраструктура #ruvds_статьи

2025-04-19

[Перевод] Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Лучший в мире ИИ уже встроен в ваш телефон, почту и поиск, а вы даже не заметили? Gemini 2.5 Pro занимает первое место на всех ИИ-бенчмарках и предлагается пользователям бесплатно Узнаете, почему интеграция с семью платформами-миллиардниками делает позиции Google неуязвимыми

habr.com/ru/articles/901720/

#искусственный_интеллект #google #deepmind #gemini #openai #большие_языковые_модели #tpu #инфраструктура #стратегия

2025-04-17

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel . Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели.

habr.com/ru/companies/selectel

#selectel #машинное_обучение #devops #инференс #mlмодели #инфраструктура

2025-04-17

Как готовить Triton: рецепты вашей собственной Inference-платформы

Привет, Хабр! Меня зовут Антон, я DevOps-инженер в команде Data/ML-продуктов Selectel . Если вам нужно запустить небольшой инференс одной ML-модели, можно взять команду бэкендеров, дать им эту модель, они обернут ее в эндпоинт — и готово. Достаточно короткого скрипта из нескольких строк на Python. Но что если нужно запускать несколько моделей, оптимизировать выполнение, работать с ансамблем моделей, задействовать CPU и GPU одновременно и т. д.? Все эти проблемы решает NVIDIA Triton Inference Server. Правда, он добавляет одну новую: разобраться с ним и его документацией — тот еще квест. В статье посмотрим, насколько сложной задачей может оказаться создание собственного инференса и какие аспекты нужно учитывать. Научимся запускать различные форматы моделей, посмотрим на основные фичи Inference-платформы Selectel, запустим несколько популярных LLM и моделей, а также познакомимся со способами оптимизации конфигурации и проектирования интерфейса для модели.

habr.com/ru/companies/selectel

#selectel #машинное_обучение #devops #инференс #mlмодели #инфраструктура

2025-04-17

Исследование Selectel: 42% российских компаний планируют расширять свою IT-инфраструктуру в 2025 году

Мы в Selectel ежегодно проводим опрос российских компаний о планах развития IT-инфраструктуры. Исследование включает размеры инвестиций, планы масштабирования и развития IT-инфраструктуры, а также востребованность отдельных IT-технологий. В новом опросе приняли участие 268 специалистов, которые отвечают за развитие и обслуживание IT-инфраструктуры в своей компании или у компаний-заказчиков. Результаты исследования под катом.

habr.com/ru/companies/selectel

#selectel #тренды #инфраструктура #itинфраструктура #управление_компаниями #менеджмент #информационная_безопасность #devops #open_source

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst