Шардированный кластер ClickHouse
Хочу рассказать, как спроектированы распределённые вычисления в ClickHouse. Вы узнаете, на что влияет схема кластера (и на что не влияет). Расскажу, как можно на ровном месте создать себе проблему при помощи всего одной таблицы Kafka и нескольких матвьюх. Поделюсь опытом про дебаг и оптимизацию SELECT-запросов к Distributed таблицам: поизучаем планы выполнения и поэксперементируем с настройками в блоке SETTINGS.
https://habr.com/ru/companies/wildberries/articles/896060/
#clickhouse #sql #bigdata #хранение_данных #data_engineering #mpp #shared_nothing