Построение DWH на ClickHouse
5-дневный курс обучения по ClickHouse позволит систематизировать необходимые знания и навыки для работы с СУБД ClickHouse. Курс позволит понять, как устроена платформа ClickHouse, её возможности и ограничения для решения различных сценариев, связанных с обработкой и анализом больших объемов данных.
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
CLICH | 14 июля 2025 22 сентября 2025 08 декабря 2025 |
72 000 руб. | 24 ак.часов | Дистанционный |

О продукте
ClickHouse – это популярная колоночная аналитическая СУБД, которая позволяет обрабатывать гигабайты данных в реальном времени. В отличие от строковых баз данных, например, mysql или postgresql, где информация данные хранятся на диске по одной строке за раз, что отлично подходит для транзакционных рабочих нагрузок, т.е. OLTP-приложений, в ClickHouse данные хранятся на диске по одному столбцу за раз. Каждый фрагмент данных представляет собой целый столбец. Поэтому все значения одного атрибута сущности сгруппированы вместе. Подобный принцип хранения данных сокращает время выполнения аналитических запросов в OLAP-приложениях, где соединяются данные по очень большому количеству записей.
ClickHouse имеет массивно-параллельную архитектуру (MPP, Massively Parallel Processing) без разделения ресурсов. Такая архитектура отлично подходит для OLAP-сценариев, поскольку аналитические СУБД работают с огромными объёмами данных, которые постоянно растут.
ClickHouse не поддерживает ACID-требования к транзакциям и ANSI SQL. Но эта СУБД предоставляет декларативный SQL-подобный язык запросов, включая такие операторы, как GROUP BY, ORDER BY, подзапросы в разделах FROM, IN, JOIN, оконные функции и скалярные подзапросы. Зависимые подзапросы пока не поддерживаются.
С архитектурной точки зрения один экземпляр ClickHouse на несколько серверов, к которым напрямую приходят запросы пользователей. Для репликации данных и выполнения распределённых SQL-запросов в ClickHouse используется сервис синхронизации метаданных ClickHouse Keeper, аналогичный по функциям Apache Zookeeper, но написанный на C++.
Высокую скорость обработки больших данных ClickHouse обеспечивает не только благодаря колоночному принципу хранения данных, но и за счет физической сортировки данных по первичному ключу. А векторный движок обработки запросов, оптимизированному для современных ЦП, а также распределенной и параллельной обработки запросов дает дополнительное ускорение.
Данные в ClickHouse располагаются на разных сегментах (shard), обеспечивая отказоустойчивость за счет репликации данных. SQL-запрос выполняется параллельно, т.е. одновременно на всех сегментах. Поэтому ClickHouse очень быстрый и может обрабатывать до 1 миллиарда строк в секунду на одном сервере и до двух ТБ в секунду на кластере из 400 узлов.
Эта колоночная СУБД отлично подходит для построения витрин данных и DWH, критичного к малейшим задержкам, обеспечивая быструю аналитику больших данных в реальном времени.
Аудитория
- Владельцы платформ данных;
- Архитекторы DWH;
- Разработчики корпоративных хранилищ данных;
- Дата-инженеры;
- Аналитики данных;
- Администраторы баз данных
Уровень подготовки
- Обязательны базовые навыки работы с SQL
О курсе
Курс позволит понять, как устроена платформа ClickHouse и каковые ее возможности для решения различных задач, связанных с обработкой и анализом больших объемов данных. Наше обучение включает практические задания, которые помогут вам закрепить полученные знания и научиться применять их на практике. Все задания основаны на реальных задачах, которые приходится решать дата-инженеру при работе с ClickHouse.
В ходе выполнения практических заданий вы выполните установку и настройку кластера ClickHouse, а также решите ряд задач, которые приходится решать дата-инженеру при работе с калстером ClickHouse. Участники научатся строить аналитические хранилища, интегрировать хранилища ClickHouse с внешними источниками, обеспечивать отказоустойчивость и выполнять задачи мониторинга, оптимизации и эксплуатация корпоративного хранилища данных.
Продолжительность курса: 24 академических часа, 5 дней по 4 часа дистанционно.
Тестирование: 45 минутный тест на знание теории и практика по написанию SQL запросов в рамках пройденного курса.
Программа курса “Построение DWH на ClickHouse”
1. Основы ClickHouse
- Назначение и архитектура ClickHouse
- Логическая структура базы данных
- Уровни логирования
- Преимущества и ограничения колоночных СУБД
- Сценарии использования ClickHouse
- Сценарии развертывания кластера ClickHouse и планирование установки: облако, on premises, docker.
Лабораторная работа: Создание кластера ClickHouse с использованием Managed Service for ClickHouse или установка в Docker, настройка подключений и написание запросов к системным таблицам.
2. Структура БД в ClickHouse
- Движки баз данных и таблиц (MergeTree, CollapsingMergeTree, Log, Memory, Buffer)
- Констрейнты, индексы, проекции
- Простые и материализованные представления
- Внешние и внутренние словари и работа с ними
Лабораторная работа: Создание баз данных, таблиц, индексов, представлений и проекций в ClickHouse.
3. Основы ClickHouse SQL
- Типы данных
- Команды DDL и DML
- Эффективное написание SQL-запросов
- Пользовательские функции
- Функции работы с датой и временем
Лабораторная работа: Пишем быстрые SQL-запросы и оптимизируем их.
4. Оптимизация и производительность
- Профилирование и EXPLAIN
- Использование system.query_log
- Партиционирование и кластеризация
- Предварительное агрегирование и кэширование данных
Лабораторная работа: Находим и ускоряем “тяжёлые” запросы. Профилирование и оптимизация запросов.
5. Распределённые системы
- Шардирование и репликация
- Настройка отказоустойчивого кластера
- Балансировка нагрузки
Лабораторная работа: Настраиваем отказоустойчивый кластер
6. Интеграция и расширенные возможности
- Работа с JSON, массивами, вложенными структурами
- Работа с географическими данными
- Потоковая обработка данных. Паттерны применения ClickPipes
- Интеграция с Kafka, PostgreSQL
- Инструменты для визуализации данных: Datalens, SuperSet, Grafana, Metabase
- Обработка событий в режиме реального времени
Лабораторная работа: Создаём потоковую обработку данных на ClickHouse
7. Администрирование и безопасность ClickHouse
- Управление пользователями и ролями
- Методы аутентификации
- Резервное копирование и восстановление
- Мониторинг и кастомные метрики
- Алертинг (Prometheus, Grafana)
Лабораторная работа: Настройка резервного копирования в ClickHouse. Реализация кастомных метрик, построение дашбордов, (Monitoring service – Prometheus, Visualization Tool – Grafana).
8. Итоговое тестирование
Тестирование (на английском языке) обязательно в случае дальнейшего участия в курсе подготовки к сертификации «ClickHouse Certified Developer»
Укажите e-mail, на который будет оправлена ссылка для скачивания файла:
Чему Вы научитесь
В результате обучения вы приобретете необходимые знания и навыки, необходимые для эффективной работы с Clickhouse и сможете:
- Работать с инфраструктурой ClickHouse
- Проектировать и оптимизировать DWH
- Строить хранилища, которые обрабатывают миллионы запросов в день
- Интегрировать ClickHouse с экосистемой Big Data
- Подготовиться к сертификации от Вендора
Что Вы получите
Окончив курс “Построение DWH на ClickHouse” и сдав выпускной экзамен в нашем учебном центре «Школа Больших Данных», вы получите удостоверение о повышении квалификации установленного образца.

Кто проводит курс
Профессиональные компетенции:
- Разработчик Python/Data Engineer
- Руководитель группы по обработке и визуализации данных в Мастер Деливери
- Организация ETL-процессов
- Мониторинг и поддержка хранилищ данных (Clickhouse/Vertica/Greenplum)
- Разработка на Python, Scala, SQL
Чтобы записаться на курс CLICH: Построение DWH на ClickHouse позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.