Курс GPDE: GreenPlum для инженеров данных и аналитиков данных
5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database/Arenadata DB.
Курс даёт необходимые знания по эффективной и безопасной эксплуатации Arenadata DB/GreenPlum в качестве средства быстрой аналитики больших данных, а также основы многоуровневых Data Lake и КХД. Освоение каждой практической темы подкрепляется лабораторной работой. Выполнять лабораторные работы предлагаем на базе дистрибутива native Greenplum или Arenadata DB — выбор по желанию Слушателя.
| Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
|---|---|---|---|---|
| GPDE | 25 мая 2026 27 июля 2026 |
76 800 руб. | 24 ак.часов Количество дней: 5 |
Дистанционный |
| Регистрация | ||||
Программа курса «Arenadata DB для инженеров данных»
Аудитория
Авторский курс по Arenadata DB (Greenplum) в Школе Больших Данных ориентирован на следующие категории ИТ-специалистов:
- инженер данных (Data Engineer);
- аналитик больших данных (Data Analyst);
- администратор больших данных (Big Data Administrator);
- администратор баз данных (Database Administrator).
Практические курсы по ArenadataDB/Greenplum предназначены для дата-инженеров, администраторов, системных архитекторов, аналитиков и разработчиков, которые хотят получить практические навыки по эффективной организации ETL/ELT-процессов, а также построению корпоративных озер и хранилищ данных на базе MPP-СУБД Greenplum.
Предварительная подготовка
- Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
- Опыт работы с SQL
- Введение в Greenplum/Arenadata DB
- Архитектура Greenplum/Arenadata DB
- Партиционирование таблиц, индексы
- Транзакции и блокировки
- Оптимизация и планы запросов
Лабораторная работа
О продукте
Greenplum – это массивно-параллельная (Massive Parallel Processing, MPP) реляционная СУБД с открытым исходным кодом для хранилищ данных с гибкой горизонтальной масштабируемостью и столбцовым хранением данных на основе PostgreSQL. Несколько взаимосвязанных экземпляров базы данных PostgreSQL объединены в кластер Greenplum без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими для выполнения вычислительных операций, но имеет собственные ресурсы: оперативную память, операционную систему и жесткие диски. Благодаря особенностям MPP-архитектуры и мощному оптимизатору запросов, эта NoSQL-СУБД отличается надежностью и высокой скоростью обработки SQL-запросов над большими объемами данных.
Эта MPP-СУБД широко применяется для аналитики больших данных в промышленных масштабах. Она обеспечивает надежное безопасное хранение и аналитическую обработку сотен терабайт, структурированных и слабоструктурированных данных для решения различных бизнес-задач. Например, построение систем предиктивной аналитики, корпоративных озер и хранилищ данных, организации регулярной отчетности и анализа оттока клиентов. Поэтому Greenplum широко применяется в ритейле, банках, телекоммуникационных компаниях, государственных предприятиях и других секторах экономики для организации витрин данных и быстрой аналитики Big Data с генерацией сложных отчетов в режиме практически реального времени.
Именно на базе Greenplum разработана отечественная MPP-СУБД Arenadata DB (ADB), адаптированная для корпоративного использования и зарегистрированная в Едином реестре российских программ. Поэтому Arenadata DB полностью соответствует политике импортозамещения и активно используется множеством государственных организаций и частных компаний России в качестве надежного средства построения многоуровневых озер и хранилищ данных в рамках комплексной цифровизации предприятий
Что Вы получите
Успешно окончив курс «GreenPlum для инженеров данных и аналитиков данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите удостоверение о повышении квалификации установленного образца.
Кто проводит курс
Отзывы слушателей курса
Оставить отзывЧасто задаваемые вопросы (FAQ)
Для разработчиков хранилищ, дата-инженеров и продвинутых аналитиков. Если вы пишете тяжелые ETL/ELT-процессы, строите витрины данных и регулярно получаете гневные сообщения от админов за то, что ваш запрос сожрал всю память кластера — вам сюда. Будем учиться писать код так, чтобы MPP-база летала.
Отправьте заявку на обучение
Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам? Оставьте номер телефона или email и мы оперативно проконсультируем вас в течение дня
