GreenPlum для инженеров данных и аналитиков данных

    5 дней практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.

    Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
    GPDE
    08 декабря 2025
    16 февраля 2026
    72 000 руб. 24 ак.часов
    Количество дней: 5
    Дистанционный
    Регистрация

    О продукте

    Greenplum – это массивно-параллельная (Massive Parallel Processing, MPP) реляционная СУБД с открытым исходным кодом для хранилищ данных с гибкой горизонтальной масштабируемостью и столбцовым хранением данных на основе PostgreSQL. Несколько взаимосвязанных экземпляров базы данных PostgreSQL объединены в кластер Greenplum без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими для выполнения вычислительных операций, но имеет собственные ресурсы: оперативную память, операционную систему и жесткие диски. Благодаря особенностям MPP-архитектуры и мощному оптимизатору запросов, эта NoSQL-СУБД отличается надежностью и высокой скоростью обработки SQL-запросов над большими объемами данных.

    Эта MPP-СУБД широко применяется для аналитики больших данных в промышленных масштабах. Она обеспечивает надежное безопасное хранение и аналитическую обработку сотен терабайт, структурированных и слабоструктурированных данных для решения различных бизнес-задач. Например, построение систем предиктивной аналитики, корпоративных озер и хранилищ данных, организации регулярной отчетности и анализа оттока клиентов. Поэтому Greenplum широко применяется в ритейле, банках, телекоммуникационных компаниях, государственных предприятиях и других секторах экономики для организации витрин данных и быстрой аналитики Big Data с генерацией сложных отчетов в режиме практически реального времени.

    Именно на базе Greenplum разработана отечественная MPP-СУБД Arenadata DB (ADB), адаптированная для корпоративного использования и зарегистрированная в Едином реестре российских программ. Поэтому Arenadata DB полностью соответствует политике импортозамещения и активно используется множеством государственных организаций и частных компаний России в качестве надежного средства построения многоуровневых озер и хранилищ данных в рамках комплексной цифровизации предприятий.

    О курсе

    Курс даёт необходимые знания по эффективной и безопасной эксплуатации GreenPlum в качестве средства быстрой аналитики больших данных, а также основы многоуровневых Data Lake и КХД. Освоение каждой практической темы подкрепляется лабораторной работой. Выполнять лабораторные работы предлагаем на базе дистрибутива native Greenplum или Arenadata DB — выбор по желанию Слушателя.

    Аудитория

    Авторский курс по Greenplum в Школе Больших Данных ориентирован на следующие категории ИТ-специалистов:

    • инженер данных (Data Engineer);
    • аналитик больших данных (Data Analyst);
    • администратор больших данных (Big Data Administrator);
    • администратор баз данных (Database Administrator).

    Практические курсы по Greenplum предназначены для дата-инженеров, администраторов, системных архитекторов, аналитиков и разработчиков, которые хотят получить практические навыки по эффективной организации ETL/ELT-процессов, а также построению корпоративных озер и хранилищ данных на базе MPP-СУБД Greenplum.

    Предварительная подготовка

    • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
    • Опыт работы с SQL

    Программа курса «GreenPlum для инженеров данных»

    1. Основы Greenplum: Greenplum как реляционная MPP СУБД

      • Введение в Greenplum
      • Архитектура Greenplum
      • Партиционирование таблиц, индексы
      • Транзакции и блокировки
      • Оптимизация и планы запросов
      • Лабораторная работа

    2. Внешние данные и код: Greenplum как агрегатор данных и исполнитель кода

      • Механизм внешних таблиц, протоколы, PXF
      • Загрузка данных в Greenplum
      • Механизм UDF
      • Работа с JSON, XML
      • Экосистема и дополнительные библиотеки
      • Лабораторная работа

    3. Greenplum в современных хранилищах данных

      • Архитектура озера данных
      • ETL, ELT и подготовка данных
      • GPSS и интеграция Greenplum с Kafka и Nifi
      • Обработка данных из Greenplum с помощью Spark
      • Построение многоуровневого хранилища на Greenplum
      • Лабораторная работа

    Программа курса «GPDE: GreenPlum для инженеров данных и аналитиков данных»

    Скачать программу курса «Greenplum для инженеров данных»

    Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

    Что Вы получите

    Успешно окончив курс «GreenPlum для инженеров данных и аналитиков данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите удостоверение о повышении квалификации установленного образца.

    Кто проводит курс

    Королев Михаил
    МГУ им. М.В. Ломоносова (Москва, 1988)

      Отзывы слушателей курса

      GPDE: Greenplum для инженеров данных и аналитиков данных
      Анна Семина из компании Ростелеком
      Курс очень интересный! Большой объем материал (и теоретическая часть, и практическая) подан увлекательно и легко усваивается благодаря хорошо продуманным лабораторным работам. Отдельно хочу отметить высокий профессионализм, энтузиазм и вовлеченность преподавателя - Михаил Королева!
      GPDE: Greenplum для инженеров данных и аналитиков данных
      Елена Русина из компании МКБ
      Курс пролетел незаметно, в живой, интерактивной обстановке. Лекции были познавательны, интересны и не скучны. Материал подготовлен очень тщательно, в том числе задания в виде лабораторных работ.
      GPDE: Greenplum для инженеров данных и аналитиков данных
      Светлана Спирина из компании БанкиРу
      Все знания, ранее разбросанные, получили структуру и дополнились ценными деталями.
      GPDE: Greenplum для инженеров данных и аналитиков данных
      Заур Тарчоков из компании ПАО «Промсвязьбанк»
      Три дня обучения были наполнены практическими занятиями, которые позволили нам углубиться в мир больших данных, организации ETL и ELT процессов, построения корпоративных озер и хранилищ с использованием отказоустойчивой и масштабируемой MPP СУБД Greenplum. В процессе обучения мы получили доступ к актуальным и полезным материалам, а также возможность задавать вопросы и получать обратную связь от преподавателя. Все это позволило нам приобрести новые навыки и знания, которые обязательно пригодятся в нашей профессиональной деятельности. Курс был организован на высоком уровне, и я хотел бы выразить свою благодарность организаторам и преподавателю за их профессионализм и внимание к каждому участнику. Я уверен, что полученные знания и навыки станут важным шагом в моей карьере и помогут мне стать еще более успешным специалистом в своей области.
      GPDE: Greenplum для инженеров данных и аналитиков данных
      Высокий уровень организации учебного процесса дружным и доброжелательным коллективом ШБД и профессионализм преподавателя Михаила Королева сделали мое прохождение курса GPDE приятным и полезным.
      Оставить отзыв

      Чтобы записаться на курс GPDE: GreenPlum для инженеров данных и аналитиков данных позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.