Практические курсы Greenplum

Краткосрочные тренинги и курсы повышения квалификации по администрированию и эксплуатации самой популярной MPP-СУБД.
Лучшие практики применения в качестве DWH и аналитического хранилища в проектах аналитики больших данных
greenplum_logo

Что такое Greenplum и где это используется

Greenplum – это массивно-параллельная реляционная СУБД с открытым исходным кодом. Она используется как корпоративное хранилище данных, предоставляя мощные возможности гибкого горизонтального масштабирования, массово-параллельной загрузки, эффективного хранения и аналитической обработки больших данных.
В основе Greenplum лежит шардированная объектно-реляционная база PostgreSQL, которая имеет множество расширений для различных вариантов использования.
Фактически, кластер Greenplum состоит из нескольких взаимосвязанных экземпляров базы данных PostgreSQL, объединенных по принципу массивно-параллельной архитектуры (Massive Parallel Processing, MPP) без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими узлами по высокопроизводительным сетевым протоколам для выполнения вычислительных операций, но имеет собственные ресурсы: память, ЦП, операционную систему и жесткие диски. Для повышения надежности к типовой топологии master-slave добавлен резервный главный сервер. Запросы с клиента приходят только на главный сервер (master), который не хранит данные, а маршрутизирует запросы к серверам с данными - сегментам. Также в highload-системах с высокой доступностью настраивается зеркалирование главного сервера и сегментов, чтобы исключить потерю данных и простои из-за программных или аппаратных сбоев.
Архитектура кластера Greenplum
Благодаря своим архитектурным особенностям и мощному SQL-оптимизатору GPORCA, GP отличается особой надежностью и высокой скоростью обработки запросов над большими объемами данных. Сегодня Greenplum активно используется для надежного хранения и быстрой аналитической обработки больших объемов данных в крупных и средних компаниях. Типовыми сценариями применения GP в области Big Data являются следующие:
  • системы предиктивной аналитики и регулярной отчетности по большим объемам данных
  • построение озер и корпоративных хранилищ данных
  • поддержка аналитических моделей и алгоритмов машинного обучения по множеству разнообразных данных, например, для прогнозирования оттока клиентов.

Расписание курсов по Greenplum и NoSQL-СУБД

Код курса Название курса Дата начала курса Цена Ак.часов Дней
GPDEGreenplum для инженеров данных и аналитиков данных18 Ноя27 Янв72 000245
GRADАдминистрирование Greenplum / Arenadata DB02 Дек03 Мар120 000405

Кому нужны курсы по GP

Аналитик данных

Находите закономерности в больших объемах данных с помощью привычных выражений на языке структурированных запросов ANSI SQL

Администратор кластера

Обеспечьте надежность, безопасность и быстроту работы высоконагруженных систем и корпоративного DWH

Разработчик Big Data и архитектор DWH

Создавайте распределенные аналитические приложения, эффективно наполняя корпоративное хранилище данных согласованной информацией

Дата-инженер

Организуйте эффективные DataOps-конвейеры для хранения и аналитической обработки Big Data с потоковым и пакетным импортом данных из множества источников, в т.ч. HDFS

Наши практические курсы по Greenplum предназначены для разработчиков распределенных приложений, инженеров больших данных, аналитиков Big Data, DataOps и DevOps-инженерам, а также специалистов по Data Science и Machine Learning, которые хотят получить следующие знания и навыки:
Программы обучения адаптированы к разным уровням подготовки: от начинающих до профессионалов. Выбирайте свою специализацию,
а мы подберем для вас нужный обучающий курс или разработаем индивидуальную образовательную программу

Как проходят курсы
по Greenplum в Школе Больших Данных

Курсы GP в нашем учебном центре организованы в виде краткосрочных интенсивов. Программы обучения включают все теоретические знания и практические навыки, необходимые для эффективной работы с этим Big Data фреймворком в качестве Data Engineer, Data Analyst, Data Scientist и Data Developer

Обучение проходит в форме практического семинара (workshop) с индивидуальным фидбэком для каждого слушателя. Практическая часть включает самостоятельную разработку Kafka-приложений для потоковой аналитики больших данных

Окончив курсы по Greenplum в нашем лицензированном учебном центре, вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельства о повышении квалификации

Начните учиться сегодня!
Станьте востребованным специалистом по администрированию Greenplum-кластеров и разработке распределенных приложений аналитики больших данных вместе с BigDataSchool!
Поиск по сайту