Главная » Курсы greenplum
Практические курсы Greenplum
Лучшие практики применения в качестве DWH и аналитического хранилища в проектах аналитики больших данных
Что такое Greenplum и где это используется
В основе Greenplum лежит шардированная объектно-реляционная база PostgreSQL, которая имеет множество расширений для различных вариантов использования.
Фактически, кластер Greenplum состоит из нескольких взаимосвязанных экземпляров базы данных PostgreSQL, объединенных по принципу массивно-параллельной архитектуры (Massive Parallel Processing, MPP) без разделения ресурсов (Shared Nothing). Каждый узел кластера взаимодействует с другими узлами по высокопроизводительным сетевым протоколам для выполнения вычислительных операций, но имеет собственные ресурсы: память, ЦП, операционную систему и жесткие диски. Для повышения надежности к типовой топологии master-slave добавлен резервный главный сервер. Запросы с клиента приходят только на главный сервер (master), который не хранит данные, а маршрутизирует запросы к серверам с данными - сегментам. Также в highload-системах с высокой доступностью настраивается зеркалирование главного сервера и сегментов, чтобы исключить потерю данных и простои из-за программных или аппаратных сбоев.
- системы предиктивной аналитики и регулярной отчетности по большим объемам данных
- построение озер и корпоративных хранилищ данных
- поддержка аналитических моделей и алгоритмов машинного обучения по множеству разнообразных данных, например, для прогнозирования оттока клиентов.
Расписание курсов по Greenplum и NoSQL-СУБД
Код курса | Название курса | Дата начала курса | Цена | Ак.часов | Дней | |
---|---|---|---|---|---|---|
GPDE | Greenplum для инженеров данных и аналитиков данных | 18 Ноя | 27 Янв | 72 000 | 24 | 5 |
GRAD | Администрирование Greenplum / Arenadata DB | 02 Дек | 03 Мар | 120 000 | 40 | 5 |
Кому нужны курсы по GP
Находите закономерности в больших объемах данных с помощью привычных выражений на языке структурированных запросов ANSI SQL
Обеспечьте надежность, безопасность и быстроту работы высоконагруженных систем и корпоративного DWH
Создавайте распределенные аналитические приложения, эффективно наполняя корпоративное хранилище данных согласованной информацией
Организуйте эффективные DataOps-конвейеры для хранения и аналитической обработки Big Data с потоковым и пакетным импортом данных из множества источников, в т.ч. HDFS
- Анализировать большие данные с использованием современных технологий и классических SQL-запросов
- Разрабатывать надежные распределенные приложения для аналитики Big Data
- Интегрировать данные из различных источников в едином DWH
- Собирать, агрегировать и обрабатывать конвейеры больших данных из множества разных источников в лучших практиках DataOps
- Устанавливать, настраивать, разворачивать, конфигурировать и сопровождать эксплуатацию Greenplum-кластеров, оптимизируя потребление ресурсов
а мы подберем для вас нужный обучающий курс или разработаем индивидуальную образовательную программу
Как проходят курсы
по Greenplum в Школе Больших Данных
Курсы GP в нашем учебном центре организованы в виде краткосрочных интенсивов. Программы обучения включают все теоретические знания и практические навыки, необходимые для эффективной работы с этим Big Data фреймворком в качестве Data Engineer, Data Analyst, Data Scientist и Data Developer
Обучение проходит в форме практического семинара (workshop) с индивидуальным фидбэком для каждого слушателя. Практическая часть включает самостоятельную разработку Kafka-приложений для потоковой аналитики больших данных
Окончив курсы по Greenplum в нашем лицензированном учебном центре, вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельства о повышении квалификации