Администрирование Arenadata DB / Greenplum

4х-дневный обучающий курс «Администрирование базы данных Arenadata DB (Greenplum) » предназначен для подготовки администраторов и специалистов, отвечающих за установку и обслуживание баз данных Arenadata DB (Greenplum), включая предварительную подготовку и планирование систем для установки кластера Greenplum, настройку конфигурации сервисов, табличного пространства, безопасности и клиентского доступа, а также операций мониторинга и решения проблем с эксплуатацией ADB. Курс предоставляет необходимые знания и навыки по сопровождению и поддержке кластера Arenadata DB при эксплуатации в облачной инфраструктуре и дата центре. Подробно рассматриваются вопросы загрузки/выгрузки данных, средства резервного копирования и восстановления системы, настройки безопасности и интеграция.

Примечание: !Возможно проведения курса полностью на ванильной версии дистрибутива Greenplum!

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
GRAD
03 марта 2025
03 марта 2025
96 000 руб. 32 ак.часов
Количество дней: 4
Дистанционный
Регистрация

О продукте:

Arenadata DB (Greenplum) — это MPP аналитическая СУБД, построенная на базе СУБД Greenplum с открытым исходным кодом. Arenadata DB (ADB) ориентирована на аналитику больших данных, т.е. аналитические сценарии (OLAP) чтения больших массивов информации и поддерживает колоночный способ хранения данных. Использует  массивно-параллельную архитектуру (MPP, Massively Parallel Processing) без разделения ресурсов отлично подходит для OLAP-сценариев, поскольку аналитические СУБД работают с огромными объёмами данных, которые постоянно растут. Скорость вычислений в MPP-системе прямо пропорциональна числу узлов в кластере. Также MPP-архитектура обеспечивает высокую отказоустойчивость: кластер БД отвечает на запросы даже при отказе некоторых узлов.

Будучи реляционной СУБД, Greenplum поддерживает ACID-требования к транзакциям и ANSI SQL, а также отлично обрабатывает локальные и распределенные запросы с JOIN-операторами. Поэтому Greenplum хорошо работает в аналитических сценариях, включая предиктивную аналитику, прогнозирование и скоринг событий, а также предоставление данных для BI-дэшбордов.

Arenadata DB (Greenplum) представляет собой несколько экземпляров PostgreSQL, работающих как единая СУБД благодаря мастер-хосту, на котором развёрнут мастер-сегмент — главный экземпляр PostgreSQL. Именно к мастер-сегменту подключаются пользователи и отправляют на него все SQL-запросы. Мастер-сегмент не содержит данных, а только принимает входящие подключения, собирает и систематизирует запросы, чтобы маршрутизировать их по сегментам, которые содержат фактические данные и выполняют запросы.

Аудитория:

Администраторы и специалисты, желающие получить практические навыки по установке, конфигурированию, обслуживанию и управлению кластером Arenadata DB (ADB).

Предварительная подготовка:

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vinano)
  • Основы работы с базами данных
  • Опыт работы с PSQL/ SQL

Соотношение теории к практике: 50/50

Программа курса «Администрирование базы данных

Arenadata DB (Greenplum) »

1. Введение в СУБД  Arenadata DB

    • Архитектура  Arenadata DB (Greenplum)/ MPP
    • Greenplum Мастера и Сегменты
    • Greenplum Interconnect
    • Отказоустойчивость
    • Выбор дистрибутива

2. Установка и настройка Greenplum / Arenadata DB

    • Требования по установке.
    • Планирование и масштабирование.
    • Установка с использованием ADCM. Ручная установка.
    • Настройка Data Layout и параметров окружения.
    • Управление сервисами Arenadata DB (Greenlum)
    • Клиентское подключение к БД. Клиентские приложения и утилиты.
    • Arenadata DB (Greenplum)  в облаке

Практическая работа: Установка и настройка Arenadata DB с использованием ADCM

3. Схемы и объекты СУБД Arenadata DB (Greenplum)

    • Логическая и физическая структура БД
    • Установка по умолчанию: схемы и шаблоны
    • Табличные пространства в  Arenadata DB
    • Внешние таблицы
    • Создание и обслуживание индексов
    • Создание и управление представлениями (views)

Практическая работа: Предварительная настройка кластера Arenadata DB

4. Операции обслуживания СУБД Arenadata DB

    • Управление ресурсами кластера- ресурсные группы
    • Управление данными в Arenadata DB
    • Вставка, обновление и удаление строк
    • Очистка (Vacuum) базы данных
    • Масштабирование (Расширение) кластера
    • Планы запросов
    • Управление файлами логов БД
    • Реиндексация
    • Задачи операций обслуживания

Практическая работа: Настройка и использование ресурсных групп на кластере Arenadata DB (ADB) Greenplum

Практическая работа: Операции обслуживания базы данных Arenadata DB

Практическая работа: Масштабирование кластера Arenadata DB (Greenplum) добавлением узлов сегментных хостов

5. Загрузка и выгрузка данных в  Arenadata DB

    • Механизмы загрузки и выгрузки данных
    • Использование внешних таблиц
    • Сценарии загрузки данных в БД
    • Интеграции с другими источниками: Kafka, Hadoop, NiFi, S3

Практическая работа: Настройка доступа Arenadata DB (Greenplum) к внешним данным и работа с внешними таблицами

Практическая работа: Настройка сервиса PXF для кластера Arenadata DB (Greenplum)

6. Партиционирование таблиц

    • Создание партиционированных таблиц
    • Ключ партиционирования
    • Разные типы хранения
    • Tablespace
    • Мульти-партиционирование
    • Удаление, разбиение, обмен партиций
    • Внешние таблицы (обычные и web-внешние)

Практическая работа: Загрузка в партиционированные таблицы

7. Отказоустойчивость в Arenadata DB (Greenplum)

    • Опции отказоустойчивости для  Arenadata DB
    • Зеркалирование сегментов в Arenadata DB
    • Отказоустойчивость Сегментов и восстановление в ADB
    • Зеркалирование Мастеров в ADB
    • Восстановление сегмента. Восстановление мастера

Практическая работа: Обеспечение отказоусточивости кластера Arenadata DB с помощью зеркалирования сегментов

Практическая работа: Обеспечение отказоусточивости кластера с помощью зеркалирования Мастера ADB

Практическая работа: Восстановление после сбоя зеркал сегментов и мастера в кластере Arenadata DB

8. Резервное копирование и восстановление БД Arenadata DB

    • Основные принципы операций восстановления и резервного копирования
    • Backup утилиты Arenadata DB
    • Процедура резервного копирования
    • Процедура восстановления БД

Практическая работа: Резервное копирование и восстановление кластера Arenadata DB

9. Мониторинг и troubleshooting СУБД Arenadata DB

    • Мониторинг и анализ состояния системы (System state)
    • Инструменты мониторинга Arenadata DB / ADCM
    • Основные причины проблем производительности
    • Собираемые метрики и сбор статистики
    • Управление нагрузкой и оповещениями
    • Мониторинг журналов: анализ сообщений об ошибках и идентификация проблемных запросов
    • Оптимизация параметров БД и дизайна БД
    • Best Practices

Практическая работа: Настройка мониторинга кластера Arenadata DB

10. Безопасность в  Arenadata DB

    • Контроль доступа и обеспечение безопасности
    • RBAC в СУБД Arenadata DB (Greenplum)
    • Поддержка шифрования и аутентификации с использованием SSL
    • Интеграция с LDAP

Практическая работа: Настройка LDAP аутентификации для Arenadata DB

Примечание: лабораторные работы в курсе проводятся с использованием лабораторного стенда в облаке  Яндекс Cloud на community версии дистрибутива  Arenadata DB 6.XX

!Возможно проведения курса полностью на ванильной версии дистрибутива Greenplum!

Скачать программу курса «Администрирование Greenplum / Arenadata DB» в формате pdf

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

Что Вы получите:

Успешно окончив курс «Администрирование Arenadata DB  » в нашем лицензированном учебном центре «Школа Больших Данных», вы получите удостоверение установленного образца, которое может засчитываться в качестве свидетельства о повышении квалификации.

Кто проводит курс

Комиссаренко Николай
Томский Политехнический Институт (Томск, 1994)
Профессиональные компетенции:
  • Сертифицированный тренер Arenadata (2019)
  • Построение Data Lake и аналитика больших данных на решениях Arenadata, Cloudera, HortonWorks, EMC (Hadoop, Isilon), Pivotal, облачные решения, cистемы хранения данных уровня enterprise, информационная безопасность
  • EMC Certified Instructor (2007)
  • Dell EMC Specialist – Cloud Architect (2006)
  • Dell EMC XtremeIO, Isilon – Storage Aministrator, Data Science Specialist (2006)
  • IT Service Manager (2006)
  • Certified Information System Security Professional (CISSP) (2006 -2010)
  • Certified Information Security Manager (CISM)

Отзывы наших клиентов о курсе

Оставить отзыв

Чтобы записаться на курс GRAD: Администрирование Arenadata DB / Greenplum позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту