Все курсы

Администрирование Greenplum / Arenadata DB

Авторский учебный курс «Администрирование базы данных Greenplum / Arenadata DB»

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
GRAD
13 мая 2024
02 сентября 2024
120 000 руб. 40 ак.часов Дистанционный
Регистрация

Что такое Greenplum и Arenadata DB

Greenplum — это основанная на PostgreSQL реляционная СУБД с открытым исходным кодом. Она ориентирована на аналитику больших данных, т.е. аналитические сценарии (OLAP) чтения больших массивов информации и поддерживает колоночный способ хранения данных. Ее массивно-параллельная архитектура (MPP, Massively Parallel Processing) без разделения ресурсов отлично подходит для OLAP-сценариев, поскольку аналитические СУБД работают с огромными объёмами данных, которые постоянно растут. Скорость вычислений в MPP-системе прямо пропорциональна числу узлов в кластере. Также MPP-архитектура обеспечивает высокую отказоустойчивость: кластер БД отвечает на запросы даже при отказе некоторых узлов.

Будучи реляционной СУБД, Greenplum поддерживает ACID-требования к транзакциям и ANSI SQL, а также отлично обрабатывает локальные и распределенные запросы с JOIN-операторами. Поэтому Greenplum хорошо работает в аналитических сценариях, включая предиктивную аналитику, прогнозирование и скоринг событий, а также предоставление данных для BI-дэшбордов.

Greenplum представляет собой несколько экземпляров PostgreSQL, работающих как единая СУБД благодаря мастер-хосту, на котором развёрнут мастер-сегмент — главный экземпляр PostgreSQL. Именно к мастер-сегменту подключаются пользователи и отправляют на него все SQL-запросы. Мастер-сегмент не содержит данных, а только принимает входящие подключения, собирает и систематизирует запросы, чтобы маршрутизировать их по сегментам, которые содержат фактические данные и выполняют запросы.

 Программа курса «Администрирование базы данных Greenplum / Arenadata DB»

  1. Введение в СУБД Greenplum / Arenadata DB
    • Архитектура  Greenplum / Arenadata DB / MPP
    • Greenplum Мастера и Сегменты
    • Greenplum Interconnect
    • Отказоустойчивость
    • Выбор дистрибутива
  2. Установка и настройка Greenplum / Arenadata DB
    • Требования по установке.
    • Планирование и масштабирование.
    • Установка с использованием ADCM. Ручная установка.
    • Настройка Data Layout и параметров окружения.
    • Управление сервисами Greenlum / Arenadata DB
    • Клиентское подключение к БД. Клиентские приложения и утилиты.
    • Greenplum / Arenadata DB в облаке
    • Практическая работа: Установка и настройка Arenadata DB с использованием ADCM
    • Практическая работа: Установка и настройка Greenplum DB
  1. Терминология и основные концепции Greenplum /Arenadata DB
    • Распределенная БД и политики распределения
    • PQE — Parallel Query Execution
    • MPP — Massive Parallel Processing
    • MVCC — MultiVersion Concurrency Control
    • PXF – Platform Extension Framework
  1. Схемы и объекты СУБД Greenplum /Arenadata DB
    • Логическая и физическая структура БД
    • Установка по умолчанию: схемы и шаблоны
    • Табличные пространства в Greenplum / Arenadata DB
    • Внешние таблицы
    • Создание и обслуживание индексов
    • Создание и управление представлениями (views)
    • Практическая работа: Предварительная настройка кластера Greenplum DB
  1. Операции обслуживания СУБД Greenplum / Arenadata DB
    • Управление ресурсами кластера- ресурсные группы
    • Управление данными в Greenplum /Arenadata DB
    • Вставка, обновление и удаление строк
    • Очистка (Vacuum)  базы данных
    • Масштабирование (Расширение) кластера
    • Планы запросов
    • Управление файлами логов БД
    • Реиндексация
    • Задачи операций обслуживания
    • Практическая работа: Настройка и  использование ресурсных групп на кластере Greenplum
    • Практическая работа: Операции обслуживания базы данных Greenplum
    • Практическая работа: Масштабирование кластера Greenplum добавлением узлов сегментных хостов
  1. Загрузка и выгрузка данных в Greenplum / Arenadata  DB
    • Механизмы загрузки и выгрузки данных
    • Использование внешних таблиц
    • Сценарии загрузки данных в БД
    • Интеграции с другими источниками: Kafka, Hadoop, NiFi, S3
    • Практическая работа: Настройка доступа Greenplum к внешним данным и работа с внешними таблицами
    • Практическая работа: Настройка сервиса PXF для кластера Greenplum
  1. Партиционирование таблиц
    • Создание партиционированных таблиц
    • Ключ партиционирования
    • Разные типы хранения
    • Tablespace
    • Мульти-партиционирование
    • Удаление, разбиение, обмен партиций
    • Внешние таблицы (обычные и web-внешние)
    • Практическая работа: Загрузка в партиционированные таблицы
  1. Отказоустойчивость в Greenplum / Arenadata DB
    • Опции отказоустойчивости для Greenplum / Arenadata DB
    • Зеркалирование сегментов в  Greenplum
    • Отказоустойчивость Сегментов и восстановление в  Greenplum
    • Зеркалирование Мастеров в Greenplum
    • Восстановление сегмента. Восстановление мастера
    • Практическая работа:Обеспечение отказоусточивости кластера Greenplum с помощью зеркалирования сегментов
    • Практическая работа: Обеспечение отказоусточивости кластера с помощью зеркалирования Мастера
    • Практическая работа: Восстановление после сбоя зеркал сегментов и мастера
  1. Резервное копирование и восстановление БД
    • Основные принципы операций восстановления и резервного копирования
    • Backup утилиты Greenplum / Arenadata DB
    • Процедура резервного копирования
    • Процедура восстановления БД
    • Практическая работа: Резервное копирование и восстановление кластера Greenplum DB
  1. Мониторинг и troubleshooting СУБД
    • Мониторинг и анализ состояния системы (System state)
    • Инструменты мониторинга Arenadata DB / ADCM
    • Основные причины проблем производительности
    • Собираемые метрики и сбор статистики
    • Управление нагрузкой и оповещениями
    • Мониторинг журналов: анализ сообщений об ошибках и идентификация проблемных запросов
    • Оптимизация параметров БД и дизайна БД
    • Best Practices
    • Практическая работа: Настройка мониторинга кластера Greenplum DB
  1. Безопасность в Greenplum / Arenadata DB
    • Контроль доступа и обеспечение безопасности
    • RBAC в СУБД Greenplum / Arenadata DB
    • Поддержка шифрования и аутентификации с использованием SSL
    • Интеграция с LDAP
    • Практическая работа: Настройка LDAP аутентификации для Greenplum

Примечание: лабораторные работы в курсе проводятся с использованием лабораторного стенда в облаке AWS или Яндекс/VKcloud на community версии дистрибутива Greenplum / Arenadata DB 6.XX

Программа курса «GRAD: Администрирование Greenplum / Arenadata DB»

Скачать программу курса «Администрирование Greenplum / Arenadata DB» в формате pdf

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

О курсе «Администрирование базы данных Greenplum / Arenadata DB»

5-дневный обучающий курс «Администрирование базы данных Greenplum / Arenadata DB» предназначен для подготовки администраторов и специалистов, отвечающих за установку и обслуживание базы данных Greenplum / Arenadata DB, включая предварительную подготовку и планирование систем для установки Greenplum, настройку конфигурации сервисов, табличного пространства, безопасности и клиентского доступа, а также операций мониторинга и решения проблем с эксплуатацией Greenplum / Arenadata DB. Курс предоставляет необходимые знания и навыки по сопровождению и поддержке базы данных Greenplum / Arenadata DB при эксплуатации в облачной инфраструктуре и дата центре. Подробно рассматриваются вопросы загрузки/выгрузки данных, средства резервного копирования и восстановления системы, настройки безопасности и интеграция.

Соотношение теории к практике: 50/50

Аудитория:

Администраторы и специалисты желающие получить практические навыки по установке, конфигурированию, обслуживанию и управлению кластером Greenplum / Arenadata DB.

Предварительная подготовка:

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vinano)
  • Основы работы с базами данных
  • Опыт работы с PSQL/ SQL

Кто проводит курс

Преподаватель Школы Больших Данных Комиссаренко Николай
Преподаватель Школы Больших Данных

Комиссаренко Николай

Томский Политехнический Институт (Томск, 1994)
Профессиональные компетенции:
  • Сертифицированный тренер Arenadata (2019)
  • Построение Data Lake и аналитика больших данных на решениях Arenadata, Cloudera, HortonWorks, EMC (Hadoop, Isilon), Pivotal, облачные решения, cистемы хранения данных уровня enterprise, информационная безопасность
  • EMC Certified Instructor (2007)
  • Dell EMC Specialist – Cloud Architect (2006)
  • Dell EMC XtremeIO, Isilon – Storage Aministrator, Data Science Specialist (2006)
  • IT Service Manager (2006)
  • Certified Information System Security Professional (CISSP) (2006 -2010)
  • Certified Information Security Manager (CISM)

Отзывы наших клиентов о курсе

География наших клиентов

  • Москва
  • Санкт-Петербург
  • Нижний Новгород
  • Екатеринбург
  • Казань
  • Краснодар
  • Красноярск
  • Перьм
  • Челябинск
  • Новосибирск
  • Томск
  • Тверь
  • Саратов
  • Самара
  • Ростов-на-Дону
  • Хабаровск
  • Волгоград
  • Калуга
  • Якутск
  • Севастополь
  • Тольяти
  • Владивоссток
  • Тюмень
  • Южно-Сахалинск
  • Уфа
  • Ставрополь
  • Минск
  • Алматы
  • Астана
  • Ташкент
  • Душанбе
  • Бешкек
Если у Вас остались вопросы Вы можете позвонить к нам по телефону +7 (495) 414-11-21  или заполнить форму обратной связи на сайте.
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту