Все курсы

Авторский учебный курс «Администрирование базы данных Greenplum / Arenadata DB»

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
GRAD
11 марта 2024
13 мая 2024
02 сентября 2024
120 000 руб. 40 ак.часов Дистанционный
Регистрация

Что такое Greenplum и Arenadata DB

Greenplum — это основанная на PostgreSQL реляционная СУБД с открытым исходным кодом. Она ориентирована на аналитику больших данных, т.е. аналитические сценарии (OLAP) чтения больших массивов информации и поддерживает колоночный способ хранения данных. Ее массивно-параллельная архитектура (MPP, Massively Parallel Processing) без разделения ресурсов отлично подходит для OLAP-сценариев, поскольку аналитические СУБД работают с огромными объёмами данных, которые постоянно растут. Скорость вычислений в MPP-системе прямо пропорциональна числу узлов в кластере. Также MPP-архитектура обеспечивает высокую отказоустойчивость: кластер БД отвечает на запросы даже при отказе некоторых узлов.

Будучи реляционной СУБД, Greenplum поддерживает ACID-требования к транзакциям и ANSI SQL, а также отлично обрабатывает локальные и распределенные запросы с JOIN-операторами. Поэтому Greenplum хорошо работает в аналитических сценариях, включая предиктивную аналитику, прогнозирование и скоринг событий, а также предоставление данных для BI-дэшбордов.

Greenplum представляет собой несколько экземпляров PostgreSQL, работающих как единая СУБД благодаря мастер-хосту, на котором развёрнут мастер-сегмент — главный экземпляр PostgreSQL. Именно к мастер-сегменту подключаются пользователи и отправляют на него все SQL-запросы. Мастер-сегмент не содержит данных, а только принимает входящие подключения, собирает и систематизирует запросы, чтобы маршрутизировать их по сегментам, которые содержат фактические данные и выполняют запросы.

Программа курса «GRAD: Администрирование Greenplum / Arenadata DB»

Скачать программу курса «Администрирование Greenplum / Arenadata DB» в формате pdf

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

 Программа курса «Администрирование базы данных Greenplum / Arenadata DB»

  1. Введение в СУБД Greenplum / Arenadata DB
    • Архитектура  Greenplum / Arenadata DB / MPP
    • Greenplum Мастера и Сегменты
    • Greenplum Interconnect
    • Отказоустойчивость
    • Выбор дистрибутива
  1. Установка и настройка Greenplum / Arenadata DB
    • Требования по установке.
    • Планирование и масштабирование.
    • Установка с использованием ADCM. Ручная установка.
    • Настройка Data Layout и параметров окружения.
    • Управление сервисами Greenlum / Arenadata DB
    • Клиентское подключение к БД. Клиентские приложения и утилиты.
    • Greenplum / Arenadata DB в облаке
    • Практическая работа: Установка и настройка Arenadata DB с использованием ADCM
    • Практическая работа: Установка и настройка Greenplum DB
  1. Терминология и основные концепции Greenplum /Arenadata DB
    • Распределенная БД и политики распределения
    • PQE — Parallel Query Execution
    • MPP — Massive Parallel Processing
    • MVCC — MultiVersion Concurrency Control
    • PXF – Platform Extension Framework
  1. Схемы и объекты СУБД Greenplum /Arenadata DB
    • Логическая и физическая структура БД
    • Установка по умолчанию: схемы и шаблоны
    • Табличные пространства в Greenplum / Arenadata DB
    • Внешние таблицы
    • Создание и обслуживание индексов
    • Создание и управление представлениями (views)
    • Практическая работа: Предварительная настройка кластера Greenplum DB
  1. Операции обслуживания СУБД Greenplum / Arenadata DB
    • Управление ресурсами кластера- ресурсные группы
    • Управление данными в Greenplum /Arenadata DB
    • Вставка, обновление и удаление строк
    • Очистка (Vacuum)  базы данных
    • Масштабирование (Расширение) кластера
    • Планы запросов
    • Управление файлами логов БД
    • Реиндексация
    • Задачи операций обслуживания
    • Практическая работа: Настройка и  использование ресурсных групп на кластере Greenplum
    • Практическая работа: Операции обслуживания базы данных Greenplum
    • Практическая работа: Масштабирование кластера Greenplum добавлением узлов сегментных хостов
  1. Загрузка и выгрузка данных в Greenplum / Arenadata  DB
    • Механизмы загрузки и выгрузки данных
    • Использование внешних таблиц
    • Сценарии загрузки данных в БД
    • Интеграции с другими источниками: Kafka, Hadoop, NiFi, S3
    • Практическая работа: Настройка доступа Greenplum к внешним данным и работа с внешними таблицами
    • Практическая работа: Настройка сервиса PXF для кластера Greenplum
  1. Партиционирование таблиц
    • Создание партиционированных таблиц
    • Ключ партиционирования
    • Разные типы хранения
    • Tablespace
    • Мульти-партиционирование
    • Удаление, разбиение, обмен партиций
    • Внешние таблицы (обычные и web-внешние)
    • Практическая работа: Загрузка в партиционированные таблицы
  1. Отказоустойчивость в Greenplum / Arenadata DB
    • Опции отказоустойчивости для Greenplum / Arenadata DB
    • Зеркалирование сегментов в  Greenplum
    • Отказоустойчивость Сегментов и восстановление в  Greenplum
    • Зеркалирование Мастеров в Greenplum
    • Восстановление сегмента. Восстановление мастера
    • Практическая работа:Обеспечение отказоусточивости кластера Greenplum с помощью зеркалирования сегментов
    • Практическая работа: Обеспечение отказоусточивости кластера с помощью зеркалирования Мастера
    • Практическая работа: Восстановление после сбоя зеркал сегментов и мастера
  1. Резервное копирование и восстановление БД
    • Основные принципы операций восстановления и резервного копирования
    • Backup утилиты Greenplum / Arenadata DB
    • Процедура резервного копирования
    • Процедура восстановления БД
    • Практическая работа: Резервное копирование и восстановление кластера Greenplum DB
  1. Мониторинг и troubleshooting СУБД
    • Мониторинг и анализ состояния системы (System state)
    • Инструменты мониторинга Arenadata DB / ADCM
    • Основные причины проблем производительности
    • Собираемые метрики и сбор статистики
    • Управление нагрузкой и оповещениями
    • Мониторинг журналов: анализ сообщений об ошибках и идентификация проблемных запросов
    • Оптимизация параметров БД и дизайна БД
    • Best Practices
    • Практическая работа: Настройка мониторинга кластера Greenplum DB
  1. Безопасность в Greenplum / Arenadata DB
    • Контроль доступа и обеспечение безопасности
    • RBAC в СУБД Greenplum / Arenadata DB
    • Поддержка шифрования и аутентификации с использованием SSL
    • Интеграция с LDAP
    • Практическая работа: Настройка LDAP аутентификации для Greenplum

Примечание: лабораторные работы в курсе проводятся с использованием лабораторного стенда в облаке AWS или Яндекс/VKcloud на community версии дистрибутива Greenplum / Arenadata DB 6.XX

Программа курса «GRAD: Администрирование Greenplum / Arenadata DB»

Скачать программу курса «Администрирование Greenplum / Arenadata DB» в формате pdf

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

О курсе «Администрирование базы данных Greenplum / Arenadata DB»

5-дневный обучающий курс «Администрирование базы данных Greenplum / Arenadata DB» предназначен для подготовки администраторов и специалистов, отвечающих за установку и обслуживание базы данных Greenplum / Arenadata DB, включая предварительную подготовку и планирование систем для установки Greenplum, настройку конфигурации сервисов, табличного пространства, безопасности и клиентского доступа, а также операций мониторинга и решения проблем с эксплуатацией Greenplum / Arenadata DB. Курс предоставляет необходимые знания и навыки по сопровождению и поддержке базы данных Greenplum / Arenadata DB при эксплуатации в облачной инфраструктуре и дата центре. Подробно рассматриваются вопросы загрузки/выгрузки данных, средства резервного копирования и восстановления системы, настройки безопасности и интеграция.

Соотношение теории к практике: 50/50

Аудитория:

Администраторы и специалисты желающие получить практические навыки по установке, конфигурированию, обслуживанию и управлению кластером Greenplum / Arenadata DB.

Предварительная подготовка:

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vinano)
  • Основы работы с базами данных
  • Опыт работы с PSQL/ SQL

Программа курса «GRAD: Администрирование Greenplum / Arenadata DB»

Скачать программу курса «Администрирование Greenplum / Arenadata DB» в формате pdf

Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

Кто проводит курс

Преподаватель Школы Больших Данных Комиссаренко Николай
Преподаватель Школы Больших Данных

Комиссаренко Николай

Томский Политехнический Институт (Томск, 1994)
Профессиональные компетенции:
  • Сертифицированный тренер Arenadata (2019)
  • Построение Data Lake и аналитика больших данных на решениях Arenadata, Cloudera, HortonWorks, EMC (Hadoop, Isilon), Pivotal, облачные решения, cистемы хранения данных уровня enterprise, информационная безопасность
  • EMC Certified Instructor (2007)
  • Dell EMC Specialist – Cloud Architect (2006)
  • Dell EMC XtremeIO, Isilon – Storage Aministrator, Data Science Specialist (2006)
  • IT Service Manager (2006)
  • Certified Information System Security Professional (CISSP) (2006 -2010)
  • Certified Information Security Manager (CISM)

Отзывы наших клиентов о курсе

География наших клиентов

  • Москва
  • Санкт-Петербург
  • Нижний Новгород
  • Екатеринбург
  • Казань
  • Краснодар
  • Красноярск
  • Перьм
  • Челябинск
  • Новосибирск
  • Томск
  • Тверь
  • Саратов
  • Самара
  • Ростов-на-Дону
  • Хабаровск
  • Волгоград
  • Калуга
  • Якутск
  • Севастополь
  • Тольяти
  • Владивоссток
  • Тюмень
  • Южно-Сахалинск
  • Уфа
  • Ставрополь
  • Минск
  • Алматы
  • Астана
  • Ташкент
  • Душанбе
  • Бешкек
Если у Вас остались вопросы Вы можете позвонить к нам по телефону +7 (495) 414-11-21  или заполнить форму обратной связи на сайте.
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.

Поиск по сайту