Cloudera Impala Data Analytics

1-дневный практический курс по Cloudera Impala для специалистов, инженеров данных и аналитиков, работающих с SQL-on-Hadoop.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
IMPA
по запросу
0 руб. ак.часов
Количество дней: дней
Дистанционный
Регистрация

О продукте:

Cloudera Impala – это коммерческий продукт от компании Cloudera, массово-параллельный механизм интерактивного выполнения SQL-запросов к данным, хранящимся в Apache Hadoop (HDFS и HBase). Он написан на написанный на языке С++ и распространяется по лицензии Apache 2.0. Импала также называют MPP-движком (Massively Parallel Processing), распределенной СУБД и даже базой данных стека SQL-on-Hadoop.

Cloudera Impala используется для быстрой аналитики больших данных, хранящихся в Apache Hadoop (HDFS и HBase). Например, когда требуется оперативно ответить на сложный логический запрос, при поиске оптимального авиамаршрута или другой подобной задачи с непростой логистикой. Импала автоматически транслирует SQL-запрос в исполнительный код, позволяя работать с данными, хранящимися в HBase или HDFS, как с реляционными таблицами, формируя различные выборки и условные фильтрации, а также изменяя значение данных.

Как реализовать это на практике, расскажет краткосрочное обучение Cloudera Impala от лицензированного учебного центра «Школа Больших Данных«.

Аудитория:

Обучающие курсы Cloudera Impala предназначены для специалистов по SQL, инженеров данных и аналитиков, которые имеют опыт работы реляционными базами данных и хотят применить его к организации хранения, настройке импорта и экспорта данных с использованием Cloudera Impala в кластере Hadoop.

Уровень подготовки:

  • Знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
  • Опыт написания запросов SQL
  • Знание основ Hadoop

О курсе:

Длительность: 1 день, 8 академических часов

Соотношение теории к практике: 50/50

Практическое обучение Cloudera Impala для администраторов, инженеров и аналитиков данных, использующих Cloudera Impala, организовано в виде однодневного тренинга. Всего за 1 рабочий день вы изучите методы доступа к данным с использованием синтаксиса SQL для выполнения OLAP-запросов в распределенной среде в режиме near-realtime. Также за 8 академических часов вы освоите, как эффективно сделать загрузку и выгрузку данных с использованием метаданных в Hive Metastore.

Наши курсы Cloudera Impala включают сценарии интеграции Импала c Hive, Hbase, а также особенности исполнения запросов и JOIN операций. Практические занятия выполняются в Yandex Cloud и локальной кластерной системе с использованием дистрибутивов Cloudera Hadoop.

Программа курса «Cloudera Impala Data Analytics»

1. Введение в Cloudera Impala

    • Введение в Cloudera Impala: архитектура и компоненты.
    • Impala синтаксис, типы данных, написание запросов, загрузка данных, использование Hive Metastore.
    • Лабораторная работа.

2. Интеграция Cloudera Impala

    • Загрузка данных в таблицы Запросы через HBase.
    • Оптимизации производительности с использование Partition, Buckets.
    • Форматы файлов для Cloudera Impala (Parquet, ORC).

3. Оптимизация Impala запросов

    • Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
    • Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
    • Оптимизация запросов.

4. Сценарии применения Impala

Скачать программу курса «IMPA: Cloudera Impala Data Analytics» в формате pdf

Отправить ссылку на:

Что Вы получите:

Окончив курс «Cloudera Impala Data Analytics» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат установленного образца, который может засчитываться в качестве свидетельства о повышении квалификации.

Чтобы записаться на курс IMPA: Cloudera Impala Data Analytics позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту