Главная » Курсы Apache Spark
Практические курсы Apache Spark
а также специалистов в Data Science и Machine Learining
Что такое Apache Spark и где это используется
Apache Spark состоит из следующих компонентов:
- Ядро (Core)
- SQL – инструмент для аналитической обработки данных с помощью SQL-запросов
- Streaming – надстройка для обработки потоковых данных
- MLlib – набор библиотек машинного обучения (Machine Learning)
- GraphX – модуль распределённой обработки графов
Расписание курсов по Apache Spark
Код курса | Название курса | Дата начала курса | Цена | Ак.часов | Дней | |
---|---|---|---|---|---|---|
CORS | Core Spark - основы для разработчиков | 07 Окт | 16 Дек | 48 000 | 16 | 2 |
SPOT | Потоковая обработка в Apache Spark | 07 Ноя | 06 Фев | 48 000 | 16 | 2 |
MLSP | Машинное обучение в Apache Spark | 07 Ноя | 06 Фев | 48 000 | 16 | 2 |
GRAS | Графовые алгоритмы в Apache Spark | 07 Ноя | 06 Фев | 48 000 | 16 | 2 |
SPARK | Анализ данных с помощью современного Apache Spark | 07 Окт | 16 Дек | 96 000 | 32 | 4 |
Кому нужны курсы по Apache Spark
Познакомиться с основными функциональными возможностями и базовыми компонентами Apache Spark Core для анализа больших данных и разработки распределенных приложений
Понять особенности потоковой и микро-пакетной обработки данных в режиме near real-time со Spark Streaming
Освоить аналитику больших данных с помощью стандартного языка структурированных запросов на Spark SQL
Изучить графовые алгоритмы обработки информации, парадигму Pregel и ее представление в Spark Graphframe
Разобраться с реализацией нейросетевых алгоритмов и других методов Machine Learning в Spark MLLib
Знать методы интеграции Spark-приложений с другими Big Data системами и внешними источниками данных; уметь строить эффективные конвейеры обработки больших данных (Pipelines) на базе Apache Spark, Airflow, Livy и других технологий Big Data
Понимать способы и возможности оптимизации каждого компонента платформы Apache Spark, от производительности кластера до SQL-запросов и накладных расходов в Big Data Pipeline
Как проходят курсы
по Apache Spark в Школе Больших Данных
Курсы Apache Spark в нашем учебном центре организованы в виде краткосрочных интенсивов. Программы обучения включают все теоретические знания и практические навыки, необходимые для эффективной работы с этим Big Data фреймворком в качестве Data Engineer, Data Analyst, Data Scientist и Data Developer.
Обучение проходит в формате практического семинара (workshop) и предусматривает индивидуальный фидбэк для каждого слушателя. Практическая часть предусматривает самостоятельную разработку Spark-приложений для потоковой или пакетной обработки информации в рамках систем аналитики больших данных.
Окончив курсы по Apache Spark в нашем лицензированном учебном центре, вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельства о повышении квалификации.