Практические курсы Apache Spark

Курсы Apache Spark для аналитиков, разработчиков и инженеров Big Data,
а также специалистов по Data Science и Machine Learining

+7 (495) 41-41-121

Что такое Apache Spark и где это используется

Apache Spark – это Big Data фреймворк с открытым исходным кодом для распределённой пакетной и потоковой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop.

Спарк состоит из следующих компонентов:

Благодаря такому разнообразию инструментов интерактивной аналитики данных, Спарк активно используется в системах интернета вещей (IoT/IIoT), а также в различных бизнес-приложениях, в т.ч. для машинного обучения (Machine Learning). Например, для прогнозирования оттока клиентов и оценки финансовых рисков.
Фреймворк Спарк может работать как в среде кластера Hadoop под управлением YARN, так и без компонентов ядра Хадуп, в частности, на базе системы управления кластером Mesos. Спарк поддерживает несколько популярных распределённых систем хранения данных: HDFS, OpenStack Swift, Cassandra, Amazon S3. Также этот фреймворк предоставляет API-интерфейсы для самых популярных в области Big Data языков программирования: Java, Scala, Python и R.

Расписание курсов по Apache Spark

Код курса Название курса Дата начала курса Цена Ак.часов
CORSCore Spark - основы для разработчиков07 Авг16 Окт4400016
SPOTПотоковая обработка в Apache Spark09 Авг19 Окт4400016
MLSPМашинное обучение в Apache Spark07 Авг19 Окт4400016
GRASГрафовые алгоритмы в Apache Spark07 Авг19 Окт4400016
SPARKАнализ данных с Apache Spark25 Сен27 Ноя8800032

Кому нужны курсы по Apache Spark

Наши практические курсы по Apache Spark предназначены для разработчиков распределенных приложений, инженеров больших данных, аналитиков Big Data, DataOps и DevOps-инженерам, а также специалистов по Data Science и Machine Learning, которые хотят получить следующие знания и навыки:

Познакомиться с основными функциональными возможностями и базовыми компонентами Apache Spark Core для анализа больших данных и разработки распределенных приложений

Понять особенности потоковой и микро-пакетной обработки данных в режиме near real-time со Spark Streaming

Освоить аналитику больших данных с помощью стандартного языка структурированных запросов на Spark SQL

Изучить графовые алгоритмы обработки информации, парадигму Pregel и ее представление в Spark Graphframe

Разобраться с реализацией нейросетевых алгоритмов и других методов Machine Learning в Spark MLLib

Знать методы интеграции Spark-приложений с другими Big Data системами и внешними источниками данных; уметь строить эффективные конвейеры обработки больших данных (Pipelines) на базе Apache Spark, Airflow, Livy и других технологий Big Data

Понимать способы и возможности оптимизации каждого компонента платформы Apache Spark, от производительности кластера до SQL-запросов и накладных расходов в Big Data Pipeline

Наши курсы по практическому администрированию, разработке и эксплуатации Apache Spark помогут вам развить профессиональную карьеру инженера данных (Data Engineer), аналитика данных (Data Analyst), ученого по данным (Data Scientist) и разработчика программных решений для Big Data (Data Developer). Выбирайте свою специализацию, а мы подберем для вас нужный обучающий курс или разработаем индивидуальную образовательную программу.

Как проходят курсы
по Apache Spark в Школе Больших Данных

Курсы Apache Spark в нашем учебном центре организованы в виде краткосрочных интенсивов. Программы обучения включают все теоретические знания и практические навыки, необходимые для эффективной работы с этим Big Data фреймворком в качестве Data Engineer, Data Analyst, Data Scientist и Data Developer.

Обучение проходит в формате практического семинара (workshop) и предусматривает индивидуальный фидбэк для каждого слушателя. Практическая часть предусматривает самостоятельную разработку Spark-приложений для потоковой или пакетной обработки информации в рамках систем аналитики больших данных.

Окончив курсы по Apache Spark в нашем лицензированном учебном центре, вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельства о повышении квалификации.

Станьте востребованным специалистом по разработке распределенных приложений, анализу больших данных и машинному обучению вместе с BigDataSchool!

Записаться на курс

Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам?
Оставьте номер телефона или e-mail и мы оперативно проконсультируем вас в течение рабочего дня.
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.

Поиск по сайту