Курс FLINK: Apache Flink потоковая обработка данных

4-хдневный курс обучения по Flink позволит вам получить и систематизировать знания по использованию возможностей Apache Flink для обработки прежде всего потоковых данных, включая нюансы извлечения меток времени и генерации watermarks, лучшие практики (best practices) использования механизмов временных окон, работы с локальным состоянием, вопросы эффективности и параллелизма обработки, тонкости работы с источниками данных и многое другое.

Вы изучите необходимый теоретический минимум, чтобы понять основные концепции фреймворка Flink, его подходы к преобразованию потока данных, нюансы работы с потоком в терминах времени событий или времени обработки (event vs processing time), виды сохраняемого состояния (state type and primitives), работу с источниками потоковых данных.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
FLINK
29 июня 2026
29 сентября 2026
22 декабря 2026
51 200 руб. 16 ак.часов
Количество дней: 4
Дистанционный
Регистрация

Программа курса «Потоковая обработка данных с помощью Apache Flink»

Аудитория

Дата-инженеры и специалисты по данным, которые хотят изучить необходимый теоретический минимум по Apache Flink, чтобы понять основные концепции фреймворка, stateful преобразований и доставки данных из сторонних систем, а также узнать особенности подхода Flink к построению масштабируемых надежных конвейеров обработки потоковых данных.

Уровень подготовки

  • Уверенное знание базовых команд Linux (опыт работы с командной строкой),
  • Знания языка Java.

 

Преподаватель курса «Потоковая обработка данных с помощью Apache Flink» подробно объяснит все тонкости и особенности настройки механизмов извлечения времени, работы с состоянием и локальным кластером Apache Flink с тем, чтобы вы могли самостоятельно разрабатывать собственные системы потоковой обработки данных по окончании курса.

На практике вы реализуете собственные потоковые процессоры с помощью Apache Flink, научитесь работать с метками времени и watermarks, сможете выполнять базовые трансформации потоковых данных, использовать временные окна, обрабатывать данные из Apache Kafka и файловых источников.

Во время курса вы также получите информацию о сравнении возможностей Apache Flink с аналогами (Kafka Streams и Spark Structured Streaming).

 

  • Потоковая и Batch обработка
  • Основные понятия и особенности потоковой обработки
  • Встречаем Flink: компоненты и первое приложение
  • Основные API

О продукте

Apache Flink – это фреймворк и распределённый вычислительный движок для обработки ограниченных и неограниченных потоков данных с сохранением состояния (stateful computations). Flink относят к потоковым процессорам третьего поколения, он обладает интуитивными и выразительными API, с помощью которых можно создать масштабируемую отказоустойчивую систему обработки потока данных. Flink хорошо подходит для реализации систем потоковой обработки, использующих состояние (stateful stream processing), его уникальный механизм точек сохранения (checkpoints и savepoints) позволяет реализовать exactly-once гарантию консистентности данных и эффективно восстанавливать потоковую обработку без потери и дублирования в случае сбоев или регламентных окон, а также обеспечивает легкие и понятные способы масштабирования работающих в продуктивной среде приложений.

На практике Apache Flink широко используется для решения широкого спектра задач, начиная от построения процессоров потоковой обработки данных реального времени и заканчивая реализацией сложных сценариев потоковой подготовки данных и потоковой аналитики данных. С помощью Flink можно построить приложения, использующие парадигму «событийного управления» (Event Driven Applications).

Flink может использоваться не только для потоковой обработки, но и для обработки статических массивов данных (batch processing), хорошо взаимодействует с источниками потоковых и статических данных, такими как Apache Kafka, Kinesis, RabbitMQ, Apache Nifi, Cassandra, ElasticSearch, а также JDBC источниками и различными файловыми системами.

Что Вы получите

Окончив курс «Потоковая обработка данных с помощью Apache Flink» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат установленного образца, который может засчитываться в качестве свидетельства о повышении квалификации.

Кто проводит курс

Королев Михаил
МГУ им. М.В. Ломоносова (Москва, 1988)

Часто задаваемые вопросы (FAQ)

Дата инженерам и разработчикам, которым надоели тормоза классической пакетной обработки. Если бизнес требует реагировать на данные прямо сейчас, а не собирать их до завтрашнего утра, пора вникать во Flink. Никаких воздушных замков, только суровая перекачка и трансформация бесконечных потоков.

Отправьте заявку на обучение

Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам? Оставьте номер телефона или email и мы оперативно проконсультируем вас в течение дня