Курс Apache Flink потоковая обработка данных с помощью

    4-хдневный курс обучения по Flink позволит вам получить и систематизировать знания по использованию возможностей Apache Flink для обработки прежде всего потоковых данных, включая нюансы извлечения меток времени и генерации watermarks, лучшие практики (best practices) использования механизмов временных окон, работы с локальным состоянием, вопросы эффективности и параллелизма обработки, тонкости работы с источниками данных и многое другое.

    Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
    FLINK
    10 ноября 2025
    02 февраля 2026
    48 000 руб. 16 ак.часов
    Количество дней: 4
    Дистанционный
    Регистрация

    О продукте

    Apache Flink – это фреймворк и распределённый вычислительный движок для обработки ограниченных и неограниченных потоков данных с сохранением состояния (stateful computations). Flink относят к потоковым процессорам третьего поколения, он обладает интуитивными и выразительными API, с помощью которых можно создать масштабируемую отказоустойчивую систему обработки потока данных. Flink хорошо подходит для реализации систем потоковой обработки, использующих состояние (stateful stream processing), его уникальный механизм точек сохранения (checkpoints и savepoints) позволяет реализовать exactly-once гарантию консистентности данных и эффективно восстанавливать потоковую обработку без потери и дублирования в случае сбоев или регламентных окон, а также обеспечивает легкие и понятные способы масштабирования работающих в продуктивной среде приложений.

    На практике Apache Flink широко используется для решения широкого спектра задач, начиная от построения процессоров потоковой обработки данных реального времени и заканчивая реализацией сложных сценариев потоковой подготовки данных и потоковой аналитики данных. С помощью Flink можно построить приложения, использующие парадигму «событийного управления» (Event Driven Applications).

    Flink может использоваться не только для потоковой обработки, но и для обработки статических массивов данных (batch processing), хорошо взаимодействует с источниками потоковых и статических данных, такими как Apache Kafka, Kinesis, RabbitMQ, Apache Nifi, Cassandra, ElasticSearch, а также JDBC источниками и различными файловыми системами.

    О курсе

    Вы изучите необходимый теоретический минимум, чтобы понять основные концепции фреймворка Flink, его подходы к преобразованию потока данных, нюансы работы с потоком в терминах времени событий или времени обработки (event vs processing time), виды сохраняемого состояния (state type and primitives), работу с источниками потоковых данных.

    Преподаватель курса “Потоковая обработка данных с помощью Apache Flink” подробно объяснит все тонкости и особенности настройки механизмов извлечения времени, работы с состоянием и локальным кластером Apache Flink с тем, чтобы вы могли самостоятельно разрабатывать собственные системы потоковой обработки данных по окончании курса.

    На практике вы реализуете собственные потоковые процессоры с помощью Apache Flink, научитесь работать с метками времени и watermarks, сможете выполнять базовые трансформации потоковых данных, использовать временные окна, обрабатывать данные из Apache Kafka и файловых источников.

    Во время курса вы также получите информацию о сравнении возможностей Apache Flink с аналогами (Kafka Streams и Spark Structured Streaming).

    Курс предполагает использование языка Java.

    Аудитория

    Дата-инженеры и специалисты по данным, которые хотят изучить необходимый теоретический минимум по Apache Flink, чтобы понять основные концепции фреймворка, stateful преобразований и доставки данных из сторонних систем, а также узнать особенности подхода Flink к построению масштабируемых надежных конвейеров обработки потоковых данных.

    Уровень подготовки

    • Уверенное знание базовых команд Linux (опыт работы с командной строкой),
    • Знания языка Java.

    Программа курса «Потоковая обработка данных с помощью Apache Flink»

    1. Введение и архитектура Apache Flink

      • Потоковая и Batch обработка
      • Основные понятия и особенности потоковой обработки
      • Встречаем Flink: компоненты и первое приложение
      • Основные API

    2. Datastream API: Базовые трансформации и работа с источниками данных

      • Основные операторы (трансформации)
      • Роллинг агрегации и reduce
      • Работа с источниками (Apache Kafka, файловые источники)

    3. Datastream API: Работа с учетом времени

      • Архитектура Apache Flink
      • Event Time Processing
      • Оконные операции и джойны

    4. Datastream API: Работа с состоянием

      • Низкоуровневые «process» функции и управление состоянием
      • Checkpoints, savepoints

    5. Другие API, языки и системы

      • Flink Table API и SQL
      • Flink и python
      • Сравнение Flink с Kafka Streams и Spark Structured Streaming

    FLINK: Потоковая обработка данных с помощью Apache Flink

    Скачать программу курса «Потоковая обработка данных с помощью Apache Flink» в формате pdf

    Укажите e-mail, на который будет оправлена ссылка для скачивания файла:

    Что Вы получите

    Окончив курс «Потоковая обработка данных с помощью Apache Flink» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат установленного образца, который может засчитываться в качестве свидетельства о повышении квалификации.

    Кто проводит курс

    Королев Михаил
    МГУ им. М.В. Ломоносова (Москва, 1988)

      Чтобы записаться на курс FLINK: Курс Apache Flink потоковая обработка данных с помощью позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.