Публикации с меткой Kafka

30Июн
2026

Изучаем Apache Kafka с нуля. Урок 32. connect-distributed.sh: Kafka Connect в distributed-режиме

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как понастройить распределенный коннектор Kafka - бесплатный курс по Apache Kafka

В уроке 31 мы разобрали standalone-режим Kafka Connect. Один процесс, конфигурация в файлах, офсеты на диске. Удобно для разработки, но в production такое не ставят: упал воркер — встали все коннекторы, и подхватить их некому. Distributed-режим решает именно это. Несколько воркеров объединяются в группу по group.id и синхронизируются через Kafka-топики....

27Июн
2026

Изучаем Apache Kafka с нуля. Урок 31. connect-standalone.sh: Kafka Connect в standalone-режиме

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как настроить и использовать Kafka connect и чем отличается редим standalone от distributed - разбираемся на бесплатных уроках

В уроке 30 разобрали MirrorMaker 2 - инструмент для репликации топиков между кластерами. Там мы мельком упоминали, что MM2 построен поверх Kafka Connect. Теперь пришло время разобраться с самим фреймворком. Kafka Connect - это слой интеграции, который берёт на себя всю рутину переноса данных между Kafka и внешними системами....

26Июн
2026

Изучаем Apache Kafka с нуля. Урок 30. MirrorMaker: репликация между кластерами

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В уроке 29 мы разобрали kafka-consumer-perf-test.sh — как измерить скорость чтения, интерпретировать вывод и подбирать параметры консьюмера. Получили полную картину: есть цифры продюсера, есть цифры консьюмера, узкое место теперь видно. Следующий логичный вопрос: а что делать, если кластеров несколько? DR-окружение, географически распределённые датацентры, изоляция окружений prod и staging —...

25Июн
2026

Изучаем Apache Kafka с нуля. Урок 29. kafka-consumer-perf-test.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как понять, с какой скоростью конкретный кластер отдаёт данные, и проверить, как ведут себя настройки консьюмера при разных сценариях - kafka-consumer-perf-test.sh в Школе Больших Данных разбираем на практике

В уроке 28 мы разобрали kafka-producer-perf-test.sh: как гнать синтетическую нагрузку в топик, читать перцентили латентности и подбирать параметры продюсера. Получили цифры на стороне записи. Но у любого потока данных есть вторая сторона - чтение. И там своя картина. Узкое место системы не всегда продюсер. Часто потребитель не успевает за входящим...

19Июн
2026

Изучаем Apache Kafka с нуля. Урок 26. kafka-get-offsets.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Какой сейчас earliest и latest офсет? Именно для этого существует kafka-get-offsets.sh - управления логами и очередью сообщений Apache Kafka

В уроке 25 мы разбирались с kafka-broker-api-versions.sh - смотрели, какие версии протокола поддерживает брокер, и учились диагностировать ошибки UNSUPPORTED_VERSION при rolling upgrade. Там речь шла о низкоуровневой совместимости на уровне API. Сегодня спускаемся на уровень ниже - не к протоколу, а к данным. Конкретно к офсетам. Любой, кто разбирается...

17Июн
2026

Изучаем Apache Kafka с нуля. Урок 25. kafka-broker-api-versions.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как использовать Kafka API для апгрейда версий Apache Kafka брокеров

В уроке 24 мы разбирали kafka-acls.sh и работу со списками доступа: кто из клиентов что может делать с топиками, группами, кластером. Там же всплыл важный момент - аутентификация через SASL и флаг --command-config. Прежде чем клиент получит право что-то делать, он должен вообще договориться с брокером на уровне протокола....

14Июн
2026

Изучаем Apache Kafka с нуля. Урок 24. kafka-acls.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как настроить аутентификацию в Apache Kafka - бесплатные курсы

В уроке 23 мы разобрали kafka-replica-verification.sh - инструмент, который подключается к каждому брокеру напрямую и сравнивает смещения реплик. Там же мы отметили важную особенность: утилита общается с брокерами через Fetch API без каких-либо ограничений доступа. В реальном кластере это уже вопрос: а кто вообще имеет право подключаться? В production-окружениях...

12Июн
2026

Изучаем Apache Kafka с нуля. Урок 23. kafka-replica-verification.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В уроке 22 мы разобрались с kafka-reassign-partitions.sh: генерировали план переноса партиций, запускали его с троттлингом и проверяли статус через --verify. После того как переназначение завершилось - данные физически переехали, реплики поднялись на новых брокерах. Но как убедиться, что данные во всех репликах одинаковые? Что ни одна реплика не отстала...

10Июн
2026

Изучаем Apache Kafka с нуля. Урок 22. kafka-reassign-partitions.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

как переназначить партиции в Apache Kafka сделать более эффективно

В уроке 21 мы разбирали kafka-leader-election.sh - инструмент для управления лидерами партиций после сбоев и перезапусков брокеров. Там вопрос стоял просто: вернуть лидерство туда, где оно должно быть по конфигурации. Сегодня задача масштабнее - физически переместить партиции между брокерами. Это нужно при добавлении нового брокера в кластер, выводе старого...

08Июн
2026

Изучаем Apache Kafka с нуля. Урок 21. kafka-leader-election.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Управление лидерами партиций Apache Kafka. Бесплатный урок 21 по Apache Kafka

В уроке 20 мы разбирали kafka-streams-application-reset.sh - инструмент для сброса состояния Kafka Streams приложений. Там речь шла о внутренних топиках, changelog-топиках и локальных state store. Сегодня переключаемся на другую задачу - управление лидерами партиций. kafka-leader-election.sh нужна когда лидер партиции после сбоя или перезапуска брокера оказался не там, где должен...

06Июн
2026

Изучаем Apache Kafka с нуля. Урок 20. kafka-streams-application-reset.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

kafka-streams-application-reset.sh: сброс state store, internal топиков и офсетов Kafka Streams. Пошагово, флаги, dry run, стратегии. Kafka 4.2, KRaft.

В уроке 19 мы разобрали kafka-consumer-groups.sh - утилиту для работы с группами консьюмеров: просмотр lag-а, сброс офсетов, удаление групп. Там же обсуждали, как Kafka хранит офсеты в топике __consumer_offsets. Сегодня идём дальше. kafka-streams-application-reset.sh - это специализированный инструмент для приложений на Kafka Streams. У стримингового приложения состояние устроено значительно сложнее,...

04Июн
2026

Изучаем Apache Kafka с нуля. Урок 19. kafka-consumer-groups.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как использовать kafka-consumer-groups.sh: список групп, lag, сброс офсетов, удаление. Стратегии --to-earliest, --to-datetime, --shift-by. Kafka 4.2, KRaft.

В уроке 18 мы разобрали kafka-delete-records.sh - смещали нижнюю границу лога, делая ненужные записи недоступными для консьюмеров. Там уже мелькало понятие consumer group offset: Kafka запоминает, до какого сообщения дочитала каждая группа, и именно это позволяет консьюмерам продолжать с нужного места. Сегодня разбираем утилиту, которая управляет этим механизмом напрямую....

02Июн
2026

Изучаем Apache Kafka с нуля. Урок 18. kafka-delete-records.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как удалить записи Kafka командой kafka-delete-records.sh: формат JSON, log start offset, GDPR-сценарии, ограничения и альтернативы. Kafka 4.2, KRaft

В уроке 17 мы разобрали kafka-dump-log.sh - читали бинарные лог-сегменты прямо с диска, смотрели содержимое батчей, проверяли офсеты и метаданные продюсеров. Это диагностический инструмент: он ничего не меняет, только показывает. Сегодня переходим к другой задаче. Иногда данные нужно не просмотреть, а удалить - конкретные сообщения в конкретных партициях. Причины...

31Май
2026

Изучаем Apache Kafka с нуля. Урок 17. kafka-dump-log.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

kafka-dump-log.sh читает .log-файлы сегментов прямо с диска, минуя брокер, и выводит содержимое в человекочитаемом виде

В уроке 16 мы использовали kafka-log-dirs.sh, чтобы узнать, сколько места занимают партиции и в каких директориях они лежат. Утилита работает через API брокера и возвращает агрегированные метаданные. Это удобно, но иногда нужно копнуть глубже - посмотреть прямо в файл и понять, что именно там лежит. kafka-dump-log.sh делает именно это....

29Май
2026

Изучаем Apache Kafka с нуля. Урок 16. kafka-log-dirs.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

Как понять сколько данных хранится в логах Apache Kafka - разбор бесплатного урока

В уроке 15 мы разобрали kafka-configs.sh - утилиту для управления динамическими конфигурациями топиков, брокеров и квот. Там мы меняли retention.ms, max.message.bytes и другие параметры без перезапуска кластера. Но одно дело выставить срок хранения, другое - понять, сколько места реально занимают данные прямо сейчас. Именно тут нужна kafka-log-dirs.sh. Она показывает,...

27Май
2026

Изучаем Apache Kafka с нуля. Урок 15. kafka-configs.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Курсы потоковой обработки, Статьи

Как управлять конфигурацией топиков, групп в Apache Kafka

В уроке 14 мы разобрали kafka-features.sh - утилиту для управления feature-флагами кластера и версией метаданных KRaft. Там же стало понятно, что Kafka хранит в метаданных не только версии функций, но и переопределённые конфигурации топиков и брокеров. Посмотреть эти конфигурации в режиме read-only можно через kafka-metadata-shell.sh из урока 13 -...

25Май
2026

Изучаем Apache Kafka с нуля. Урок 14. kafka-features.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В уроке 13 мы разбирались с kafka-metadata-shell.sh - интерактивным шеллом для чтения содержимого KRaft-метаданных. Если вы там заходили в директорию /features/ и видели там metadata.version с каким-то числом - это как раз то, чем управляет утилита сегодняшнего урока. kafka-features.sh отвечает за управление feature-флагами кластера. Звучит абстрактно, но на практике...

21Май
2026

Изучаем Apache Kafka с нуля. Урок 13. kafka-metadata-shell.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В уроке 12 мы разобрали kafka-metadata-quorum.sh - как смотреть состояние кворума KRaft, кто сейчас лидер контроллера и насколько отстают фолловеры. Это взгляд на кворум снаружи: числа, статусы, смещения. Но иногда нужно заглянуть внутрь - буквально открыть метаданные кластера и посмотреть, что там хранится. Для этого в Apache Kafka есть...

17Май
2026

Изучаем Apache Kafka с нуля. Урок 12. kafka-metadata-quorum.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В погоне за лидером- как работает quorum в Apache Kafka - Уроки учим бесплатно

В уроке 11 мы разобрали kafka-cluster.sh - как получить cluster ID от работающего брокера и как корректно вывести брокер из KRaft-кластера через команду unregister. После вывода брокера логично проверить, что кворум не пострадал и кластер продолжает работать нормально. Именно для этого существует утилита следующего урока. kafka-metadata-quorum.sh - инструмент для...

12Май
2026

Изучаем Apache Kafka с нуля. Урок 11. kafka-cluster.sh

Автор Nikolay Komissarenkoв категории Kafka, Бесплатные курсы "Школа Больших Данных", Бесплатный курс Apache Kafka, Блог, Курсы потоковой обработки, Статьи

В уроке 10 мы разобрали kafka-storage.sh - утилиту, которая работает с хранилищем метаданных напрямую через файловую систему. Она генерирует cluster ID, форматирует директорию и записывает meta.properties. Но всё это происходит в оффлайне - до старта брокера. Теперь представьте обратную ситуацию: кластер уже запущен и работает, и вам нужно узнать его...