Курсы Trino, ClickHouse, Airflow, Kafka, МL и ИИ Обучение

22Сен
2023

Как устроено сжатие сообщений в Apache Kafka

Автор Анна Вичуговав категории Kafka, Блог

сжатие и публикация сообщений в Kafka, обучение Apache Kafka, Apache Kafka для дата-инженеров и разработчиков, примеры сжатия сообщения Apache Kafka, курсы по Apache Kafka, Apache Kafka разработчик примеры курсы обучение, Школа Больших Данных Учебный центр Коммерсант

Зачем сжимать сообщения при их публикации в Apache Kafka, как устроен механизм сжатия и какие конфигурации задавать для его эффективного использования. Сжатие сообщений в Kafka: причины использования и принципы работы Единицей параллелизма в Apache Kafka является раздел топика, куда приложение-продюсер отправляет сообщение, чтобы его мог считать потребитель, назначенный на этот...

18Сен
2023

Event Streaming vs Event Sourcing: 2 паттерна проектирования EDA-архитектуры

Автор Анна Вичуговав категории Kafka, NoSql, Use Cases, Блог

Event Streaming vs Event Sourcing, паттерны проектирования EDA архитектуры, архитектура данных примеры курсы обучение, курсы Apache Kafka, курсы по Кафка, обучение Кафка, курсы Kafka Event Streaming Event Sourcing, курсы для архитекторов данных, обучение Big Data для разработчиков и архитекторов, Kafka Streams курсы, Apache Kafka для разработчиков и архитекторов обучение курсы, учебный центр Коммерсант Школа Больших Данных, курсы Big Data в Москве

В чем разница между потоковой передачей событий и источником событий и при чем здесь Apache Kafka: разбираемся с паттернами проектирования событийно-ориентированной архитектуры. 2 паттерна проектирования EDA-архитектуры Напомним, что сегодня для построения сложных систем, зачастую состоящих из множества взаимодействующих компонентов, и реактивно реагирующих на события внешнего мира, активно используется идея архитектуры,...

10Сен
2023

Swagger для асинхрона: составляем спецификацию AsyncAPI на примере Apache Kafka

Автор Анна Вичуговав категории Kafka, Блог

спецификация AsyncAPI Kafka для аналитиков и разработчиков примеры курсы обучение, Kafka EDA архитектура, Kafka для архитекторов и разработчиков, архитектура данных и приложений Big Data Kafka обучение примеры курсы, разработка Kafka-приложений, обучение Kafka, курсы Kafka, Apache Kafka для инженеров и разработчиков, обучение разработчиков Kafka и дата-инженеров, проектирование архитектуры приложений Kafka, Kafka EDA примеры курсы обучение, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Что такое AsyncAPI, зачем документировать спецификацию для EDA-архитектур и как это сделать. Создаем свою спецификацию для Apache Kafka с помощью веб-инструмента AsynсAPI Studio. Что такое AsyncAPI Подобно тому, как Swagger (OpenAPI ) стал стандартом де-факто для описания синхронного REST API, включая HTTP-методы запросов и ответы приложения на них со структурами...

26Авг
2023

Apache Kafka, BPMS и оркестрация процессов: versus или вместе

Автор Анна Вичуговав категории Kafka, Блог

BPMS Kafka примеры, Kafka для архитекторов и разработчиков, архитектура данных и приложений Big Data Kafka обучение примеры курсы BPMS, разработка Kafka-приложений, обучение Kafka, курсы Kafka, Apache Kafka для инженеров и разработчиков, обучение разработчиков Kafka и дата-инженеров, проектирование архитектуры приложений Kafka, Kafka EDA примеры курсы обучение, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Может ли Apache Kafka поддерживать не только хореографический стиль взаимодействия между разными сервисами, кто и как организует оркестрацию рабочих процессов с помощью этой распределенной платформой потоковой передачи и почему она не заменит BPM-движки. Оркестрация событий с Apache Kafka При использовании Apache Kafka в архитектуре, управляемой событиями (EDA, Event Driven Architecture),...

22Авг
2023

Квотирование в Apache Kafka

Автор Анна Вичуговав категории Kafka, Блог

Квотирование клиентских запросов в Kafka, продюсеры и потребители Kafka, Kafka управление ресурсами брокера, курсы Apache Kafka для дата-инженера разработчика и администратора кластера, Apache Kafka Примеры курсы обучение, Школа Больших Данных Учебный центр Коммерсант

Что такое квоты в Apache Kafka и как этот механизм позволяет управлять ресурсами брокера, предупреждая DDOS-атаки от слишком активных потребителей и продюсеров. Разбираемся с типами клиентских квот, их конфигурациями и принципами работы. Квоты клиента и пользователя в Apache Kafka Чтобы управлять ресурсами брокера, кластер Kafka может применять квоты на запросы...

13Авг
2023

Архитектура данных в TSDB-решениях для анализа временных рядов

Автор Анна Вичуговав категории NoSql, Блог

архитектура больших данных, TSDB Time Series DataBase базы данных временных рядов, NoSQL для анализа данных временных рядов, обучение Data Science примеры курсы обучение, NoSQL базы данных временных рядов анализ данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Чем базы данных временных рядов отличаются от реляционных и key-value хранилищ, какова модель данных для хранения метрик, значения которых меняются во времени, какие решения этой категории NoSQL-СУБД сегодня популярны на рынке и для чего они используются. Что такое база данных временных рядов и где она используется Как и следует из...

11Авг
2023

События в экосистеме Apache Kafka: проектирование EDA-архитектуры

Автор Анна Вичуговав категории Kafka, Блог

Kafka для архитекторов и разработчиков, архитектура данных и приложений Big Data Kafka обучение примеры курсы CQRS, разработка Kafka-приложений, обучение Kafka, курсы Kafka, Apache Kafka для инженеров и разработчиков, обучение разработчиков Kafka и дата-инженеров, проектирование архитектуры приложений Kafka, Kafka EDA примеры курсы обучение, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Будучи распределенной платформой передачи событий, Apache Kafka часто используется для построения архитектуры, управляемой событиями (EDA, Event Driven Architecture). Разбираемся, что такое событие и как его спроектировать, чтобы воплотить идеи EDA с Kafka. Проектирование событий для Apache Kafka В общем смысле событие – это свершившийся факт. В EDA-архитектуре события используются различными...

08Авг
2023

От ETL до EtLT: эволюция в архитектуре конвейеров обработки данных

Автор Анна Вичуговав категории Блог, Статьи

EtLT-конвейер, архитектура конвейера данных, архитектура данных примеры курсы обучение, Data Lake DWh LakeHouse примеры курсы обучение, обучение архитекторов Big Data, инженерия данных, обучение дата-инженеров, инженер данных курсы, Школа Больших Данных Учебный центр Коммерсант

Как развивалась архитектура конвейеров обработки данных, что такое EtLT и почему этот подход почему постепенно заменяет классические ETL и ELT-инструменты. Краткая история развития современной дата-инженерии. От ETL к ELT и обратно: предыстория Архитектура конвейеров обработки данных претерпела несколько итераций от ETL, ELT, XX ETL (Reverse ETL, Zero-ETL) до EtLT. Если экосистема...

07Авг
2023

Многоуровневое хранилище в Apache Kafka: разбираемся с KIP-405

Автор Анна Вичуговав категории Kafka, Блог

многоуровневое хранилище Kafka, Apache Kafka архитектура и принципы работы примеры курсы обучение, администрирование кластера Kafka примеры курсы обучение, обучение Kafka, курсы Apache Kafka, Kafka администратор кластера курсы, Apache Kafka для дата-инженеров, Apache Kafka хранение данных, Apache Kafka для администраторов и инженеров данных, Школа Больших Данных Учебный центр Коммерсант

Что представляет собой очередное предложение по улучшению проекта Apache Kafka, которое расширяет возможности этой распределенной платформы потоковой передачи событий, превращая ее в средство долговременного хранения данных. Надежность vs скорость: вечный компромисс в Apache Kafka Изначально Apache Kafka позиционировалась как middleware, т.е. сервисный слой для асинхронной интеграции нескольких информационных систем. Этот...

05Авг
2023

ИИ и векторные базы данных: как это работает?

Автор Анна Вичуговав категории Machine Learning, NoSql, Блог

архитектура больших данных, ИИ и векторные СУБД, метод ближайших соседей машинное обучение, knn machine learning nosql, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Как устроены векторные базы данных и почему они стали так популярны с распространением ИИ. Архитектура, алгоритмы, принципы работы и примеры векторных СУБД. Что такое векторная СУБД и при чем здесь ИИ Как и следует из названия, векторная база хранит данные в виде векторов. Это понятие из математики означает специализированное представление...

04Авг
2023

Управление кластерами и коннекторами Apache Kafka в Arenadata Streaming с ADSCC

Автор Анна Вичуговав категории Kafka, Блог

курсы Аренадата, обучение Аренадата, курсы Arenadata Streaming Kafka NiFi, обучение Arenadata Streaming Kafka NiFi, обучение инженеров Big Data, курсы для разработчиков Data Flow, Apache Kafka и NiFi курсы, Apache Kafka и NiFi обучение, курсы по большим данным, Apache Kafka и NiFi совместное использование, обучение Big Data, Школа Больших Данных, учебный центр Коммерсант Москва

В январе 2023 года компания Arenadata, российский разработчик отечественных Big Data решений, выпустила средство мониторинга и управления коннекторами Apache Kafka для своего продукта Arenadata Streaming (ADS). Знакомимся с возможностями и ограничениями ADSCC. Arenadata Streaming Command Center для управления коннекторами Kafka Одной из главных фишек продуктов Arenadata, является ADCM (Arenadata Cluster...

23Июл
2023

Мультимодельные базы данных: мифы и реальность на примере 3-х СУБД

Автор Анна Вичуговав категории NoSql, Блог

архитектура больших данных хранилища базы СУБД, NoSQL мультимодельные базы данных примеры, курсы обучение, архитектура данных, графы примеры курсы обучение, обработка графов и документов в Greenplum и PostgreSQL, обучение Greenplum Arenadata DB курсы, Greenplum для инженеров данных и и разработчиков, хранение и аналитика больших данных с Greenplum, Школа Больших Данных Учебный центр Коммерсант

Как устроены по-настоящему мультимодельные базы данных, чем они отличаются от реляционных и NoSQL-СУБД, а также какова истинная природа универсального подхода к хранению и оперированию данными. Разбираемся на примере ArangoDB, OrientDB и Cosmos DB. Что такое мультимодельная СУБД и зачем она нужна Любая технология предназначена, прежде всего, для решения конкретных проблем,...

18Июл
2023

6 уязвимостей Apache Kafka за последние 2 года

Автор Анна Вичуговав категории Kafka, Блог

Apache Kafka для разработчиков и администраторов, Apache Kafka уязвимости проблемы информационой безопасности, Apache Kafka примеры курсы обучение, обучение большим данным, курсы Big Data, Школа Больших Данных Учебный Центр Коммерсант

Как кодек сжатия snappy может вызвать ошибку нехватки памяти на брокерах, что может нарушить пользовательская JAAS-конфигурация клиента с протоколом безопасности на основе SASL и еще 4 уязвимости Apache Kafka в 2023 и 2022 гг. Уязвимости Apache Kafka 2023 года В 2023 году обнаружена уязвимость CVE-2023-34455, связанная с тем, что клиенты,...

11Июл
2023

Apache Kafka 3.5.0: обзор июньского релиза

Автор Анна Вичуговав категории Kafka, Блог

Apache Kafka для разработчиков и администраторов, Apache Kafka 3.5.0 обзор релиза, Apache Kafka примеры курсы обучение, обучение большим данным, курсы Big Data, Школа Больших Данных Учебный Центр Коммерсант

15 июня 2023 года опубликован очередной выпуск самой популярной распределенной платформы потоковой передачи событий. Разбираемся с новинками Apache Kafka 3.5.0, особенно важными для разработчиков, дата-инженеров и администраторов кластера. Обновления брокеров, контроллеров, продюсеров и потребителей Релиз Apache Kafka 3.5.0 богат на новинки: в нем 50 улучшений и почти 80 исправленных ошибок....

04Июл
2023

Apache CarbonData: еще один колоночный формат для больших данных

Автор Анна Вичуговав категории Блог, Статьи

архитектура больших данных форматы Big Data, CarbonData курсы обучение разработчиков Apache Spark, CarbonData анализ данных с Apache Spark, обучение большим данным, курсы Big Data для разработчиков, CarbonData Spark, Школа Больших Данных Учебный центр Коммерсант

Формат данных в озере или гибридном хранилище типа Data LakeHouse сильно влияет на скорость выполнения аналитических запросов. Сегодня рассмотрим, как Apache CarbonData делает аналитику больших данных в реальном времени еще быстрее. Что такое Apache CarbonData Традиционные форматы данных, часто используемые в проектах Big Data, такие как CSV и AVRO, имеют...

02Июл
2023

Обработка ошибок в потребителе Kafka с try-except: пример

Автор Анна Вичуговав категории Kafka, Блог

потребитель Kafka обработка исключений примеры курсы обучение, DLQ Kafka, очередь недоставленных сообщений в Kafka примеры курсы обучение, курсы по Apache Kafka, Kafka для разработчиков, обучение Kafka, Apache Kafka Dead Letter Queue, обучение большим данным, курсы Big Data, Школа Больших Данных Учебный Центр Коммерсант

Самый простой способ организовать обработку и логирование ошибок в приложении-потребителе, чтобы продолжать считывание из Apache Kafka, даже если продюсер изменил структуру полезной нагрузки сообщения. Публикация данных в Kafka Напомним, Apache Kafka, в отличие от RabbitMQ, не позволяет организовать очередь недоставленных сообщений (DLQ, Dead Letter Queue) средствами самой платформы, о чем мы...

26Июн
2023

Архитектура данных для реализации паттерна Event Sourcing

Автор Анна Вичуговав категории NoSql, Блог

архитектура данных, курсы Big Data архитектор примеры обучение, Apache HBase Kafka PostgreSQL Greenplum MongoDB Event Sourcing, Event Sourcing паттерн примеры курсы обучение хранилища данных, хранилища данных в микросервисной архитектуре, CQRS Event Sourcing, NoSQL курсы примеры обучение, Школа Больших Данных Учебный центр Коммерсант

Что представляет собой паттерн проектирования микросервисов под названием источник событий (Event Sourcing) и как его реализовать в реляционных базах данных и NoSQL-системах. Разбираемся с архитектурой данных и архитектурой ПО на практических примерах. Архитектурный шаблон Event Sourcing Многие архитектурные шаблоны рассматривают сущности (entity) как основную концепцию, описывая способы их сохранения и...

24Июн
2023

Как будет реализован KIP-932 для общих групп потребителей в Apache Kafka

Автор Анна Вичуговав категории Kafka, Блог

KIP-932, группы потребителей и группы общего доступа Kafka, потребитель Kafka, дата-инженер разработчик Apache Kafka примеры курсы обучение, обучение Apache Kafka, курсы Apache Kafka, Apache Kafka потребление сообщений курсы примеры обучение, потоковая и пакетная обработка данных примеры, обучение большим данным, Apache Kafka для дата-инженеров, Школа Больших Данных Учебный Центр Коммерсант

Недавно мы писали про группы общего доступа в Apache Kafka, которые планируется реализовать в KIP-932. Сегодня рассмотрим, как именно это предполагается сделать. Принципы работы группы общего доступа Предложение по улучшению Kafka (KIP, Kafka Improvement Proposal) предполагает внесение значительных изменений. Все начинается с публикации предложения, которое рассматривается сообществом, комментируется и пересматривается до...

20Июн
2023

Как построить надежную архитектуру конвейера обработки данных: обработка исключений

Автор Анна Вичуговав категории Блог, Статьи

конвейер обработки данных управление оркестрация примеры курсы обучение, курсы DataOps, архитектура данных, инженер данных архитектор Big Data примеры курсы обучение, ETL конвейер примеры курсы обучение, инженерия Big Data, Data Lake Delta Lake ETL примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Сегодня поговорим о том, как обработка исключений позволяет спроектировать и реализовать надежную архитектуру конвейера обработки данных, включая ETL/ELT-процессы и их компоненты. Архитектура конвейеров обработки данных: ETL/ELT-процессы Наличие хорошо спроектированной инфраструктуры данных необходимо для получения максимальной отдачи от данных для data-driven управления. Поскольку данные постоянно увеличиваются в объеме, следует организовать управление...

18Июн
2023

Очереди и группы общего доступа для потребителей Apache Kafka: разбираемся с KIP-932

Автор Анна Вичуговав категории Kafka, Блог

Что такое группы общего доступа для потребителей, чем это отличается от существующей концепции группы потребителей, почему в Apache Kafka появляются очереди и чем это улучшит потоковую обработку событий. Что такое KIP-932: группы общего доступа потребления данных из Apache Kafka Напомним, группы потребителей в Kafka предназначены для повышения надежности упорядоченной доставки...