Курсы Trino, ClickHouse, Airflow, Kafka, Машинное обучение и Искусственный Интеллект курсы

18Сен
2025

Data Storage and Operations. Как эффективно хранить и обслуживать петабайты данных

Автор Nikolay Komissarenkoв категории Статьи

Введение: Данные как океан. Где его хранить и как им управлять? Раньше, лет 15-20 назад, корпоративные данные были похожи на большое, но вполне обозримое озеро. Его можно было разместить в собственном "бассейне" — локальном дата-центре, и спокойно им управлять. Сегодня ситуация изменилась кардинально. Данные превратились в бескрайний, бушующий океан....

09Сен
2025

Data Modeling and Design. От концепции к физической реализации в Big Data

Автор Nikolay Komissarenkoв категории Data Governance, Архитектура данных, Статьи

Традиционный спор Инмона и Кимбаларавнение подходов Инмона и Кимбалла (схема "звезда")

Модель данных — язык, на котором бизнес говорит с технологиями Есть старая айтишная мудрость: "Написать код легко. Гораздо сложнее написать правильный код для правильной модели данных". И это абсолютная правда. Любую ошибку в коде можно исправить относительно безболезненно. А вот ошибка, заложенная в саму структуру данных, в модель, обходится...

07Сен
2025

Data Architecture. Проектирование фундамента для вашего озера данных

Автор Nikolay Komissarenkoв категории Data Governance, Архитектура данных, Статьи

Архитектура данных— невидимый фундамент вашего бизнеса Представьте, что вы решили построить небоскреб. С чего вы начнете? Вряд ли с выбора панорамных окон и покупки дорогой итальянской мебели для пентхауса. Любой здравомыслящий человек начинает с фундамента. С прочного, продуманного, железобетонного основания, способного выдержать вес сотен этажей, порывы ветра и даже...

04Сен
2025

Data Governance. Как построить систему руководства и контроля данными, которая работает

Автор Nikolay Komissarenkoв категории Data Governance, Статьи

Роль Data Governanceв стратегии управления данными компании

Data Governance — не «Большой Брат», а правила дорожного движения Представьте себе оживленный мегаполис в час пик. Тысячи машин (данные) несутся по сложной сети дорог (IT-системы), управляемые разными водителями (сотрудники). А теперь вообразите, что в этом городе внезапно отключили все светофоры, убрали разметку, дорожные знаки и посты ДПС. Что...

01Сен
2025

Почему DAMA-DMBOK — это фундамент для любого специалиста по данным в эпоху Big Data?

Автор Nikolay Komissarenkoв категории Data Governance, Статьи

Data Governance - DAMA DMBok - курсы по архитектуре данных в Школе Больших Данных

Введение: Управление хаосом. Как выжить и преуспеть в цифровую эпоху Представьте, что данные в вашей компании — это ее центральная нервная система. Когда она работает слаженно, сигналы проходят мгновенно, решения принимаются быстро и точно, а весь организм — бизнес — становится гибким, умным и адаптивным. Он чувствует изменения на рынке...

25Авг
2025

Оконные функции (Windowing) во Flink: анализ данных за временные интервалы

Автор Nikolay Komissarenkoв категории Flink, Статьи

В современном мире объём данных, генерируемых в реальном времени, растёт экспоненциально. По прогнозам, к 2025 году рынок аналитики real-time данных достигнет $38.6 миллиардов, что подчёркивает критическую важность их мгновенной обработки. В таких условиях традиционные batch-системы уступают место фреймворкам потоковой обработки, среди которых Apache Flink занимает лидирующие позиции благодаря своей производительности,...

12Авг
2025

Model Context Protocol

Автор Nikolay Komissarenkoв категории Статьи

Module context protocol - https://bigdataschool.ru

Model Context Protocol (MCP) — это открытый стандарт, разработанный для унификации взаимодействия между моделями искусственного интеллекта, особенно большими языковыми моделями (LLM), и внешними инструментами. До появления MCP интеграция ИИ с внешними API была сложной. Разработчикам приходилось писать уникальный код для каждого нового инструмента. Это замедляло разработку и создавало зависимость от...

29Июл
2025

GPT-5 на горизонте: Августовский релиз изменит правила игры в мире искусственного интеллекта

Автор Nikolay Komissarenkoв категории AI, искусственный Интеллект, Статьи

Сан-Франциско, 29 июля 2025 г. — Технологический мир замер в ожидании самого масштабного обновления в области искусственного интеллекта за последние годы. По данным авторитетных изданий, включая The Verge и Reuters, компания OpenAI готовится выпустить свою следующую флагманскую модель, GPT-5, уже в первой половине августа этого года. Инсайдерская информация и...

11Июл
2025

Изучение ClickHouse: Итоги курса и следующие шаги в мире больших данных. Урок 10.

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Изучение ClickHouse - бесплатный курс ClickHouse от https://bigdataschool.ru

Поздравляем! Если вы читаете эти строки, значит, вы прошли полный путь от первого изучения ClickHouse до понимания его самых глубоких механизмов. За эти десять статей мы превратились из новичков, задающихся вопросом "Что такое колоночная СУБД?", в уверенных пользователей, способных не только писать сложные аналитические запросы, но и проектировать, оптимизировать и...

07Июл
2025

Гарантии доставки сообщений At-Most-Once и At-Least-Once

Автор Nikolay Komissarenkoв категории Kafka, Use Cases, Блог, Статьи

At most once delivery - гарантии доставки сообщений курсы от Школы Больших данных

В мире распределенных систем, гарантии доставки сообщений, при передаче данных между сервисами — это фундаментальная задача. Но что происходит, когда мы отправляем сообщение из точки А в точку Б через сеть, которая по своей природе ненадежна? Сетевые задержки, сбои серверов, перезапуски приложений — все это может привести к потере или...

07Июл
2025

Администрирование и мониторинг ClickHouse: от системных таблиц до бэкапов. Урок 9

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Администрирование и мониторинг ClickHouse: от системных таблиц до бэкапов - бесплатный курс ClickHouse от https://bigdataschool.ru

Мы с вами научились виртуозно писать запросы, строить сложные аналитические отчеты и интегрировать ClickHouse с другими системами. Но чтобы вся эта мощь работала стабильно и предсказуемо в production, кластер требует внимания и ухода. Написание запросов — это работа аналитика или разработчика, а поддержание здоровья системы — это задача администратора баз...

05Июл
2025

Аналитические суперсилы ClickHouse: Оконные функции и работа с массивами. Урок 8

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Оконные функции и работа с массивами в ClickHouse - бесплатный курс ClickHouse от https://bigdataschool.ru

Оконные функции ClickHouse и работа с массивами данных. Мы с вами уже прошли большой путь: научились эффективно хранить данные, оптимизировать таблицы, выполнять базовые и сложные запросы и даже интегрироваться с внешними системами. Казалось бы, мы можем практически всё. Но как ответить на такие вопросы: "Каково время между последовательными действиями каждого...

03Июл
2025

Интеграции ClickHouse: работа с MySQL, S3, Kafka и внешними словарями. Урок 7

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Интеграция ClickHouse с внешними системами и словарями - бесплатный курс ClickHouse от https://bigdataschool.ru

До сих пор мы рассматривали ClickHouse как самостоятельную систему: создавали в нем таблицы и загружали данные. Однако в реальном мире данные редко живут в одном месте. Транзакционная информация находится в реляционных базах вроде MySQL или PostgreSQL, архивы логов — в объектных хранилищах типа Amazon S3, а потоки событий в реальном...

01Июл
2025

Оптимизация запросов в ClickHouse: индексы, EXPLAIN и лучшие практики. Урок 6

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP

Оптимизация запросов в ClickHouse: индексы, EXPLAIN и лучшие практики - - бесплатный курс ClickHouse от https://bigdataschool.ru

Итак, вы освоили типы данных, создали таблицы на правильных движках MergeTreeи даже научились писать сложные запросы. Кажется, что вы готовы к работе с реальными данными. Однако на больших объемах вы можете столкнуться с ситуацией, когда даже на мощном "железе" запрос выполняется не так быстро, как хотелось бы. В чем же...

29Июн
2025

Глубокое погружение в движки MergeTree: Replacing, Summing, Aggregating и Collapsing. Урок 5

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP

DeepDive в движки семейства MergeTree в бесплатном курсе https://bigdataschool.ru

В предыдущих статьях мы узнали, что семейство движков MergeTree — это основа для хранения аналитических данных в ClickHouse. Мы создавали таблицы с помощью базового MergeTree и даже упоминали о его специализированных версиях. Теперь пришло время для глубокого погружения. Эти движки — не просто вариации, а мощные инструменты, которые выполняют часть...

27Июн
2025

Продвинутые функции SQL в ClickHouse: обработка строк, дат и условная логика. Урок 4

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP

Функции в ClickHouse - курс по основам ClickHouse от https://bigdataschool.ru

Добро пожаловать в четвертую статью нашего курса по ClickHouse! В прошлый раз мы научились основам: вставлять, выбирать и агрегировать данные. Теперь, когда вы можете получать базовую статистику, пришло время углубить свои навыки и научиться "разговаривать" с данными на более сложном языке. Сегодня мы изучим мощные инструменты, которые позволят вам преобразовывать,...

25Июн
2025

Основы работы с данными в ClickHouse: вставка, выборка и первые аналитические запросы. Урок 3.

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Аналитические запросы в ClickHouse - https://bigdataschool.ru

Приветствуем вас в третьей части нашего гида по ClickHouse! В предыдущих статьях мы заложили прочный фундамент: разобрались, что такое ClickHouse (далее CH), почему он так хорош для аналитики, а также глубоко погрузились в типы данных и движки таблиц, научившись создавать оптимизированные таблицы. Теперь пришло время перейти от теории к самой...

24Июн
2025

Apache Hadoop в 2025: от фундамента Big Data до интеграции с S3, Ozone и облачными платформами

Автор Nikolay Komissarenkoв категории Статьи

В начале своего пути Apache Hadoop был настоящей революцией. Он предложил решение для обработки данных таких объемов, которые ранее считались невозможными, используя кластеры из обычного оборудования. Философия "перемещай вычисления к данным, а не данные к вычислениям" легла в основу мира Big Data. Но технологии не стоят на месте. Облачные платформы,...

23Июн
2025

Типы данных и движки в ClickHouse: Фундамент для производительности. Урок 2

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

Типы данных и движки таблиц в ClickHouse - https://bigdataschool.ru

Приветствуем вас во второй части нашего курса по основам ClickHouse (далее CH)! В первой статье мы разобрались, что такое ClickHouse, почему он так хорош для аналитики и как запустить его локально или в облаке. Теперь пришло время углубиться в две ключевые концепции, которые определяют, как CH хранит и обрабатывает ваши...

21Июн
2025

Что такое ClickHouse: Полный гид по колоночной СУБД для сверхбыстрой аналитики. Урок 1.

Автор Nikolay Komissarenkoв категории ClickHouse, OLAP, Статьи

бесплатный курс по основам ClickHouse - Типы данных и движки таблиц

Если ваша работа связана с данными, вы наверняка слышали название ClickHouse. Это не просто очередная база данных, а мощный инструмент, который стремительно меняет подходы к аналитике в IT-компаниях по всему миру. В этой статье мы подробно разберемся, что же такое ClickHouse, почему он феноменально быстр в аналитических задачах и, самое...