Видеоматериалы Школы Больших Данных

Бесплатные учебные курсы

Python_logo_icon

Бесплатный курс по основам программирования на Python

Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» — это практический видеокурс «Школы Больших Данных» по проекту Python School. Он разработан специально для начинающих аналитиков, дата-инженеров и ИТ-специалистов , которые хотят освоить азы разработки на Python и получить практические навыки использования специализированных библиотек для работы с большими данными. Курс включает обзор популярных методов машинного обучения (Machine Learning) и других разделов Data Science, в т.ч. подготовку данных к анализу и их аналитическую обработку. Программа курса и расписание занятий здесь.

Бесплатный курс по Основам Программирования на Python
27 Видео
hadoop_logo_icon

Бесплатный курс по Основам Hadoop

В серии данных видео вы познакомитесь с компонентами экосистемы Hadoop на примере дистрибутива Arenadata Hadoop 1.6.1.

Data Science

MPP подход. Прогнозирование рисков

В этом видео мы обсудим современный подход к мониторингу моделей машинного обучения — Model Performance Predictor (MPP). Мы рассмотрим, как MPP позволяет предсказывать ошибки модели до их фактического появления, и почему этот метод эффективен для финансовых организаций, где качество прогнозов критически важно. Поговорим о преимуществах MPP по сравнению с классическими подходами.

Мониторинг моделей

Мониторинг моделей машинного обучения в продакшене — ключевой этап, позволяющий обеспечить их стабильную и эффективную работу. В этом видео обсудим, зачем нужен мониторинг ML-моделей, какие метрики следует отслеживать и какие инструменты помогут автоматизировать процесс. Рассмотрим понятия дрейфа данных , а также лучшие практики и популярные решения, такие как MLflow, Prometheus с Grafana, Evidently AI и Seldon Core. Видео поможет вам лучше понять, как контролировать и поддерживать производительность моделей на всех этапах их жизненного цикла

Mage.ai

Mage.ai — современный инструмент для работы с данными, создания и автоматизации пайплайнов, а также тренировки моделей машинного обучения. Вы узнаете о его ключевых преимуществах, возможностях обработки данных, о том, как автоматизировать выполнение задач. Мы также рассмотрим практические примеры создания пайплайнов.

Kafka в ML-задачах

Apache Kafka в задачах машинного обучения — это серия видео про использование платформы потоковой передачи событий в ML-системах. Как организовать обучение ML-модели в реальном времени, используя Event-Driven парадигму. Разбираем на примере создания и развертывания полноценного веб-приложения.

Интерпретация ML-моделей

Чтобы повысить эффективность применения технологий машинного обучения, их результаты должны быть объяснимыми и понятными. Для этого выполняется интерпретация работы ML-моделей с помощью специальных библиотек и фреймворков.

streamlit_logo_icon

StreamLit

Streamlit — это легковесная Python-библиотека, которая позволяет развернуть ML-модели в веб-приложениях с наглядными визуальными графиками, диаграммами, а также создать интерактивные дэшборды.

Python_logo_icon

Инструменты для визуализации данных на python

Инженерия данных

apache_nifi_logo_icon

Серия видео про Apache NiFi

Apache NiFi — это популярный ETL/ELT-фреймворк с открытым исходным кодом для экосистемы Hadoop. Он поддерживает парадигму Low Code благодаря наглядному GUI и широкому набору предустановленных обработчиков (процессоров), а также интеграции со множеством систем хранения и обработки данных. Впрочем, дата-инженер может разработать собственные процессоры для сложных вычислительных операций.

apacheAirflow_logo_icon

Серия видео по Apache Airflow

Apache AirFlow — это широко распространенный фреймворк оркестрации пакетных процессов. Он позволяет дата-инженеру проектировать сложные ETL/ELT-конвейеры в виде направленных ациклических графов (DAG), состоящих из задач, выполняемых операторами — функциями на Python. Фреймворк имеет наглядный GUI для запуска DAG, мониторинга статуса задач и обрабатываемых данных. Сегодня AirFlow является одним из важнейших инструментов дата-инженера.

Записаться на курс

Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам?
Оставьте номер телефона или e-mail и мы оперативно проконсультируем вас в течение рабочего дня.
ОСТАВЬТЕ СООБЩЕНИЕ, И МЫ ПЕРЕЗВОНИМ ВАМ
В ТЕЧЕНИЕ РАБОЧЕГО ДНЯ
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту