Главная » Видео
Видеоматериалы Школы Больших Данных
Бесплатные учебные курсы
Бесплатный курс по основам программирования на Python
Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» — это практический видеокурс «Школы Больших Данных» по проекту Python School. Он разработан специально для начинающих аналитиков, дата-инженеров и ИТ-специалистов , которые хотят освоить азы разработки на Python и получить практические навыки использования специализированных библиотек для работы с большими данными. Курс включает обзор популярных методов машинного обучения (Machine Learning) и других разделов Data Science, в т.ч. подготовку данных к анализу и их аналитическую обработку. Программа курса и расписание занятий здесь.
Бесплатный курс по Fast API
Бесплатный курс по Основам Hadoop
В серии данных видео вы познакомитесь с компонентами экосистемы Hadoop на примере дистрибутива Arenadata Hadoop 1.6.1.
Data Science
Временные ряды
В этом видео мы познакомились с основными концепциями, необходимыми для работы с временными рядами. Мы рассмотрели, что такое стационарность и почему важно проверять ее для корректного анализа данных. Вы узнали, как визуально и с помощью статистических тестов проверять временные ряды на стационарность. Также мы обсудили методы приведения временных рядов к стационарному состоянию. Эти знания помогут вам подготовить данные для дальнейшего прогнозирования.
MPP подход. Прогнозирование рисков
В этом видео мы обсудим современный подход к мониторингу моделей машинного обучения — Model Performance Predictor (MPP). Мы рассмотрим, как MPP позволяет предсказывать ошибки модели до их фактического появления, и почему этот метод эффективен для финансовых организаций, где качество прогнозов критически важно. Поговорим о преимуществах MPP по сравнению с классическими подходами.
Мониторинг моделей
Мониторинг моделей машинного обучения в продакшене — ключевой этап, позволяющий обеспечить их стабильную и эффективную работу. В этом видео обсудим, зачем нужен мониторинг ML-моделей, какие метрики следует отслеживать и какие инструменты помогут автоматизировать процесс. Рассмотрим понятия дрейфа данных , а также лучшие практики и популярные решения, такие как MLflow, Prometheus с Grafana, Evidently AI и Seldon Core. Видео поможет вам лучше понять, как контролировать и поддерживать производительность моделей на всех этапах их жизненного цикла
Mage.ai
Mage.ai — современный инструмент для работы с данными, создания и автоматизации пайплайнов, а также тренировки моделей машинного обучения. Вы узнаете о его ключевых преимуществах, возможностях обработки данных, о том, как автоматизировать выполнение задач. Мы также рассмотрим практические примеры создания пайплайнов.
Kafka в ML-задачах
Apache Kafka в задачах машинного обучения — это серия видео про использование платформы потоковой передачи событий в ML-системах. Как организовать обучение ML-модели в реальном времени, используя Event-Driven парадигму. Разбираем на примере создания и развертывания полноценного веб-приложения.
Интерпретация ML-моделей
Чтобы повысить эффективность применения технологий машинного обучения, их результаты должны быть объяснимыми и понятными. Для этого выполняется интерпретация работы ML-моделей с помощью специальных библиотек и фреймворков.
Интеграция моделей машинного обучения
StreamLit
Streamlit — это легковесная Python-библиотека, которая позволяет развернуть ML-модели в веб-приложениях с наглядными визуальными графиками, диаграммами, а также создать интерактивные дэшборды.
Рекомендательные системы
Инструменты для визуализации данных на python
MLflow
Графовые алгоритмы
Natural Language Processing
Геопространственные данные
Computer vision
В серии данных видео вы познакомитесь с Nvidia Jetson Nano
Инженерия данных
Серия видео про Apache NiFi
Apache NiFi — это популярный ETL/ELT-фреймворк с открытым исходным кодом для экосистемы Hadoop. Он поддерживает парадигму Low Code благодаря наглядному GUI и широкому набору предустановленных обработчиков (процессоров), а также интеграции со множеством систем хранения и обработки данных. Впрочем, дата-инженер может разработать собственные процессоры для сложных вычислительных операций.
Серия видео по Apache Airflow
Apache AirFlow — это широко распространенный фреймворк оркестрации пакетных процессов. Он позволяет дата-инженеру проектировать сложные ETL/ELT-конвейеры в виде направленных ациклических графов (DAG), состоящих из задач, выполняемых операторами — функциями на Python. Фреймворк имеет наглядный GUI для запуска DAG, мониторинга статуса задач и обрабатываемых данных. Сегодня AirFlow является одним из важнейших инструментов дата-инженера.
Другое
NLP с Nvidia Jetson Nano
В серии данных видео вы познакомитесь с Nvidia Jetson Nano