Главная » Видео
Видеоматериалы Школы Больших Данных
Бесплатные учебные курсы

Бесплатный курс по основам программирования на Python
Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» — это практический видеокурс «Школы Больших Данных» по проекту Python School. Он разработан специально для начинающих аналитиков, дата-инженеров и ИТ-специалистов , которые хотят освоить азы разработки на Python и получить практические навыки использования специализированных библиотек для работы с большими данными. Курс включает обзор популярных методов машинного обучения (Machine Learning) и других разделов Data Science, в т.ч. подготовку данных к анализу и их аналитическую обработку. Программа курса и расписание занятий здесь.

10:55

11:16

9:14

32:41

18:27

19:09

16:43

9:20

8:54

19:10

26:28

21:53

17:31

33:43

12:57

21:46

31:53

27:51
22:53
37:23
27:00

28:02

31:11

11:45
6:48
5:33
23:29

09:31

16:13

09:32

07:32

10:29

09:42

09:32

09:40

11:36
Бесплатный курс по Fast API
8:52
11:43
11:45
8:44
12:23
9:35
8:42
3:16
12:28
8:07
15:44
16:54

Бесплатный курс по Основам Hadoop
В серии данных видео вы познакомитесь с компонентами экосистемы Hadoop на примере дистрибутива Arenadata Hadoop 1.6.1.
14:01
12:18
5:46
8:48
8:22
10:39
34:07
17:40
16:05
Data Science и машинное обучение
AI агенты
Обработка данных
Мы начинаем новую серию, посвящённую анализу данных с использованием Pandas 2.0 и Polars. Вы узнаете, что такое Pandas, почему это одна из самых популярных библиотек для работы с данными, и какие важные изменения появились в новой версии Pandas 2.0. Также мы подробно рассмотрим Polars — библиотеку, которая предлагает более высокую производительность благодаря использованию ленивых вычислений и многопоточной обработки данных.
08:56
10:44
12:35
Временные ряды
Познакомимся с основными концепциями, необходимыми для работы с временными рядами. Мы рассмотрели, что такое стационарность и почему важно проверять ее для корректного анализа данных. Вы узнали, как визуально и с помощью статистических тестов проверять временные ряды на стационарность. Также мы обсудили методы приведения временных рядов к стационарному состоянию. Эти знания помогут вам подготовить данные для дальнейшего прогнозирования.
10:17
16:32
13:15
12:24
MPP подход. Прогнозирование рисков
В этом видео мы обсудим современный подход к мониторингу моделей машинного обучения — Model Performance Predictor (MPP). Мы рассмотрим, как MPP позволяет предсказывать ошибки модели до их фактического появления, и почему этот метод эффективен для финансовых организаций, где качество прогнозов критически важно. Поговорим о преимуществах MPP по сравнению с классическими подходами.
Мониторинг моделей
Мониторинг моделей машинного обучения в продакшене — ключевой этап, позволяющий обеспечить их стабильную и эффективную работу. В этом видео обсудим, зачем нужен мониторинг ML-моделей, какие метрики следует отслеживать и какие инструменты помогут автоматизировать процесс. Рассмотрим понятия дрейфа данных , а также лучшие практики и популярные решения, такие как MLflow, Prometheus с Grafana, Evidently AI и Seldon Core. Видео поможет вам лучше понять, как контролировать и поддерживать производительность моделей на всех этапах их жизненного цикла
Mage.ai
Mage.ai — современный инструмент для работы с данными, создания и автоматизации пайплайнов, а также тренировки моделей машинного обучения. Вы узнаете о его ключевых преимуществах, возможностях обработки данных, о том, как автоматизировать выполнение задач. Мы также рассмотрим практические примеры создания пайплайнов.
Kafka в ML-задачах
Apache Kafka в задачах машинного обучения — это серия видео про использование платформы потоковой передачи событий в ML-системах. Как организовать обучение ML-модели в реальном времени, используя Event-Driven парадигму. Разбираем на примере создания и развертывания полноценного веб-приложения.
13:49
12:51
7:55
8:47
Интерпретация ML-моделей
Чтобы повысить эффективность применения технологий машинного обучения, их результаты должны быть объяснимыми и понятными. Для этого выполняется интерпретация работы ML-моделей с помощью специальных библиотек и фреймворков.
10:37
9:37
Интеграция моделей машинного обучения
11:37
11:28
11:38

StreamLit
Streamlit — это легковесная Python-библиотека, которая позволяет развернуть ML-модели в веб-приложениях с наглядными визуальными графиками, диаграммами, а также создать интерактивные дэшборды.
9:44
6:58
7:56
6:10
Рекомендательные системы
15:27
11:09
9:49

Инструменты для визуализации данных на python
11:36
11:47
10:23
12:07
11:32
8:45
9:56
MLflow
11:38
12:45
13:27
Графовые алгоритмы
3:56
6:59
5:09
Natural Language Processing
18:19
17:44
16:49
Геопространственные данные
16:55
12:26
12:20
22:45
17:12
23:51
19:35
Computer vision
В серии данных видео вы познакомитесь с Nvidia Jetson Nano
14:06
11:03
19:04
12:19
Инженерия данных

Серия видео про Apache NiFi
Apache NiFi — это популярный ETL/ELT-фреймворк с открытым исходным кодом для экосистемы Hadoop. Он поддерживает парадигму Low Code благодаря наглядному GUI и широкому набору предустановленных обработчиков (процессоров), а также интеграции со множеством систем хранения и обработки данных. Впрочем, дата-инженер может разработать собственные процессоры для сложных вычислительных операций.

16:12

15:25

13:06

Серия видео по Apache Airflow
Apache AirFlow — это широко распространенный фреймворк оркестрации пакетных процессов. Он позволяет дата-инженеру проектировать сложные ETL/ELT-конвейеры в виде направленных ациклических графов (DAG), состоящих из задач, выполняемых операторами — функциями на Python. Фреймворк имеет наглядный GUI для запуска DAG, мониторинга статуса задач и обрабатываемых данных. Сегодня AirFlow является одним из важнейших инструментов дата-инженера.
31:50
10:55
11:26
16:56
23:30
17:59
17:55
17:55
Другое
Введение в ChatGPT. История и архитектура сети
В данном видео разобраны предпосылки появления ChatGPT, краткая история компании OpenAI. Так как ChatGPT является «трансформером», рассматривается более подробно эта архитектура нейронных сетей. После чего приводится описание и история создания версий моделей GPT от 1 до 4.
NLP с Nvidia Jetson Nano
В серии данных видео вы познакомитесь с Nvidia Jetson Nano