Видеоматериалы Школы Больших Данных

Бесплатные учебные курсы

Python_logo_icon

Бесплатный курс по основам программирования на Python

Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» — это практический видеокурс «Школы Больших Данных» по проекту Python School. Он разработан специально для начинающих аналитиков, дата-инженеров и ИТ-специалистов , которые хотят освоить азы разработки на Python и получить практические навыки использования специализированных библиотек для работы с большими данными. Курс включает обзор популярных методов машинного обучения (Machine Learning) и других разделов Data Science, в т.ч. подготовку данных к анализу и их аналитическую обработку. Программа курса и расписание занятий здесь.

Бесплатный курс по Основам Программирования на Python
27 Видео
hadoop_logo_icon

Бесплатный курс по Основам Hadoop

В серии данных видео вы познакомитесь с компонентами экосистемы Hadoop на примере дистрибутива Arenadata Hadoop 1.6.1.

Data Science

Kafka в ML-задачах

Apache Kafka в задачах машинного обучения — это серия видео про использование платформы потоковой передачи событий в ML-системах. Как организовать обучение ML-модели в реальном времени, используя Event-Driven парадигму. Разбираем на примере создания и развертывания полноценного веб-приложения.

Интерпретация ML-моделей

Чтобы повысить эффективность применения технологий машинного обучения, их результаты должны быть объяснимыми и понятными. Для этого выполняется интерпретация работы ML-моделей с помощью специальных библиотек и фреймворков.

streamlit_logo_icon

StreamLit

Streamlit — это легковесная Python-библиотека, которая позволяет развернуть ML-модели в веб-приложениях с наглядными визуальными графиками, диаграммами, а также создать интерактивные дэшборды.

Python_logo_icon

Инструменты для визуализации данных на python

Инженерия данных

apache_nifi_logo_icon

Серия видео про Apache NiFi

Apache NiFi — это популярный ETL/ELT-фреймворк с открытым исходным кодом для экосистемы Hadoop. Он поддерживает парадигму Low Code благодаря наглядному GUI и широкому набору предустановленных обработчиков (процессоров), а также интеграции со множеством систем хранения и обработки данных. Впрочем, дата-инженер может разработать собственные процессоры для сложных вычислительных операций.

apacheAirflow_logo_icon

Серия видео по Apache Airflow

Apache AirFlow — это широко распространенный фреймворк оркестрации пакетных процессов. Он позволяет дата-инженеру проектировать сложные ETL/ELT-конвейеры в виде направленных ациклических графов (DAG), состоящих из задач, выполняемых операторами — функциями на Python. Фреймворк имеет наглядный GUI для запуска DAG, мониторинга статуса задач и обрабатываемых данных. Сегодня AirFlow является одним из важнейших инструментов дата-инженера.

Записаться на курс

Остались вопросы по формату обучения, содержанию курсов, стоимости, сертификатам или другим важным моментам?
Оставьте номер телефона или e-mail и мы оперативно проконсультируем вас в течение рабочего дня.
ОСТАВЬТЕ СООБЩЕНИЕ, И МЫ ПЕРЕЗВОНИМ ВАМ
В ТЕЧЕНИЕ РАБОЧЕГО ДНЯ
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту