Главная » Видео
Видеоматериалы Школы Больших Данных
Бесплатные учебные курсы
Бесплатный курс по основам программирования на Python
Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» — это практический видеокурс «Школы Больших Данных» по проекту Python School. Он разработан специально для начинающих аналитиков, дата-инженеров и ИТ-специалистов , которые хотят освоить азы разработки на Python и получить практические навыки использования специализированных библиотек для работы с большими данными. Курс включает обзор популярных методов машинного обучения (Machine Learning) и других разделов Data Science, в т.ч. подготовку данных к анализу и их аналитическую обработку. Программа курса и расписание занятий здесь.
Бесплатный курс по Fast API
Бесплатный курс по Основам Hadoop
В серии данных видео вы познакомитесь с компонентами экосистемы Hadoop на примере дистрибутива Arenadata Hadoop 1.6.1.
Data Science
Kafka в ML-задачах
Apache Kafka в задачах машинного обучения — это серия видео про использование платформы потоковой передачи событий в ML-системах. Как организовать обучение ML-модели в реальном времени, используя Event-Driven парадигму. Разбираем на примере создания и развертывания полноценного веб-приложения.
Интерпретация ML-моделей
Чтобы повысить эффективность применения технологий машинного обучения, их результаты должны быть объяснимыми и понятными. Для этого выполняется интерпретация работы ML-моделей с помощью специальных библиотек и фреймворков.
Интеграция моделей машинного обучения
StreamLit
Streamlit — это легковесная Python-библиотека, которая позволяет развернуть ML-модели в веб-приложениях с наглядными визуальными графиками, диаграммами, а также создать интерактивные дэшборды.
Рекомендательные системы
Инструменты для визуализации данных на python
MLflow
Графовые алгоритмы
Natural Language Processing
Геопространственные данные
Computer vision
В серии данных видео вы познакомитесь с Nvidia Jetson Nano
Инженерия данных
Серия видео про Apache NiFi
Apache NiFi — это популярный ETL/ELT-фреймворк с открытым исходным кодом для экосистемы Hadoop. Он поддерживает парадигму Low Code благодаря наглядному GUI и широкому набору предустановленных обработчиков (процессоров), а также интеграции со множеством систем хранения и обработки данных. Впрочем, дата-инженер может разработать собственные процессоры для сложных вычислительных операций.
Серия видео по Apache Airflow
Apache AirFlow — это широко распространенный фреймворк оркестрации пакетных процессов. Он позволяет дата-инженеру проектировать сложные ETL/ELT-конвейеры в виде направленных ациклических графов (DAG), состоящих из задач, выполняемых операторами — функциями на Python. Фреймворк имеет наглядный GUI для запуска DAG, мониторинга статуса задач и обрабатываемых данных. Сегодня AirFlow является одним из важнейших инструментов дата-инженера.
Другое
NLP с Nvidia Jetson Nano
В серии данных видео вы познакомитесь с Nvidia Jetson Nano