ML Практикум: от теории к промышленному использованию

6-дневный интенсивный практикум предназначен для специалистов, которые хотят не только освоить современные методы машинного обучения, но и научиться внедрять их в реальные бизнес-процессы. Вы получите навыки, которые сразу можно применять в работе: от предобработки данных и построения моделей до их промышленной реализации, и взаимодействия с бизнесом.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
PYML
26 мая 2025
11 августа 2025
54 000 руб. 24 ак.часов
Количество дней: 6
Дистанционный
Регистрация

О продукте

Машинное обучение (Machine Learning) — это раздел искусственного интеллекта, изучающий математические, статистические и вычислительные методы для разработки алгоритмов, способных обучаться и решать задачи не прямым способом, а на основе поиска закономерностей в разнообразных входных данных. Решение вычисляется не по точно заданной формуле, а по установленной зависимости результатов от конкретного набора признаков и их значений.

На практике машинное обучение широко применяется в широком спектре исследовательских и прикладных задач:

  • прогнозирование событий и ситуационный анализ, например, отток клиентов в ритейле или заблаговременное предсказание поломок промышленного оборудования;
  • распознавание образов (изображений, лиц, голоса и т.д.);
  • классификация образцов, в частности, рентгеновских снимков для постановки диагноза;
  • выявление мошеннических операций (антифрод-системы в банках и cybersecurity).

Как именно Machine Learning можно использовать для конкретных бизнес-кейсов, вы узнаете в рамках нашего образовательного курса «Введение в машинное обучение».

Аудитория

  • Data Scientists и аналитики, желающие углубить знания в ML-продакшн.
  • Разработчики, планирующие работать с ML-моделями.
  • Руководители IT-проектов, которым важно понимать этапы ML-разработки.
  • Специалисты смежных областей, стремящиеся перейти в Data Science.

Уровень подготовки

  • Базовый опыт программирования на Python (знание Pandas, NumPy — преимущество).
  • Понимание основ математической статистики.

О курсе

Данный курс является практическим руководством для специалистов, которым предстоит столкнуться в рабочих задачах с методами машинного обучения.  В курсе будет рассказано о формализации таких задачах и современных подходах к их решению. Большое внимание в курсе уделено практической реализации методов ML на языке Python.

Продолжительность: 6 дней, 24 академических часа.

Соотношение теории к практике 50/50

Программа курса «ML Практикум: от теории к промышленному использованию»

1. Задачи машинного обучения и основные подходы к их решению

Теоретическая часть: основные понятия; классификация задач, решаемых с помощью методов машинного обучения; виды данных, понятие датасета. (1,5 часа)

Практическая часть: первичный анализ датасета, предобработка данных, сквозной пример решения задачи машинного обучения. (2,5 часа)

2. Базовые методы решения задач классификации и регрессии

Теоретическая часть: определение и примеры задач классификации и регрессии. Линейные методы. Деревья решений. Проблема переобучения. Основные проблемы с данными. (1,5 часа)

Практическая часть: решение задач классификации и регрессии линейными методами и методами на основе деревьев решений. Подбор гиперпараметров. Примеры переобученных моделей. (2,5 часа)

3. Продвинутые методы решения задач классификации и регрессии

Теоретическая часть: Стэкинг, бэггинг. Градиентные бустинги на примере LightGBM, xgboost, catboost. GridSearch для подбора гиперпараметров. AutoML. (1,5 часа)

Практическая часть: подбор гиперпараметров по сетке значений для базовых алгоритмов. Разбор кейсов по обучению моделей градиентного бустинга. (2,5 часа)

4. Продвинутые методы обработки данных и работа с признаковым пространством

Теоретическая часть: Тематика обучения без учителя — кластеризация, понижение размерности. Визуализация и формирование гипотез о данных. Feature Engineering и Feature extraction. (1,5 часа)

Практическая часть: примеры решения задач кластеризации и понижения размерности. Feature Engineering для улучшения качества работы ML моделей. (2,5 часа)

5. Нейронные сети для решения задач машинного обучения

Теоретическая часть: нейронные сети, задачи CV, NLP. Предобученные сети, файнтюнинг. (1,5 часа)

Практическая часть: Примеры решения задач классификации изображений и текстов. Применение полносвязных сетей для решения задач классификации и регрессии. Сравнение с алгоритмами бустинга. (2,5 часа)

6. Практическое руководство по реализации моделей машинного обучения

Теоретическая часть: сохранение результатов экспериментов и версионирование моделей и датасетов. Воспроизводимость экспериментов. Форматы сериализации моделей и пути продуктивизации: функциональная обертка, REST API сервис. Лучшие практики. (1,5 часа)

Практическая часть: создание веб-сервиса на фреймворке FastApi. Демонстрация MLFlow и AirFlow. (2,5 часа)

Скачать программу курса « PYML: Машинное обучение на Python» в формате pdf

Отправить ссылку на:

Чему Вы научитесь:

Свободно ориентироваться в методах ML:

  • Выбирать оптимальные алгоритмы под конкретные задачи.
  • Понимать сильные и слабые стороны моделей.

Управлять полным циклом ML-проектов:

  • Планировать этапы: от анализа данных до ввода моделей в эксплуатацию.
  • Работать с инструментами версионирования (MLFlow) и оркестрации (AirFlow).

Коммуницировать с бизнесом:

  • Интерпретировать метрики качества на языке бизнес-целей.
  • Обосновывать эффективность решений для не-technical аудитории.

Создавать работающие решения:

  • Разворачивать модели как REST API (FastAPI).
  • Применять AutoML и продвинутые техники Feature Engineering.

Что Вы получите:

Успешно окончив курс «ML Практикум: от теории к промышленному использованию» в нашем лицензированном учебном центре, вы получите удостоверение о повышении квалификации установленного образца.

Кто проводит курс

Конорев Олег
Академия Федеральной службы безопасности Российской Федерации (Москва, 2012)
Профессиональные компетенции:
  • Руководитель группы Data Science в НИИ “Квант”, Москва
  • Computer vision (CV) – решение задач по классификации и детектировании объектов на фото и видео, идентификации человека,  сегментации изображений и распознаванию текста с библиотеками OpenCV, Tensorflow API и архитектурами нейронных сетей  Yolo, SSD, fRCNN, U-net и пр.
  • Natural language processing (NLP) – решение задач по классификации текстов, извлечению именованных сущностей (NER) и ключевых слов с библиотеками gensim, nltk, fasttext, spacy и др. Построение различных архитектур на основе искусственных нейронных сетей с использованием различных представлений слов (Embedding, Word2Vec) и готовых нейросетевых решений (Bert, fastai)
  • Time series analysis – решение задач обработки, анализа и классификации аудио сигналов с библиотеками librosa, ffmpeg и различных архитектур нейронных сетей, а также предсказание значений временных рядов (time series forecasting) в приложении к котировкам активов с использованием классических решений (ARMA, ARIMA) и моделей на базе сверточных нейронных сетей (CNN), рекуррентных нейронных сетей (LSTM,GRU) и их комбинаций.
  • Проекты сегментации сигналов с различных датчиков и приборов и распознавания речи (speech-to-text) с облачными сервисами Yandex и Google.
Ермилов Дмитрий
Академия Федеральной службы безопасности Российской Федерации (Москва, 2012)
Профессиональные компетенции:
  • Ведущий Data Scientist в ФГУП “Центр информационных технологий”, Москва
  • Руководитель программ в Университете искусственного интеллекта, Москва.
  • Кандидат наук (2017 год, Московский государственный университет им. М.В. Ломоносова, Москва)

Чтобы записаться на курс PYML: ML Практикум: от теории к промышленному использованию позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.