Аналитика больших данных для руководителей

6-дневный курс обучения, на котором вы узнаете, как использовать Big Data для принятия стратегических решений.  Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, объектных S3-like хранилищ, безопасность озера данных, цифровизация бизнеса, обзор технологий, кейсы из бизнеса и практические рекомендации для руководителей.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
BDAM
12 мая 2025
04 августа 2025
72 000 руб. 24 ак.часов
Количество дней: 6
Дистанционный
Регистрация

О продукте

Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.

Курс «Аналитика больших данных для руководителей» ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса, в том числе, в условиях импортозамещения.

В рамках курса вы будете выполнять проект, в рамках которого вы разработаете план цифровой трансформации вашей организации на основе больших данных.

Также в рамках курса у вас будет возможность разобрать интересующие вас вопросы и обсудить перспективы применения полученных знаний и рассмотренных инструментов в контексте решения ваших рабочих задач.

Аудитория

Руководство государственных предприятий и частных компаний, менеджеры и специалисты

Уровень подготовки

Предварительный опыт не требуется

Программа курса «Аналитика больших данных для руководителей»

1. Введение в Big Data (Большие данные)

    • Большие данные и цифровизация бизнеса.
    • Характеристики data-driven организации. Data-driven и data-informed организации: основные отличия.
    • Принятие data-driven решений и путь к ценности данных.
    • Базовые принципы и отличия от классических подходов к работе с данными.
    • Сравнительный анализ фрэймворков управления проектами анализа больших данных CRISP DM, Domino, TDSP, SEMMA, Enterprise Big Data Framework.
    • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
    • Тенденции в подходах Big Data и что актуально на сегодняшний день.
    • Технологии Big Data в условиях импортозамещения.

2. Правовые аспекты организации защиты персональных данных

    • Правовое регулирование в области защиты персональных данных
    • Права субъекта и обязанности оператора при обработке ПД
    • Нарушители безопасности ПД
    • Государственные регуляторы и их нормативно-правовая документация в области защиты ПД
    • Осуществление проверки соблюдения правил в области защиты ПД и ответственность за их нарушение
    • GDPR

Практическое задание

Постановка целей для функции Big Data в вашей организации, выявление зон и способов развития организации на пути к data-driven.

3. Понимание Бизнеса (Business Understanding)

    • Влияние Big Data на бизнес. Правильные вопросы бизнесу.
    • Определение бизнес целей для проекта Big Data.
    • Этапы жизненного цикла проекта анализа больших данных, модель DSCPLC.
    • Инициация проекта — критические факторы успеха. Основные проблемы.
    • Оценка ситуации: риски, ROI, IRR, доступные ресурсы, оценка зрелости компании.
    • Приоритизация задач: Что делаем, а что нет.
    • Высокоуровневый план проекта.

Практическое задание

Выявление проблем, с которыми может столкнуться организация при реализации BIg Data проектов, постановка вопросов бизнесу.

4. Понимание данных (Data Understanding)

    • Проблемы при работе с большими данными, модель 4V’s
    • Определение источников данных.
    • Специфика работы с потоковыми и пакетными данными в Big Data.
    • Принципы формирования Data Lake: выбор платформы.
    • Первичный сбор и анализ данных: инструментарий и доступные методы.
    • Описание данных и сбор метаданных.
    • Data management и Data Governance.
    • Оценка качества данных Data Quality.
    • Основные трудности и проблемы, критические факторы успеха, роли и навыки.
    • Разбор сценариев (cases) для фазы Data Understanding.

5. Подготовка данных (Data Preparation)

    • Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных.
    • Подготовка данных – как процесс формирования Data Pipeline:
      • Процессы ETL и ELT,
      • Зонирование Data Lake и сегментирование данных,
      • Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии),
      • Инструменты оркестрирования и автоматизации (Data Flow).
    • И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
    • Безопасность больших данных.
    • Основные трудности и проблемы, критические факторы успеха.
    • Специалисты и их компетенции на данной стадии.

Практическое задание

Выявление факторов и рисков реализации BIg Data проектов в вашей организации. Идентификация датасетов, необходимых для исследования в рамках BIg Data проектов.

Анализ стратегий управления данными с учетом челенджей больших данных в соответствии с моделью 4V’s.

Выявление зон развития функции управления большими данными.

6. Выбор и построение моделей (Modeling)

    • Классы аналитических задач и подходы к их решению.
    • Обзор техник моделирования.
    • Построение моделей и оценка моделей.
    • Что нужно для успешного моделирования.
    • Инструментарий для решения аналитических задач этапа моделирования.
    • Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования.
    • А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое.
    • Основные трудности и проблемы фазы моделирования, критические факторы успеха.
    • Облачные платформы для быстрой разработки.
    • Место DevOps, MLOps для организации процессов разработки.
    • Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами.

7. Построение команды Data Science

    • Таксономия Data Science. Система
    • Команда Data Science: специалисты и их компетенции, роли. Таксономия Data Science. Система OSEMN.
    • Техники найма команды Data Science. Удержание и развитие талантов в команде Data Science

Практическое задание

Построение команды Data Science в вашей организации, определение ключевых ролей и навыков команды, разработка стратегии развития и удержания команды.

8. Оценка результатов (Evaluation)

    • Бизнес-метрики оценки качества моделирования.
    • Отличие Data-driven метрик от традиционных.
    • Операционные метрики. Vaniti метрики. Фрэймворк AARRR.
    • Оценка качества моделирования.
    • Что делать если все плохо? – возвращаемся на предыдущие фазы.
    • Рассматриваем данную стадию в рамках наших сценариев (cases).
    • Отличия среды разработки и эксплуатации.
    • Особенности этапа оценки.

9. Развертывание (Deployment)

    • Планирование развертывания модели.
    • Мониторинг и обслуживание модели.
    • Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и MLOps.
    • Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации.

Практическое задание

Выявление качественных и количественных критериев успеха для Big Data-проектов.

10. Экономическая оценка проекта

    • Метрики экономической эффективности проекта
    • Принципы разработки бизнес-кэйсов для проектов анализа больших данных. Типовые ошибки при разработке бизнес-кэйсов. Разбор примеров бизнес-кэйсов.
    • Защита бизнес-кэйсов и бюджета проекта

11. Цифровая трансформация организации

    • Факторы цифровой трансформации организации
    • Этапы цифровой трансформации. Уровни зрелости организации
    • Как не повторить «ловушки стартапов». Челенджи на пути к цифровой трансформации
    • Критерии оценки зрелости аналитики данных в организации

Практическое задание

Разработка бизнес-кэйсов для Big Data-проектов, разработка плана цифровой трансформации вашей организации.

Скачать программу курса «Аналитика больших данных для руководителей» в формате pdf

Отправить ссылку на:

Чему Вы научитесь

    • Разрабатывать стратегии цифровой трансформации организаций на основе больших данных
    • разрабатывать бизнес-кейсы для проектов анализа больших данных
    • эффективно применять фрэймворки управления проектами анализа больших данных
    • разбираться в основных понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence)
    • понимать назначение компонентов экосистемы Hadoop, Spark, Kafka или терминов Data Lake, Delta Lake,
    • знать, в чем отличие Apache Hadoop, NoSQL, MPP или Greenplum,
    • выявить нюансы облачных решений, контейнеризации и применимости к вашей отрасли бизнеса,
    • знать, что такое политики Data Governance,
    • знать особенности применения методологий для реализации процессов аналитики больших данных на примере CRISP-DM.

Что Вы получите

Окончив курс «Аналитика больших данных для руководителей» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите удостоверение о повышении квалификации установленного образца.

Кто проводит курс

Самсонов Сергей
Самарский государственный университет: Факультет информатики, специалист прикладной информатики, 2012

Опыт работы в сфере больших данных более чем 10 лет. Лидировал успешные проекты по внедрению и поддержке Data Lake в таких компаниях как Альфа-Банк, Росбанк, ВТБ Россия, международных стартапах, а также, государственных информационных системах РФ, включая ГАСУ «Национальные проекты». Контрибьютор open-source проектов по Big Data, включая Kubernetes Operator for Apache Spark https://github.com/kubeflow/spark-operator. Организатор Google Developers Group Astana. Основатель казахоязычного коммьюнити по большим данным BIG DATA KZ. Scrum-мастер с более чем 5-летним опытом, обладатель сертификатов Agile Fundamentals (ICP) и Agile Team Facilitation (ICP-ATF).

Отзывы наших клиентов о курсе

Оставить отзыв

Чтобы записаться на курс BDAM: Аналитика больших данных для руководителей позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.