Аналитика больших данных для руководителей

Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, объектных S3-like хранилищ, безопасность озера данных, цифровизация бизнеса.

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
BDAM
13 января 2025
09 апреля 2025
72 000 руб. 24 ак.часов
Количество дней: 6
Дистанционный
Регистрация

О продукте:

Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.

Курс «Аналитика больших данных для руководителей» ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса, в том числе, в условиях импортозамещения.

В рамках курса вы будете выполнять проект, в рамках которого вы разработаете план цифровой трансформации вашей организации на основе больших данных.

Также в рамках курса у вас будет возможность разобрать интересующие вас вопросы и обсудить перспективы применения полученных знаний и рассмотренных инструментов в контексте решения ваших рабочих задач.

Аудитория:

Руководство государственных предприятий и частных компаний, менеджеры и специалисты.

Уровень подготовки:

Предварительный опыт не требуется.

Программа курса «Аналитика больших данных для руководителей»

1. Введение в Big Data (Большие данные)

    • Большие данные и цифровизация бизнеса.
    • Характеристики data-driven организации. Data-driven и data-informed организации: основные отличия.
    • Принятие data-driven решений и путь к ценности данных.
    • Базовые принципы и отличия от классических подходов к работе с данными.
    • Сравнительный анализ фрэймворков управления проектами анализа больших данных CRISP DM, Domino, TDSP, SEMMA, Enterprise Big Data Framework.
    • Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
    • Тенденции в подходах Big Data и что актуально на сегодняшний день.
    • Технологии Big Data в условиях импортозамещения.

2. Правовые аспекты организации защиты персональных данных

    • Правовое регулирование в области защиты персональных данных
    • Права субъекта и обязанности оператора при обработке ПД
    • Нарушители безопасности ПД
    • Государственные регуляторы и их нормативно-правовая документация в области защиты ПД
    • Осуществление проверки соблюдения правил в области защиты ПД и ответственность за их нарушение
    • GDPR

Практическое задание

Постановка целей для функции Big Data в вашей организации, выявление зон и способов развития организации на пути к data-driven.

3. Понимание Бизнеса (Business Understanding)

    • Влияние Big Data на бизнес. Правильные вопросы бизнесу.
    • Определение бизнес целей для проекта Big Data.
    • Этапы жизненного цикла проекта анализа больших данных, модель DSCPLC.
    • Инициация проекта — критические факторы успеха. Основные проблемы.
    • Оценка ситуации: риски, ROI, IRR, доступные ресурсы, оценка зрелости компании.
    • Приоритизация задач: Что делаем, а что нет.
    • Высокоуровневый план проекта.

Практическое задание

Выявление проблем, с которыми может столкнуться организация при реализации BIg Data проектов, постановка вопросов бизнесу.

4. Понимание данных (Data Understanding)

    • Проблемы при работе с большими данными, модель 4V’s
    • Определение источников данных.
    • Специфика работы с потоковыми и пакетными данными в Big Data.
    • Принципы формирования Data Lake: выбор платформы.
    • Первичный сбор и анализ данных: инструментарий и доступные методы.
    • Описание данных и сбор метаданных.
    • Data management и Data Governance.
    • Оценка качества данных Data Quality.
    • Основные трудности и проблемы, критические факторы успеха, роли и навыки.
    • Разбор сценариев (cases) для фазы Data Understanding.

5. Подготовка данных (Data Preparation)

    • Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных.
    • Подготовка данных – как процесс формирования Data Pipeline:
      • Процессы ETL и ELT,
      • Зонирование Data Lake и сегментирование данных,
      • Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии),
      • Инструменты оркестрирования и автоматизации (Data Flow).
    • И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
    • Безопасность больших данных.
    • Основные трудности и проблемы, критические факторы успеха.
    • Специалисты и их компетенции на данной стадии.

Практическое задание

Выявление факторов и рисков реализации BIg Data проектов в вашей организации. Идентификация датасетов, необходимых для исследования в рамках BIg Data проектов.

Анализ стратегий управления данными с учетом челенджей больших данных в соответствии с моделью 4V’s.

Выявление зон развития функции управления большими данными.

6. Выбор и построение моделей (Modeling)

    • Классы аналитических задач и подходы к их решению.
    • Обзор техник моделирования.
    • Построение моделей и оценка моделей.
    • Что нужно для успешного моделирования.
    • Инструментарий для решения аналитических задач этапа моделирования.
    • Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования.
    • А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое.
    • Основные трудности и проблемы фазы моделирования, критические факторы успеха.
    • Облачные платформы для быстрой разработки.
    • Место DevOps, MLOps для организации процессов разработки.
    • Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами.

7. Построение команды Data Science

    • Таксономия Data Science. Система
    • Команда Data Science: специалисты и их компетенции, роли. Таксономия Data Science. Система OSEMN.
    • Техники найма команды Data Science. Удержание и развитие талантов в команде Data Science

Практическое задание

Построение команды Data Science в вашей организации, определение ключевых ролей и навыков команды, разработка стратегии развития и удержания команды.

8. Оценка результатов (Evaluation)

    • Бизнес-метрики оценки качества моделирования.
    • Отличие Data-driven метрик от традиционных.
    • Операционные метрики. Vaniti метрики. Фрэймворк AARRR.
    • Оценка качества моделирования.
    • Что делать если все плохо? – возвращаемся на предыдущие фазы.
    • Рассматриваем данную стадию в рамках наших сценариев (cases).
    • Отличия среды разработки и эксплуатации.
    • Особенности этапа оценки.

9. Развертывание (Deployment)

    • Планирование развертывания модели.
    • Мониторинг и обслуживание модели.
    • Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и MLOps.
    • Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации.

Практическое задание

Выявление качественных и количественных критериев успеха для Big Data-проектов.

10. Экономическая оценка проекта

    • Метрики экономической эффективности проекта
    • Принципы разработки бизнес-кэйсов для проектов анализа больших данных. Типовые ошибки при разработке бизнес-кэйсов. Разбор примеров бизнес-кэйсов.
    • Защита бизнес-кэйсов и бюджета проекта

11. Цифровая трансформация организации

    • Факторы цифровой трансформации организации
    • Этапы цифровой трансформации. Уровни зрелости организации
    • Как не повторить «ловушки стартапов». Челенджи на пути к цифровой трансформации
    • Критерии оценки зрелости аналитики данных в организации

Практическое задание

Разработка бизнес-кэйсов для Big Data-проектов, разработка плана цифровой трансформации вашей организации.

Скачать программу курса «Аналитика больших данных для руководителей» в формате pdf

Отправить ссылку на:

Чему Вы научитесь:

    • Разрабатывать стратегии цифровой трансформации организаций на основе больших данных
    • разрабатывать бизнес-кэйсы для проектов анализа больших даннных
    • эффективно применять фрэймворки управления проектами анализа больших данных
    • разбираться в основных понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence)
    • понимать назначение компонентов экосистемы Hadoop, Spark, Kafka или терминов Data Lake, Delta Lake,
    • знать, в чем отличие Apache Hadoop, NoSQL, MPP или Greenplum,
    • выявить нюансы облачных решений, контейнеризации и применимости к вашей отрасли бизнеса,
    • знать, что такое политики Data Governance,
    • знать особенности применения методологий для реализации процессов аналитики больших данных на примере CRISP-DM.

Что Вы получите:

Окончив курс «Аналитика больших данных для руководителей» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат установленного образца, который может засчитываться в качестве свидетельства о повышении квалификации.

Кто проводит курс

Самсонов Сергей
Самарский государственный университет: Факультет информатики, специалист прикладной информатики, 2012

Опыт работы в сфере больших данных более чем 10 лет. Лидировал успешные проекты по внедрению и поддержке Data Lake в таких компаниях как Альфа-Банк, Росбанк, ВТБ Россия, международных стартапах, а также, государственных информационных системах РФ, включая ГАСУ «Национальные проекты». Контрибьютор open-source проектов по Big Data, включая Kubernetes Operator for Apache Spark https://github.com/kubeflow/spark-operator. Организатор Google Developers Group Astana. Основатель казахоязычного коммьюнити по большим данным BIG DATA KZ. Scrum-мастер с более чем 5-летним опытом, обладатель сертификатов Agile Fundamentals (ICP) и Agile Team Facilitation (ICP-ATF).

Отзывы наших клиентов о курсе

Оставить отзыв

Чтобы записаться на курс BDAM: Аналитика больших данных для руководителей позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.

Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.
Поиск по сайту