Аналитика больших данных для руководителей
Все, что нужно знать для успешной работы с большими данными: методы аналитики и машинного обучения, принципы работы и функциональные возможности компонентов экосистемы Hadoop, объектных S3-like хранилищ, безопасность озера данных, цифровизация бизнеса.
Код курса | Даты начала курса | Стоимость обучения | Длительность обучения | Формат обучения |
---|---|---|---|---|
BDAM | 13 января 2025 09 апреля 2025 |
72 000 руб. | 24 ак.часов Количество дней: 6 |
Дистанционный |
Регистрация |
О продукте:
Сегодня информация — это основа любого бизнеса, инструмент эффективного управления и оптимизации рабочих процессов. Аналитика больших данных (Big Data) вашего бизнеса поможет своевременно выявить и даже предупредить множество проблем, от оттока клиентов до утечки персональных данных. Чтобы понимать возможности современных технологий и выбирать среди них наилучшее соотношение «стоимость/результат», менеджеру необходимо разбираться в базовых понятиях и прикладных решениях.
Курс «Аналитика больших данных для руководителей» ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса, в том числе, в условиях импортозамещения.
В рамках курса вы будете выполнять проект, в рамках которого вы разработаете план цифровой трансформации вашей организации на основе больших данных.
Также в рамках курса у вас будет возможность разобрать интересующие вас вопросы и обсудить перспективы применения полученных знаний и рассмотренных инструментов в контексте решения ваших рабочих задач.
Аудитория:
Руководство государственных предприятий и частных компаний, менеджеры и специалисты.
Уровень подготовки:
Предварительный опыт не требуется.
Программа курса «Аналитика больших данных для руководителей»
1. Введение в Big Data (Большие данные)
-
- Большие данные и цифровизация бизнеса.
- Характеристики data-driven организации. Data-driven и data-informed организации: основные отличия.
- Принятие data-driven решений и путь к ценности данных.
- Базовые принципы и отличия от классических подходов к работе с данными.
- Сравнительный анализ фрэймворков управления проектами анализа больших данных CRISP DM, Domino, TDSP, SEMMA, Enterprise Big Data Framework.
- Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
- Тенденции в подходах Big Data и что актуально на сегодняшний день.
- Технологии Big Data в условиях импортозамещения.
2. Правовые аспекты организации защиты персональных данных
-
- Правовое регулирование в области защиты персональных данных
- Права субъекта и обязанности оператора при обработке ПД
- Нарушители безопасности ПД
- Государственные регуляторы и их нормативно-правовая документация в области защиты ПД
- Осуществление проверки соблюдения правил в области защиты ПД и ответственность за их нарушение
- GDPR
Практическое задание
Постановка целей для функции Big Data в вашей организации, выявление зон и способов развития организации на пути к data-driven.
3. Понимание Бизнеса (Business Understanding)
-
- Влияние Big Data на бизнес. Правильные вопросы бизнесу.
- Определение бизнес целей для проекта Big Data.
- Этапы жизненного цикла проекта анализа больших данных, модель DSCPLC.
- Инициация проекта — критические факторы успеха. Основные проблемы.
- Оценка ситуации: риски, ROI, IRR, доступные ресурсы, оценка зрелости компании.
- Приоритизация задач: Что делаем, а что нет.
- Высокоуровневый план проекта.
Практическое задание
Выявление проблем, с которыми может столкнуться организация при реализации BIg Data проектов, постановка вопросов бизнесу.
4. Понимание данных (Data Understanding)
-
- Проблемы при работе с большими данными, модель 4V’s
- Определение источников данных.
- Специфика работы с потоковыми и пакетными данными в Big Data.
- Принципы формирования Data Lake: выбор платформы.
- Первичный сбор и анализ данных: инструментарий и доступные методы.
- Описание данных и сбор метаданных.
- Data management и Data Governance.
- Оценка качества данных Data Quality.
- Основные трудности и проблемы, критические факторы успеха, роли и навыки.
- Разбор сценариев (cases) для фазы Data Understanding.
5. Подготовка данных (Data Preparation)
-
- Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных.
- Подготовка данных – как процесс формирования Data Pipeline:
- Процессы ETL и ELT,
- Зонирование Data Lake и сегментирование данных,
- Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии),
- Инструменты оркестрирования и автоматизации (Data Flow).
- И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
- Безопасность больших данных.
- Основные трудности и проблемы, критические факторы успеха.
- Специалисты и их компетенции на данной стадии.
Практическое задание
Выявление факторов и рисков реализации BIg Data проектов в вашей организации. Идентификация датасетов, необходимых для исследования в рамках BIg Data проектов.
Анализ стратегий управления данными с учетом челенджей больших данных в соответствии с моделью 4V’s.
Выявление зон развития функции управления большими данными.
6. Выбор и построение моделей (Modeling)
-
- Классы аналитических задач и подходы к их решению.
- Обзор техник моделирования.
- Построение моделей и оценка моделей.
- Что нужно для успешного моделирования.
- Инструментарий для решения аналитических задач этапа моделирования.
- Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования.
- А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое.
- Основные трудности и проблемы фазы моделирования, критические факторы успеха.
- Облачные платформы для быстрой разработки.
- Место DevOps, MLOps для организации процессов разработки.
- Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами.
7. Построение команды Data Science
-
- Таксономия Data Science. Система
- Команда Data Science: специалисты и их компетенции, роли. Таксономия Data Science. Система OSEMN.
- Техники найма команды Data Science. Удержание и развитие талантов в команде Data Science
Практическое задание
Построение команды Data Science в вашей организации, определение ключевых ролей и навыков команды, разработка стратегии развития и удержания команды.
8. Оценка результатов (Evaluation)
-
- Бизнес-метрики оценки качества моделирования.
- Отличие Data-driven метрик от традиционных.
- Операционные метрики. Vaniti метрики. Фрэймворк AARRR.
- Оценка качества моделирования.
- Что делать если все плохо? – возвращаемся на предыдущие фазы.
- Рассматриваем данную стадию в рамках наших сценариев (cases).
- Отличия среды разработки и эксплуатации.
- Особенности этапа оценки.
9. Развертывание (Deployment)
-
- Планирование развертывания модели.
- Мониторинг и обслуживание модели.
- Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и MLOps.
- Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации.
Практическое задание
Выявление качественных и количественных критериев успеха для Big Data-проектов.
10. Экономическая оценка проекта
-
- Метрики экономической эффективности проекта
- Принципы разработки бизнес-кэйсов для проектов анализа больших данных. Типовые ошибки при разработке бизнес-кэйсов. Разбор примеров бизнес-кэйсов.
- Защита бизнес-кэйсов и бюджета проекта
11. Цифровая трансформация организации
-
- Факторы цифровой трансформации организации
- Этапы цифровой трансформации. Уровни зрелости организации
- Как не повторить «ловушки стартапов». Челенджи на пути к цифровой трансформации
- Критерии оценки зрелости аналитики данных в организации
Практическое задание
Разработка бизнес-кэйсов для Big Data-проектов, разработка плана цифровой трансформации вашей организации.
Отправить ссылку на:
Чему Вы научитесь:
-
- Разрабатывать стратегии цифровой трансформации организаций на основе больших данных
- разрабатывать бизнес-кэйсы для проектов анализа больших даннных
- эффективно применять фрэймворки управления проектами анализа больших данных
- разбираться в основных понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence)
- понимать назначение компонентов экосистемы Hadoop, Spark, Kafka или терминов Data Lake, Delta Lake,
- знать, в чем отличие Apache Hadoop, NoSQL, MPP или Greenplum,
- выявить нюансы облачных решений, контейнеризации и применимости к вашей отрасли бизнеса,
- знать, что такое политики Data Governance,
- знать особенности применения методологий для реализации процессов аналитики больших данных на примере CRISP-DM.
Что Вы получите:
Окончив курс «Аналитика больших данных для руководителей» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат установленного образца, который может засчитываться в качестве свидетельства о повышении квалификации.
Кто проводит курс
Опыт работы в сфере больших данных более чем 10 лет. Лидировал успешные проекты по внедрению и поддержке Data Lake в таких компаниях как Альфа-Банк, Росбанк, ВТБ Россия, международных стартапах, а также, государственных информационных системах РФ, включая ГАСУ «Национальные проекты». Контрибьютор open-source проектов по Big Data, включая Kubernetes Operator for Apache Spark https://github.com/kubeflow/spark-operator. Организатор Google Developers Group Astana. Основатель казахоязычного коммьюнити по большим данным BIG DATA KZ. Scrum-мастер с более чем 5-летним опытом, обладатель сертификатов Agile Fundamentals (ICP) и Agile Team Facilitation (ICP-ATF).
Отзывы наших клиентов о курсе
Чтобы записаться на курс BDAM: Аналитика больших данных для руководителей позвоните нам по телефону +7 (495) 414-11-21 или заполните форму регистрации ниже.