Курсы Big Data, ClickHouse, Airflow,Greenplum, Kafka и Spark

22Мар
2023

MLOps c Kafka Streams и gRPC: 3 способа развернуть ML-модель в production

Автор Анна Вичуговав категории Kafka, Machine Learning, Блог

MLOPS примеры курсы обучение, Kafka Streams Kubernetes Machine Learning MLOps, курсы машинного обучения Kafka MLOps Kubernetes TensorFlow, gRPC Kafka TensorFlow, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Сегодня рассмотрим, как развернуть модель машинного обучения в конвейере Apache Kafka, используя потоковый API технологии удаленного вызова процедур от Google под названием gRPC и сервер ML-моделей TensorFlow Serving. Краткий ликбез по gRPC Напомним, gRPC – это технология интеграции систем, включая клиентский и серверный компоненты, основанная на удаленном вызове процедур в...

12Мар
2023

MLOps c Python-библиотекой Evidently: обнаружение дрейфа данных в ML-моделях

Автор Анна Вичуговав категории Machine Learning, Блог

дрейф данных ML-моделей Evidently Python, MLOPS примеры курсы обучение дата-инженер, курсы PySpark для дата-инженеров, обучение Python MlOps инженерия данных, Data Science ML MLOps примеры курсы обучение, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Зачем нужна Python-библиотека Evidently, и как она помогает специалистам по Data Science выявлять дрейф данных моделей Machine Learning в производственной среде. Знакомимся с еще одним MLOps-инструментом. Что такое дрейф данных, чем это опасно и как его обнаружить В отличие от многих других информационных систем, проекты машинного обучения очень сильно зависят...

06Мар
2023

Преимущества Apache HBase для метода ближайших соседей

Автор Анна Вичуговав категории HBase, Machine Learning, Блог

метод ближайших соседей машинное обучение, knn machine learning nosql HBase, обучение Data Science примеры курсы обучение, NoSQL HBase Hadoop, SQL-on_Hadoop примеры курсы обучение, HBase HDFS SQL Hadoop примеры курсы обучение, администратор дата-инженер Hadoop Hbase примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Метод ближайших соседей активно используется в машинном обучении для решения задач классификации в различных бизнес-приложениях. Познакомимся поближе с этим алгоритмом Machine Learning, а также разберем, почему NoSQL-хранилище Apache HBase отлично подходит для работы с ним. Что такое метод ближайших соседей: ликбез по Machine Learning В проектах Machine Learning и приложениях...

02Мар
2023

MLOps для Spark-приложений в AWS с Amazon SageMaker: кейс Udemy

Автор Анна Вичуговав категории Machine Learning, Spark, Блог

MLOps Spark Python PySpark AWS Sahemaker примиеры курсы обучение, машинное обучение примеры Spark курсы, MLOps-инженер примеры курсы обучение, курсы Spark ML, Школа Больших Данных Учебный центр Коммерсант

Как MLOps-инженеры платформы онлайн-курсов Udemy ускорили цикл разработки и внедрения проектов машинного обучения, используя возможности Amazon SageMaker для создания и отладки Spark-приложений в удаленном облачном кластере. MLOps на AWS Чтобы воспользоваться преимуществами бесшовной интеграции процессов разработки и развертывания машинного обучения согласно концепции MLOps, совсем не обязательно выстраивать собственную платформу из...

24Фев
2023

FastAPI versus BentoML: что лучше для MLOps и почему

Автор Анна Вичуговав категории Machine Learning, Блог

FastAPI BentoML MLOps Machine Learning примеры курсы обучение, обучение MLOps, BentoML MLops инженер, BentoML MLOps, MLOps обучение, машинное обучение Python примеры курсы, Школа Больших Данных Учебный Центр Коммерсант

Что общего у FastAPI с BentoML, чем они отличаются и почему только один из них является полноценным MLOps-инструментом. Смотрим на примере операций разработки и развертывания API сервисов машинного обучения. Что общего у FastAPI с BentoML и при чем здесь MLOps С точки зрения промышленной эксплуатации, в проектах машинного обучения следует...

16Фев
2023

MLOps с Graphene: зачем и как использовать GraphQL для проектов Machine Learning

Автор Анна Вичуговав категории Machine Learning, Блог

GraphQL Python Flask ML MLOps Data Science Machine Learning, аналитика больших данных примеры курсы обучение, Data Science обучение курс, обучение большим данным, MLOps-инженер курсы примеры обучение, Школа Больших Данных Учебный Центр Коммерсант

Недавно мы упоминали GraphQL как мощный и гибкий язык запросов к данным, хранящимся в графовых СУБД. Сегодня рассмотрим, чем эта технология может быть полезна в проектах Machine Learning, какие сложности с ней связаны и как их решить с помощью MLOps. GraphQL для ML: возможности и примеры Не будучи в чистом...

06Фев
2023

MLOps для устранения техдолга в проектах Machine Learning

Автор Анна Вичуговав категории Machine Learning, Блог

DevOps MLOps примеры курсы обучение инструменты, примеры MLOps курсы обучение, курсы по Data Science, обучение Data Science, машинное обучение и аналитика больших данных для руководителей курсы, курс по машинному обучению для менеджеров, автоматизация машинного обучения, Machine Learning Operations, Школа Больших Данных Учебный Центр Коммерсант

Почему в проектах машинного обучения накапливается технический долг, каковы главные факторы его появления и каким образом MLOps устраняет проблемы, связанные с разработкой, тестированием, развертыванием и сопровождением систем Machine Learning. Скрытый технический долг в ML-системах Технический долг означает дополнительные затраты, возникающие в долгосрочной перспективе, с которыми сталкивается команда, в результате выбора...

25Янв
2023

TensorFlow на Apache Hadoop с TonY

Автор Анна Вичуговав категории Machine Learning, Блог

Deep Learning Hadoop TensorFlow MapReduce TonY примеры курсы обучение, глубокое обучение Data Science Hadoop MapReduce YARN примеры курсы, обучение дата-инженеров и MLOps, ML Machine Learning примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Как LinkedIn построила масштабируемую инфраструктуру конвейеров машинного обучения, развернув модели TensorFlow на Apache Kafka, Spark и Hadoop YARN. Что такое платформа TonY, как она работает, почему изначально вычислительная парадигма MapReduce не очень хорошо подходила для глубокого обучения и как это исправить через конфигурацию настроек YARN. MLOps и проблемы глубокого обучения...

14Янв
2023

MLOps c Kubeflow: компоненты ML-конвейера

Автор Анна Вичуговав категории Machine Learning, Блог

Kubeflow примеры курсы обучение сравнение MLOps, MLOPS примеры курсы обучение, Kubeflow примеры курсы обучение, курсы MLOps MLFlow Machine Learning DevOps Для дата-инженеров, MLFlow MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Помимо популярного MLflow от Databrics, специалисты по машинному обучению часто используют другой MLOps-инструмент – Kubeflow, о чем мы писали здесь. Сегодня разберем, как работает это средство, упрощающее разработку и развертывание конвейеров Machine Learning на платформе контейнерной виртуализации Kubernetes. Что такое конвейеры Kubeflow и как они работают Как мы уже отмечали,...

05Янв
2023

MLOps c LakeFS и MLflow: версионирование данных

Автор Анна Вичуговав категории Machine Learning, Блог

MLflow LakeFS примеры курсы обучение MLOps, MLOPS инструменты примеры курсы обучение, MLflow MLOPs примеры курсы обучение, курсы MLOps MLFlow Machine Learning DevOps Для дата-инженеров, MLFlow MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Управление версиями датасетов для ML-моделей, а также версионирование самих алгоритмов машинного обучения является одной из важных задач MLOps-концепции непрерывной разработки и развертывания систем Machine Learning. Читайте, как реализовать это с помощью платформы LakeFS и фреймворка MLflow. Что такое LakeFS и при чем здесь MLOps Системы контроля версий, такие как Git,...

04Янв
2023

Практический NLP с Python-библиотекой spaCy для SEO-задач в Google Colab

Автор Анна Вичуговав категории Machine Learning, Блог

Python NLP spaCy Data Science примеры обучение, курсы Data Science примеры обучение, анализ больших данных Python Google Colab примеры курсы обучение, анализ больших данных на графах примеры, аналитик данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

В рамках продвижения наших курсов по Data Science и Machine Learning, сегодня познакомимся с Python-библиотекой spaCy и русскоязычной NLP-моделью, развернув их в интерактивной среде Google Colab. В качестве практического примера решим небольшую SEO-задачу: определим части речи для каждого слова в небольшом тексте и количество их повторений. Применение библиотеки spaCy на...

27Дек
2022

Глубокое машинное обучение, реляционная парадигма и логическое программирование: versus или вместе?

Автор Анна Вичуговав категории Machine Learning, Блог

графы и таблицы нейросети Deep Learning машинное обучение, MLOps, ML, Machine Learning, машинное обучение, Data Science, обработка данных, глубокое обучение, Deep Learning, Школа Больших Данных Учебный Центр Коммерсант

Сегодня рассмотрим, чем отличаются подходы к представлению данных в глубоком машинном обучении и реляционной логике, как это связано с декларативной парадигмой логического программирования и при чем здесь графы. А в качестве примера реализации этих идей рассмотрим комбинацию принципов Deep Learning с реляционной логикой и GNN-нейросетями в Python-библиотеке PyNeuraLogic. Машинное обучение...

21Дек
2022

MLOps с Apache AirFlow: оркестрация ML-конвейеров

Автор Анна Вичуговав категории AirFlow, Machine Learning, Блог

AirFlow MLOps инженерия данных примеры курсы обучение, ML, Machine Learning, машинное обучение, Data Science, AirFlow примеры курсы обучение дата-инженеров и ML-специалистов, AirFlow в ML-проектах, MLOps AirFlow машинное обучение, Школа Больших Данных Учебный Центр Коммерсант

Apache AirFlow не зря считается у дата-инженеров самым популярным ETL-оркестровщиком. Сегодня посмотрим, чем этот фреймворк полезен в MLOps и как его использовать для оркестровки конвейеров машинного обучения. MLOps в конвейерах машинного обучения Конвейеры машинного обучения в производственной среде обслуживают ML-модели в реальных проектах. Чтобы эффективно управлять такими конвейерами связанных заданий,...

16Дек
2022

Потоковое машинное обучение с Python-библиотекой River

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps, ML, Machine Learning, машинное обучение, Data Science, обработка данных, глубокое обучение, Python River, потоковое и пакетное машинное обучение, Школа Больших Данных Учебный Центр Коммерсант

Сегодня поговорим про Python-библиотеку River, которая позволяет быстро и дешево обновлять модели машинного обучения в производственной среде в режиме реального времени. Чем потоковые ML-конвейеры отличаются от пакетных и с какими сложностями при их реализации может столкнуться Data Scientist. Что такое потоковое машинное обучение Data Scientist’ы обычно используют пакетное обучение для...

09Дек
2022

Разработка мультимодальных ML-моделей с TorchMultimodal

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps, ML, Machine Learning, машинное обучение, Data Science, обработка данных, глубокое обучение, PyTorch, TorchMultimodal, Deep Learning, Школа Больших Данных Учебный Центр Коммерсант

В марте 2022 года в Github появился исходный код TorchMultimodal – PyTorch-библиотеки для обучения масштабных мультимодальных многозадачных ML-моделей. А 17 ноября вышел бета-релиз этой библиотеки, который содержит множество полезных примеров и лучших архитектур глубокого обучения. Разбираемся с этой новой библиотекой. Что такое мультимодальные ML-модели и при чем здесь TorchMultimodal Человек...

28Ноя
2022

MLOps c BentoML, MLflow и Kubeflow: автоматическое развертывание ML-модели

Автор Анна Вичуговав категории Machine Learning, Блог

MLOPS Kubeflow MLflow CI CD BentoML Yatai примеры курсы обучение, MLflow примеры курсы обучение, курсы MLOps MLFlow Machine Learning DevOps Для дата-инженеров, MLFlow MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Чтобы сделать наши курсы для DevOps-инженеров и специалистов по Machine Learning еще более полезными, сегодня рассмотрим, как автоматизировать развертывание и обслуживание ML-моделей согласно концепции MLOps с помощью GitLab CI/CD, BentoML, Yatai, MLflow и Kubeflow. BentoML для CI в MLOPS При развертывании ML-модели необходимо учитывать следующие аспекты: как была построена модель...

19Ноя
2022

Трудности выбора в MLOps: оркестрация ML-конвейеров с Vertex AI Pipelines и Apache AirFlow

Автор Анна Вичуговав категории AirFlow, Machine Learning, Блог

MLOps курсы примеры обучение, ML-инженерия обучение примеры, Google vertex AI Pipelines примеры сравнение MLOps; обучение AirFlow, курсы AirFlow администратор кластера, AirFlow vs Google Vertex AI Pipelines примеры курсы обучение, обучение инженеров данных Big Data, курсы дата-инженеров, Школа Больших Данных Учебный центр Коммерсант

Мы уже сравнивали MLflow и Kubeflow, которые позволяют управлять конвейерами машинного обучения. Продолжая эту важную для ML-инженера тему, сегодня рассмотрим 2 других MLOps-инструмента для оркестрации конвейеров Machine Learning: Vertex AI Pipelines и Apache AirFlow. Что такое Vertex AI Pipelines от Google Поскольку цель концепции MLOps в том, чтобы объединить разработку...

08Ноя
2022

Асинхронное программирование в ML-системах

Автор Анна Вичуговав категории Machine Learning, Блог

машинное обучение python примеры курсы, MLOPS примеры курсы обучение, курсы Data Science, ML Python, ML MLOps Machine Learning, Machine Learning Python MLOps примеры курсы обучение, курсы Data Scince, Machine Learning обучение примеры, машинное обучение MLOps, Machine Learning курсы Spark, Школа Больших Данных Учебный Центр Коммерсант

Поскольку концепция MLOps стремится устранить разрывы между разработкой ML-модели и ее имплементацией в эффективный программный код, сегодня поговорим про важную идею программирования, связанную с синхронностью и асинхронностью вызовов. Что такое асинхронное программирования, зачем это нужно в Machine Learning и какие Python-библиотеки поддерживают это. Проблемы синхронных вызовов в ML-системах В реальных...

01Ноя
2022

Почему глубокому обучению не обойтись без MLOps

Автор Анна Вичуговав категории Machine Learning, Блог

глубокое обучение Deep Learning примеры курсы, MLOPS примеры курсы обучение, курсы Data Science, вывод ML в production, ML MLOps Deep Learning Machine Learning, Deep Learning vs Machine Learning, курсы Data Scince, Machine Learning обучение примеры, машинное обучение MLOps, Machine Learning курсы Spark, Школа Больших Данных Учебный Центр Коммерсант

Сегодня разберем, что такое глубокое обучение и почему MLOps очень важен для этих методов Machine Learning. В чем особенности обучающих данных для моделей Deep Learning и зачем дополнять типовые MLOps-инструменты собственными разработками, избегая вредных антипаттернов. Машинное обучение vs Deep Learning: разница для MLOps Создание ML-систем сводится не только к разработке...

29Окт
2022

Как использовать цепи Маркова для анализа моделей рекламной атрибуции

Автор Анна Вичуговав категории Machine Learning, Блог

примеры Data Science Google Colab pandas networkx matplotlib примеры курсы обучение, цепи Маркова примеры в реальном бизнесе, ципе маркова в рекламе и маркетинге, курсы Data Science примеры обучение, анализ больших данных графа Networkx Python Google Colab примеры курсы обучение, анализ больших данных на графах примеры, аналитик данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Недавно мы писали, что такое цепь Маркова, как это используется в практических приложениях Data Science и с помощью каких инструментов реализуется этот граф состояний. В продолжение этой полезной для обучения дата-аналитиков темы посмотрим на модели маркетинговой атрибуции как на марковские цепи и разберем пользу этого представления. Практический пример в Google...