Курсы Trino, ClickHouse, Airflow, Kafka, МL и ИИ Обучение

09Окт
2023

Автоматизированное тестирование в MLOps: что и как проверять?

Автор Анна Вичуговав категории Machine Learning, Блог

тестирование ML, fdnjntcnbhjdfybt Ьфсршту дуфктштпб vfibyyjt j,extybt ntcnbhjdfybt ьДЩзыб обучение MLOps , курсы MLOps , обучение Machine Learning, Machine Learning курсы примеры, Machine Learning MLOps , машинное обучение примеры курсы, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Мы уже писали про особенности тестирования систем машинного обучения. Чтобы не повторяться, сегодня рассмотрим фреймворки для реализации идей MLOps, а также рассмотрим, какие тесты должны быть пройдены для проверки работоспособности ML-продукта. 3 категории тестов для ML-систем Согласно концепции MLOps, полный конвейер разработки включает в себя три основных компонента: конвейер данных,...

17Сен
2023

RAG-приложения и Neo4j: поддержка векторного индекса для LLM

Автор Анна Вичуговав категории Machine Learning, Neo4j, NoSql, Блог

векторная индексация в Neo4j, графы и машинное обучение, LLM и RAG, LLM RAG большие языковые модели примеры курсы обучение, Neo4j RAG LLM, Machine Learning Deep Learning, ИИ графы и векторные СУБД, машинное обучение, nosql Neo4j ML, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных ИИ примеры курсы обучение, MLOps архитектура больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Что не так с большими языковыми моделями, как RAG-приложения расширяют возможности LLM и зачем в графовой СУБД Neo4j добавлена поддержка векторного индекса. Зачем нужны RAG-приложения: ограничения базовых LLM-сетей С появлением ChatGPT и других генеративных нейросетей, большие языковые модели (LLM, Large Language Models) стали активно применяться для решения множества бизнес-задач, связанных...

31Авг
2023

MLOps для ИИ: AI-шлюз в MLflow

Автор Анна Вичуговав категории Machine Learning, Блог

MLflow AI Gateway, LLM AI MLOps, MLOPS примеры курсы обучение, MLflow примеры курсы обучение, курсы MLOps MLFlow Machine Learning DevOps Для дата-инженеров, MLFlow MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Зачем разработчики MLflow внедрили в этот MLOps-фреймворк инструмент оптимизации использования и управления различными провайдерами больших языковых моделей, чем он полезен и как использовать AI Gateway от Databricks. Что такое MLflow AI Gateway и зачем это нужно Напомним, MLflow от Databricks представляет собой платформу с открытым исходным кодом, которая помогает управлять...

30Авг
2023

Программируй на английском: ИИ-SDK для PySpark от Databricks

Автор Анна Вичуговав категории Machine Learning, Spark, Блог

LLM AI MLOps Spark, MLOPS PySpark-AI примеры курсы обучение, Spark примеры курсы обучение AI ИИ, PySpark-AI English SDK Databricks курсы Machine Learning для дата-инженеров и аналитиков, обучение Machine Learning Apache Spark, Школа Больших Данных Учебный Центр Коммерсант

Как получать результаты обработки данных с помощью Apache Spark, адресуя ИИ бизнес-запросы на английском языке: знакомимся с English SDK от Databricks. Настоящий Low Code с PySpark-AI. English SDK for Apache Spark и PySpark-AI: как это работает Большие языковые модели (LLM, Large Language Model), основанные на генеративных нейросетях, применимы не только...

24Авг
2023

Шаблон стека MLOps-инструментов и ТОП-5 практик его внедрения

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps инструменты проектирование конвейера примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Как внедрить ключевые идеи MLOps и определиться с набором инструментов для непрерывной разработки и поставки систем машинного обучения. Лучшие практики и шаблон представления техстека. С чего начать: определение структуры проекта Напомним, концепция MLOps ориентирована на устранение организационных и технических разрывов между разнопрофильными участниками процессов создания систем машинного обучения. Когда речь...

15Авг
2023

Стандартизация MLOps с CRISP-ML

Автор Анна Вичуговав категории Machine Learning, Блог

CRISP-ML(Q) MLOps, курсы по цифровизации, обучение цифровизации, машинное обучение и аналитика больших данных для руководителей курсы, курс по машинному обучению для менеджеров, автоматизация машинного обучения, Machine Learning Operations CRISP-ML(Q), MLOps методология инструменты примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Что представляет собой межотраслевой стандартный процесс машинного обучения CRISP-ML(Q), из каких этапов и задач он состоит, а также как согласуется с концепцией MLOps. Что такое CRISP-ML(Q) и при чем здесь MLOps Стандартизация подходов и процессов позволяет унифицировать и масштабировать лучшие практики управления исследованиями и разработкой, в т.ч. распространяя их на...

05Авг
2023

ИИ и векторные базы данных: как это работает?

Автор Анна Вичуговав категории Machine Learning, NoSql, Блог

архитектура больших данных, ИИ и векторные СУБД, метод ближайших соседей машинное обучение, knn machine learning nosql, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Как устроены векторные базы данных и почему они стали так популярны с распространением ИИ. Архитектура, алгоритмы, принципы работы и примеры векторных СУБД. Что такое векторная СУБД и при чем здесь ИИ Как и следует из названия, векторная база хранит данные в виде векторов. Это понятие из математики означает специализированное представление...

28Июл
2023

Horovod на Databricks для MLOps в глубоком обучении

Автор Анна Вичуговав категории Machine Learning, Блог

глубокое обучение Deep Learning примеры курсы, MLOPS примеры курсы обучение, курсы Data Science, Horovod MLOps Databricks, ML MLOps Deep Learning Machine Learning, Deep Learning vs Machine Learning, курсы Data Scince, Machine Learning обучение примеры, машинное обучение MLOps, Machine Learning курсы Spark, Школа Больших Данных Учебный Центр Коммерсант

Из чего состоит инфраструктура глубокого обучения Databricks и как масштабировать Deep Learning для нескольких графических процессоров или распределенных вычислений. Знакомимся с очередным MLOps-инструментом под названием Horovod. Что Horovod и как его использовать в Databricks Мы уже писали, почему глубокому обучению не обойтись без MLOps-инструментов, реализующих идеи DevOps для автоматизации разработки,...

20Июл
2023

Эффективный MLOps с TAO Toolkit от NVIDIA

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps конвейер примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Сегодня познакомимся с набором инструментов TAO Toolkit от NVIDIA на основе TensorFlow и PyTorch, который позволяет получить эффективный рабочий процесс с помощью лучших практик MLOps и возможностей трансферного обучения за счет оптимизации тренировки модели и ее пропускной способности для логического вывода на целевой платформе. Что такое TAO Toolkit от NVIDIA...

12Июл
2023

Как развернуть ML-модель в production: шаблоны эффективного MLOps от Databricks

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps развертывание в производстве конвейер примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Мы уже писали, какие инструменты пригодятся MLOps-инженеру для развертывания моделей машинного обучения в производственных средах. Сегодня рассмотрим, как сделать это, используя MLOps-паттерны и средства платформы Databricks Lakehouse. MLOps в production: шаблоны развертывания на платформе Databricks MLOps представляет собой набор лучших практик и инструментов для автоматизации управления кодом, данными и моделями,...

10Июл
2023

Машинное обучение с Apache Flink: основные концепции ML-библиотеки

Автор Анна Вичуговав категории Flink, Machine Learning, Блог

Flink ML примеры курсы обучение, разработка приложений потоковой обработки данных Apache Flink, Flink примеры курсы обучение, машинное обучение с Apache Flink, MLOps машинное обучение примеры курсы, Machine Learning Flink Spark примеры курсы обучение, обучение Apache Flink Spark для дата-инженеров и NL-разработчиков, обучение Data Science, Шкоал Больших Данных Учебный Центр Коммерсант

Как построить конвейер машинного обучения с помощью библиотеки Flink ML, из каких компонентов она состоит и как работает, а также что позволяет объединить алгоритмы потоковой обработки данных Apache Flink с ML-моделями. Что такое Flink ML Помимо MLeap, библиотеки сериализации для моделей машинного обучения, Apache Flink также включает Flink ML —...

29Июн
2023

Как построить и запустить свой MLOps-конвейер с MyMLOps

Автор Анна Вичуговав категории Machine Learning, Блог

Вчера я нашла очень интересный MLOps-проект, который позволяет построить конвейер поддержки жизненного цикла системы машинного обучения, используя более 50 популярных инструментов. Что такое MyMLOps и как это пригодится ML-инженерам. Что такое MyMLOps: новый сервис для MLOps Чтобы реализовать идеи концепции MLOps автоматизации всего жизненного цикл системы машинного обучения, от подготовки...

25Май
2023

ClearML для полного MLOps: примеры и возможности

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров примеры курсы обучение, ClearML MLOps, Школа Больших Данных Учебный Центр Коммерсант

Чтобы сделать наши курсы для специалистов по Data Science и ML-инженеров еще более полезными, сегодня познакомимся с очень мощным инструментом MLOps – open-source платформой ClearML. Что это такое, как работает, насколько упрощает разработку продуктов Machine Learning, а также зачем бизнесу ClearGPT. Что такое ClearML и как это поможет MLOps-инженеру Концепция...

09Май
2023

Архитектура MLOps и управление инфраструктурой как кодом

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Из каких компонентов состоит архитектура MLOps, что такое инфраструктура как код, как управлять ею с помощью скриптов и почему это нужно на каждом этапе жизненного цикла моделей Machine Learning. Жизненный цикл ML-модели и MLOps MLOps – это набор методов и техник машинного обучения вместе с лучшими практиками разработки, развертывания и...

17Апр
2023

Статистика vs глубокое обучение для анализа данных временных рядов: что выбрать?

Автор Анна Вичуговав категории Machine Learning, Блог

анализ данных временных рядов, машинное обучение, глубокое обучение, Data Science, курсы примеры обучение Data Science Big Data анализ данных, прогнозирование временных рядов, Школа Больших Данных Учебный Центр Коммерсант

Проблемы анализа данных временных рядов и способы их решения: какие статистические методы и алгоритмы глубокого обучения лучше подходят для прогнозирования. Особенности прогнозирования временных рядов Напомним, временным рядом считается набор данных, каждая точка которого привязана ко времени (час, минуты, дни, месяцы, годы и прочие периоды). Эти данные имеют динамический характер и...

13Апр
2023

Создаем свой оператор Apache AirFlow с ChatGPT

Автор Анна Вичуговав категории AirFlow, Блог

AirFlow custom operator, ChatGPT operator Apache AirFlow, пользовательский оператор Apache AirFlow, машинное обучение дата-инженерия ChatGPT, обучение AirFlow, AirFlow операторы DAG примеры курсы обучение, обучение инженеров данных Big Data, курсы дата-инженеров, Школа Больших Данных Учебный центр Коммерсант

Недавно мы разбирали, как дата-инженеру написать собственный оператор Apache AirFlow и использовать его в DAG. Сегодня посмотрим, каким образом с этой задачей справляется модный ИИ под названием ChatGPT. GPT-генерация пользовательского оператора AirFlow Хотя Apache AirFow предоставляет множество операторов для выполнения самых разных задач, иногда дата-инженеру приходится писать свои собственные Python-классы,...

02Апр
2023

Продуктовое мышление в MLOps и метрики оценки ML-модели

Автор Анна Вичуговав категории Machine Learning, Блог

MLOPS развертывание ML в production примеры курсы обучение, курсы машинного обучения для дата-инженеров, обучение ML MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Сегодня посмотрим на MLOps с точки зрения организационного и технического управления, решив вопрос о подходе к разработке ML-системы, а также рассмотрим метрики ее оценки перед развертыванием в production. Управленческий MLOps: 2 подхода к разработке системы Machine Learning Модели машинного обучения могут показывать высокую точность работы своих алгоритмов даже на производственных...

22Мар
2023

MLOps c Kafka Streams и gRPC: 3 способа развернуть ML-модель в production

Автор Анна Вичуговав категории Kafka, Machine Learning, Блог

MLOPS примеры курсы обучение, Kafka Streams Kubernetes Machine Learning MLOps, курсы машинного обучения Kafka MLOps Kubernetes TensorFlow, gRPC Kafka TensorFlow, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Сегодня рассмотрим, как развернуть модель машинного обучения в конвейере Apache Kafka, используя потоковый API технологии удаленного вызова процедур от Google под названием gRPC и сервер ML-моделей TensorFlow Serving. Краткий ликбез по gRPC Напомним, gRPC – это технология интеграции систем, включая клиентский и серверный компоненты, основанная на удаленном вызове процедур в...

12Мар
2023

MLOps c Python-библиотекой Evidently: обнаружение дрейфа данных в ML-моделях

Автор Анна Вичуговав категории Machine Learning, Блог

дрейф данных ML-моделей Evidently Python, MLOPS примеры курсы обучение дата-инженер, курсы PySpark для дата-инженеров, обучение Python MlOps инженерия данных, Data Science ML MLOps примеры курсы обучение, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Зачем нужна Python-библиотека Evidently, и как она помогает специалистам по Data Science выявлять дрейф данных моделей Machine Learning в производственной среде. Знакомимся с еще одним MLOps-инструментом. Что такое дрейф данных, чем это опасно и как его обнаружить В отличие от многих других информационных систем, проекты машинного обучения очень сильно зависят...

06Мар
2023

Преимущества Apache HBase для метода ближайших соседей

Автор Анна Вичуговав категории HBase, Machine Learning, Блог

метод ближайших соседей машинное обучение, knn machine learning nosql HBase, обучение Data Science примеры курсы обучение, NoSQL HBase Hadoop, SQL-on_Hadoop примеры курсы обучение, HBase HDFS SQL Hadoop примеры курсы обучение, администратор дата-инженер Hadoop Hbase примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Метод ближайших соседей активно используется в машинном обучении для решения задач классификации в различных бизнес-приложениях. Познакомимся поближе с этим алгоритмом Machine Learning, а также разберем, почему NoSQL-хранилище Apache HBase отлично подходит для работы с ним. Что такое метод ближайших соседей: ликбез по Machine Learning В проектах Machine Learning и приложениях...