Публикации с меткой Data Science

24Ноя
2023

Кластерный анализ графов с медоидами: алгоритм k-medoids

Автор Анна Вичуговав категории Machine Learning, Neo4j, Блог

анализ графов, Data Science, Graph Data Science, k-medoids, обучение аналитиков данных, Школа Больших Данных УЦ Коммерсант

Что такое алгоритм k-medoids, чем он отличается от k-means и как этот метод кластеризации применяется для анализа графов: принципы и инструменты. Что такое медоид и как устроен алгоритм кластеризации k-medoids Кластеризация — это метод машинного обучения для поиска кластеров или сообществ в наборе данных. Цель в том, чтобы найти кластеры,...

13Ноя
2023

Что такое LLMOps или MLOps для больших языковых моделей

Автор Анна Вичуговав категории Machine Learning, Блог

машинное обучение примеры курсы MLOps, курсы по MLOps, MLOps LLM LLMOpa, курсы ML Machine Learning Data Science, обучение инженеров Big Data, инженерия больших данных, Школа Больших Данных Учебный центр Коммерсант

Зачем управлять трансферным обучением больших языковых моделей и что входит в это управление: знакомимся с расширением MLOps для LLM под названием LLMOps. Что такое LLMOps Большие языковые модели, воплощенные в генеративных нейросетях (ChatGPT и прочие аналоги), стали главной технологией уходящего года, которая уже активно используется на практике как частными лицами,...

10Ноя
2023

Вместо Neosemantics: обзор Python-библиотеки rdflib-neo4j для графовой СУБД Neo4j

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

Neo4j Python RDF rdflib-neo4j, RDF триплеты графы Neo4j Neosemantics, графовые алгоритмы на больших данных примеры курсы обучение, графы графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j Neosemantics RDF курсы, NoSQL Neo4j Neosemantics для архитекторов аналитиков инженеров данных и разработчиков, NoSQL Neo4j Neosemantics RDF Data Science, хранение и аналитика больших данных графовые базы данных NoSQL, Школа Больших Данных Учебный центр Коммерсант

Что не так с Neosemantics и зачем нужна очередная библиотека для Neo4j: знакомство с Python-пакетом для RDF-графов rdflib-neo4j. Возможности, ограничения и пример использования. Что не так с Neosemantics и зачем нужна очередная библиотека для Neo4j Что такое RDF-графы, триплеты и плагин Neosemantics для работы с этими концепциями в графовой СУБД...

17Окт
2023

Машинное обучение с Greenplum: обзор ML-расширений

Автор Анна Вичуговав категории Greenplum, Machine Learning, Блог

машинное обучение Greenplum и PostgreSQL, расширения Greenplum и PostgreSQL, ИИ и векторные СУБД, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Как использовать Greenplum в проектах машинного обучения: знакомимся с расширением PostgresML и модулем pgvector. Возможности и ограничения плагинов, превращающих MPP-СУБД в полноценный MLOps-инструмент. Как превратить Greenplum в векторную базу данных с расширением pgvector Будучи вариацией PostgreSQL с механизмами массово-параллельной загрузки, Greenplum отлично справляется с огромным объемом данных. Однако, к хранилищам...

09Окт
2023

Автоматизированное тестирование в MLOps: что и как проверять?

Автор Анна Вичуговав категории Machine Learning, Блог

тестирование ML, fdnjntcnbhjdfybt Ьфсршту дуфктштпб vfibyyjt j,extybt ntcnbhjdfybt ьДЩзыб обучение MLOps , курсы MLOps , обучение Machine Learning, Machine Learning курсы примеры, Machine Learning MLOps , машинное обучение примеры курсы, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Мы уже писали про особенности тестирования систем машинного обучения. Чтобы не повторяться, сегодня рассмотрим фреймворки для реализации идей MLOps, а также рассмотрим, какие тесты должны быть пройдены для проверки работоспособности ML-продукта. 3 категории тестов для ML-систем Согласно концепции MLOps, полный конвейер разработки включает в себя три основных компонента: конвейер данных,...

17Сен
2023

RAG-приложения и Neo4j: поддержка векторного индекса для LLM

Автор Анна Вичуговав категории Machine Learning, Neo4j, NoSql, Блог

векторная индексация в Neo4j, графы и машинное обучение, LLM и RAG, LLM RAG большие языковые модели примеры курсы обучение, Neo4j RAG LLM, Machine Learning Deep Learning, ИИ графы и векторные СУБД, машинное обучение, nosql Neo4j ML, обучение Data Science примеры курсы обучение, NoSQL векторные базы данных ИИ примеры курсы обучение, MLOps архитектура больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Что не так с большими языковыми моделями, как RAG-приложения расширяют возможности LLM и зачем в графовой СУБД Neo4j добавлена поддержка векторного индекса. Зачем нужны RAG-приложения: ограничения базовых LLM-сетей С появлением ChatGPT и других генеративных нейросетей, большие языковые модели (LLM, Large Language Models) стали активно применяться для решения множества бизнес-задач, связанных...

03Сен
2023

Инструменты для ETL и миграций графовой базы данных Neo4j

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

миграция базы данных ETL NoSQL Neo4j примеры курсы обучение, графы Neo4j ETL, графовые алгоритмы на больших данных примеры курсы обучение, графы графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j курсы, NoSQL Neo4j для архитекторов аналитиков инженеров данных и разработчиков, NoSQL Neo4j Data Science, хранение и аналитика больших данных графовые базы данных NoSQL, Школа Больших Данных Учебный центр Коммерсант

Как организовать миграцию схемы Neo4j и импортировать в графовую базу данные из реляционных систем. Знакомимся с инструментами проекта Neo4j Labs: Neo4j-ETL и Neo4j-Migrations. Как работает Neo4j-ETL В рамках развития своих продуктов, таких как графовая СУБД Neo4j и экосистема элементов вокруг нее (Graph Data Science, Neo4j Bloom, Neo4j Browser и пр.),...

31Авг
2023

MLOps для ИИ: AI-шлюз в MLflow

Автор Анна Вичуговав категории Machine Learning, Блог

MLflow AI Gateway, LLM AI MLOps, MLOPS примеры курсы обучение, MLflow примеры курсы обучение, курсы MLOps MLFlow Machine Learning DevOps Для дата-инженеров, MLFlow MLOps, обучение инженеров Machine Learning, Школа Больших Данных Учебный Центр Коммерсант

Зачем разработчики MLflow внедрили в этот MLOps-фреймворк инструмент оптимизации использования и управления различными провайдерами больших языковых моделей, чем он полезен и как использовать AI Gateway от Databricks. Что такое MLflow AI Gateway и зачем это нужно Напомним, MLflow от Databricks представляет собой платформу с открытым исходным кодом, которая помогает управлять...

25Авг
2023

Зачем вам Neosemantics: RDF-триплеты в Neo4j

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

RDF триплеты графы Neo4j Neosemantics, графовые алгоритмы на больших данных примеры курсы обучение, графы графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j Neosemantics RDF курсы, NoSQL Neo4j Neosemantics для архитекторов аналитиков инженеров данных и разработчиков, NoSQL Neo4j Neosemantics RDF Data Science, хранение и аналитика больших данных графовые базы данных NoSQL, Школа Больших Данных Учебный центр Коммерсант

Что такое триплеты, чем они отличаются от обычных графов свойств и где используются на практике. Знакомимся с RDF и возможностями графовой СУБД Neo4j работать с этой структурой описания веб-ресурсов с помощью плагина Neosemantics. Что такое триплеты и при чем здесь RDF Триплеты (triples) — это текстовый формат, используемый для хранения...

24Авг
2023

Шаблон стека MLOps-инструментов и ТОП-5 практик его внедрения

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps инструменты проектирование конвейера примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Как внедрить ключевые идеи MLOps и определиться с набором инструментов для непрерывной разработки и поставки систем машинного обучения. Лучшие практики и шаблон представления техстека. С чего начать: определение структуры проекта Напомним, концепция MLOps ориентирована на устранение организационных и технических разрывов между разнопрофильными участниками процессов создания систем машинного обучения. Когда речь...

16Авг
2023

Гиперграфы и их реализация в HyperGraphDB

Автор Анна Вичуговав категории NoSql, Блог

гипеграфы HyperGraphDB, графовые алгоритмы на больших данных примеры курсы обучение, графы графовые базы данных СУБД NoSQL примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j HyperGraphDB курсы, NoSQL Neo4j HyperGraphDB для архитекторов аналитиков инженеров данных и разработчиков, NoSQL Neo4j HyperGraphDB Data Science, хранение и аналитика больших данных графовые базы данных NoSQL, Школа Больших Данных Учебный центр Коммерсант

Чем гиперграфы отличаются от обычных графов знаний, где они используются на практике и как эта математическая концепция поддерживается в NoSQL-СУБД HyperGraphDB. Что такое гиперграф Гиперграф — это графовая модель данных, в которой отношения (гиперребра) могут соединять любое количество заданных узлов. Можно сказать, что это обобщение графа, в котором каждым ребром...

15Авг
2023

Стандартизация MLOps с CRISP-ML

Автор Анна Вичуговав категории Machine Learning, Блог

CRISP-ML(Q) MLOps, курсы по цифровизации, обучение цифровизации, машинное обучение и аналитика больших данных для руководителей курсы, курс по машинному обучению для менеджеров, автоматизация машинного обучения, Machine Learning Operations CRISP-ML(Q), MLOps методология инструменты примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Что представляет собой межотраслевой стандартный процесс машинного обучения CRISP-ML(Q), из каких этапов и задач он состоит, а также как согласуется с концепцией MLOps. Что такое CRISP-ML(Q) и при чем здесь MLOps Стандартизация подходов и процессов позволяет унифицировать и масштабировать лучшие практики управления исследованиями и разработкой, в т.ч. распространяя их на...

13Авг
2023

Архитектура данных в TSDB-решениях для анализа временных рядов

Автор Анна Вичуговав категории NoSql, Блог

архитектура больших данных, TSDB Time Series DataBase базы данных временных рядов, NoSQL для анализа данных временных рядов, обучение Data Science примеры курсы обучение, NoSQL базы данных временных рядов анализ данных примеры курсы обучение, администратор дата-инженер архитектор больших данных примеры курсы обучение, Школа Больших Данных Учебный Центр Коммерсант

Чем базы данных временных рядов отличаются от реляционных и key-value хранилищ, какова модель данных для хранения метрик, значения которых меняются во времени, какие решения этой категории NoSQL-СУБД сегодня популярны на рынке и для чего они используются. Что такое база данных временных рядов и где она используется Как и следует из...

30Июл
2023

3 новых графовых алгоритма в Neo4j: новинки 2023

Автор Анна Вичуговав категории Neo4j, NoSql, Блог

графовые алгоритмы Neo4j , обучение Neo4j graph data science курсы примеры, курсы дата-аналитик Neo4j примеры обучение, обучение аналитике больших данных, Neo4j задачи на графах бизнес приложения примеры, поиск путей и выявление сообществ Neo4j, обучение большим данным, Школа Больших Данных Учебный Центр Коммерсант

Как включить отрицательные веса в поиск пути, выявлять центральные и периферийные кластеры на основе заданной плотности, а также делать выборки из больших графов для масштабирования машинного обучения. Знакомимся с графовыми алгоритмами, недавно добавленными в библиотеку Neo4j Graph Data Science 2.4: декомпозиция K-ядра, алгоритм кратчайшего пути Беллмана-Форда и случайное блуждание с...

28Июл
2023

Horovod на Databricks для MLOps в глубоком обучении

Автор Анна Вичуговав категории Machine Learning, Блог

глубокое обучение Deep Learning примеры курсы, MLOPS примеры курсы обучение, курсы Data Science, Horovod MLOps Databricks, ML MLOps Deep Learning Machine Learning, Deep Learning vs Machine Learning, курсы Data Scince, Machine Learning обучение примеры, машинное обучение MLOps, Machine Learning курсы Spark, Школа Больших Данных Учебный Центр Коммерсант

Из чего состоит инфраструктура глубокого обучения Databricks и как масштабировать Deep Learning для нескольких графических процессоров или распределенных вычислений. Знакомимся с очередным MLOps-инструментом под названием Horovod. Что Horovod и как его использовать в Databricks Мы уже писали, почему глубокому обучению не обойтись без MLOps-инструментов, реализующих идеи DevOps для автоматизации разработки,...

22Июл
2023

Что такое GQL и при чем здесь Cypher: новый стандарт языка запросов к графам

Автор Анна Вичуговав категории NoSql, Блог

графы примеры курсы обучение, обработка графовых данных в NoSQL, язык запросов к графам, стандарт SQL для графовых баз данных, NoSQL графы примеры курсы обучение, обучение большим данным курсы, GQL для инженеров данных и и разработчиков, графовые алгоритмы, Школа Больших Данных Учебный центр Коммерсант

Кто и зачем создает аналог SQL для запросов к графовым базам данных, когда выйдет официальная версия стандарт и при чем здесь Cypher из Neo4j. Что такое GQL и кто его разрабатывает В рамках продвижения нашего курса по графовым алгоритмам в бизнес-приложениях мы часто рассказываем про инструменты хранения и анализа графовых...

20Июл
2023

Эффективный MLOps с TAO Toolkit от NVIDIA

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps конвейер примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Сегодня познакомимся с набором инструментов TAO Toolkit от NVIDIA на основе TensorFlow и PyTorch, который позволяет получить эффективный рабочий процесс с помощью лучших практик MLOps и возможностей трансферного обучения за счет оптимизации тренировки модели и ее пропускной способности для логического вывода на целевой платформе. Что такое TAO Toolkit от NVIDIA...

13Июл
2023

Что такое BioCypher: возможности Neo4j для биомедицины

Автор Анна Вичуговав категории Machine Learning, Neo4j, NoSql, Блог

Data Science биомедицины Neo4j BioCypher Biolink, графовые базы данных СУБД NoSQL в биомедицине примеры курсы обучение, обработка графовых данных графы, обучение NoSQL Neo4j, обучение NoSQL Neo4j курсы, NoSQL Neo4j для инженеров данных и и разработчиков, NoSQL Neo4j Data Science, хранение и аналитика больших данных графовые базы данных NoSQL Neo4j, Школа Больших Данных Учебный центр Коммерсант

Зачем биомедикам понадобился свой язык описания онтологий, как эти задачи решает BioCypher и при чем здесь Neo4j: практическое приложение Data Science и графовых алгоритмов в биомедицинской сфере. Что такое BioCypher Графовые алгоритмы активно применяются в биомедицине для анализа различных биологических данных, таких как геномные, протеомные, данные о белковых взаимодействиях и...

12Июл
2023

Как развернуть ML-модель в production: шаблоны эффективного MLOps от Databricks

Автор Анна Вичуговав категории Machine Learning, Блог

MLOps развертывание в производстве конвейер примеры курсы обучение, курсы дата-инженеров ML, Machine Learning для инженеров и архитекторов примеры курсы обучение, архитектура и инфраструктура MLOps, Школа Больших Данных Учебный Центр Коммерсант

Мы уже писали, какие инструменты пригодятся MLOps-инженеру для развертывания моделей машинного обучения в производственных средах. Сегодня рассмотрим, как сделать это, используя MLOps-паттерны и средства платформы Databricks Lakehouse. MLOps в production: шаблоны развертывания на платформе Databricks MLOps представляет собой набор лучших практик и инструментов для автоматизации управления кодом, данными и моделями,...

29Июн
2023

Как построить и запустить свой MLOps-конвейер с MyMLOps

Автор Анна Вичуговав категории Machine Learning, Блог

Вчера я нашла очень интересный MLOps-проект, который позволяет построить конвейер поддержки жизненного цикла системы машинного обучения, используя более 50 популярных инструментов. Что такое MyMLOps и как это пригодится ML-инженерам. Что такое MyMLOps: новый сервис для MLOps Чтобы реализовать идеи концепции MLOps автоматизации всего жизненного цикл системы машинного обучения, от подготовки...