Курсы Trino, ClickHouse, Airflow, Kafka, МL и ИИ Обучение

15Июн
2019

Облачный слон для больших данных: обзор 6 популярных Hadoop-решений

Автор Анна Вичуговав категории Блог, Статьи

Большие данные, Big Data, Hadoop, Apache, администрирование, инфраструктура, облака

Мы уже рассказывали про общие достоинства и недостатки облачных Hadoop-кластеров для проектов Big Data и сравнивали локальные дистрибутивы. В продолжение этой темы, в сегодняшней статье мы подготовили для вас сравнительный обзор наиболее популярных PaaS/IaaS-решений от самых крупных иностранных (Amazon, Microsoft, Google, IBM) и отечественных (Яндекс и Mail.ru) провайдеров [1]. Сравнение...

13Июн
2019

Большие слоны в облаках: плюсы и минусы облачных Hadoop-решений

Автор Анна Вичуговав категории Блог, Статьи

Продолжая опровергать мифы о Hadoop, сегодня мы расскажем о том, как и где создать облачный кластер для Big Data и почему это выгодно. Концепция облачных вычислений стала популярна с 2006 года благодаря компании Amazon и постепенно распространилась на использование внешних платформ и инфраструктуры как сервисов (Platform as a Service, PaaS,...

06Июн
2019

Как реплицировать, считать и удалить файлы в HDFS: подробности файловых операций

Автор Анна Вичуговав категории Блог, Статьи

Большие данные, Big Data, Hadoop, Apache, администрирование, инфраструктура, HDFS

Мы уже рассказывали, как большие данные (Big Data) сохраняются на диск. Сегодня поговорим о других файловых операциях в HDFS: репликации, чтении и удалении данных. За все файловые операции в Hadoop Distributed File System отвечает центральная точка кластера – сервер имен NameNode. Сами операции с конкретными файлами выполняются на локальном узле...

05Июн
2019

Как сохранить большие данные: операция записи файлов Big Data в HDFS

Автор Анна Вичуговав категории Блог, Статьи

Большие данные, Big Data, Hadoop, Apache, администрирование, инфраструктура

HDFS предназначена для больших данных (Big Data), поэтому размер файлов, которые хранится в ней, существенно выше чем в локальных файловых системах – более 10 GB [1]. Продолжая тему файловых операций и взаимодействия компонентов Hadoop Distributed File System, в этой статье мы расскажем, как осуществляется запись таких больших файлов с учетом блочного...

04Июн
2019

Как общаются друг с другом компоненты HDFS и почему это так важно для Big Data проектов

Автор Анна Вичуговав категории Блог, Статьи

кластер, Большие данные, Big Data, Hadoop, Apache, администрирование, инфраструктура

Благодаря архитектурным особенностям распределенной файловой системы Hadoop, допустимые файловые операции в ней отличаются от возможных действий с файлами на локальных системах. В этой статье мы рассмотрим файловые операции в HDFS и взаимодействие ее компонентов: узлов данных и сервера имен с клиентами - пользователями или приложениями. Файловые операции HDFS В отличие...

24Май
2019

Сложно, дорого, универсально: 3 мифа о Hadoop и их опровержения

Автор Анна Вичуговав категории Hive, Kafka, Spark, Блог, Статьи

Большие данные, Big Data, Hadoop, Apache, Cloudera, Hortonworks, администрирование, инфраструктура

Сегодня мы поговорим о заблуждениях насчет базового инфраструктурного понятия хранения и обработки больших данных – экосистеме Hadoop и развеем 3 самых популярных мифа об этой технологии. А также рассмотрим применение Cloudera, Hortonworks, Arenadata, MapR и HDInsight для проектов Big Data и машинного обучения (Machine Learning). Миф №1: Hadoop – это...

22Апр
2019

Как интернет вещей и большие данные увеличивают прибыль оффлайн-магазинов: 5 практических кейсов

Автор Анна Вичуговав категории Internet of Things, Machine Learning, Use Cases, Блог, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, ритейл, бизнес, интернет вещей, Internet Of Things, Wi-Fi, IoT

Интернет вещей (Internet Of Things) считает покупателей торговых центров, а средства больших данных (Big Data) и машинного обучения (Machine Learning) превращают эти цифры в реальную выгоду для бизнеса. Мы нашли еще 5 примеров успешного использования этих технологий в ритейле и делимся с вами опытом отечественных и зарубежных компаний. Интернет вещей...

20Апр
2019

И тебя посчитали: как интернет вещей и большие данные повышают офлайн-продажи, считая посетителей торговых центров

Автор Анна Вичуговав категории Internet of Things, Machine Learning, Use Cases, Блог, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, ритейл, бизнес, интернет вещей, Internet Of Things, Wi-Fi, распознавание лиц

Мы уже описывали, как американская торговая сеть Macy’s успешно использует интернет вещей (Internet Of Things) для персонализированного маркетинга. Bluetooth-маячок определяет местоположение посетителя в магазине с точностью до нескольких сантиметров и подает сигнал в корпоративную CRM-систему. CRM отправляет клиенту на смартфон предложение со скидкой на товар, ближайший к потребителю в данный момент [1]. Сегодня мы...

18Апр
2019

Зачем менеджеру язык программирования R: 7 причин освоить аналитический инструмент Big Data и Machine Learning

Автор Анна Вичуговав категории Machine Learning, Блог, Статьи

Big Data, Большие данные, машинное обучение, Machine Learning, язык программирования R, программирование, бизнес, люди, маркетинг, HR, управление

Мы уже рассказывали, зачем HR-специалисту большие данные, как Big Data и Machine Learning помогают PR-менеджеру в управлении корпоративной репутацией, а маркетологу в формировании персональных рекламных предложений. Сегодня поговорим об одном из средств реализации этих и других бизнес-задач – языке программирования R и рассмотрим 7 причин, почему вам необходимо освоить этот...

15Апр
2019

Big Data и Machine Learning в HR: еще 5 примеров успешного использования информационных технологий для управления человеческими ресурсами

Автор Анна Вичуговав категории Machine Learning, Use Cases, Блог, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, HR, бизнес, люди

Недавно мы рассказывали, зачем HR-специалисту большие данные, как быстро и эффективно внедрить Big Data в управление персоналом, а также описывали случаи интеллектуального рекрутинга с помощью машинного обучения. В продолжение этой темы сегодня мы приготовили для вас 5 интересных кейсов от отечественных и зарубежных компаний по 3 HR-направлениям: управление талантами, повышение...

13Апр
2019

Интеллектуальный автоматизированный рекрутинг: Big Data и Machine Learning в HR

Автор Анна Вичуговав категории Machine Learning, Use Cases, Блог, Цифровая трансформация

Мы уже описывали, зачем HR-специалисту большие данные, а также как быстро и эффективно внедрить Big Data в управление персоналом на практике. Сегодня расскажем о конкретных случаях применения этих технологий в HR: успешные кейсы отечественных и зарубежных компаний. Роботы-рекрутеры Сервис автоматизированного рекрутинга, разработанный российской компанией Stafory, позволяет в 10 раз сократить...

12Апр
2019

Умный HR: как быстро внедрить Big Data и Machine Learning в управление человеческими ресурсами

Автор Анна Вичуговав категории Use Cases, Блог, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, CRISP-DM, PDCA, HR, бизнес, люди, внедрение

Как быстро и эффективно внедрить Big Data и Machine Learning в прикладную область бизнеса для решения практических задач, избежав популярных ошибок Data Scientist - разбираемся на примере HR-направления. Подготовка к внедрению Big Data в HR и не только Зачем HR-специалисту большие данные и какую пользу они принесут управленческим процессам и...

09Апр
2019

Как и зачем HR использует Big Data: технологии больших данных в управлении человеческими ресурсами

Автор Анна Вичуговав категории Блог, Цифровая трансформация

Big Data, Большие данные, HR, бизнес, люди, Data Mining

Как измерить управленческий опыт, предсказать и предотвратить профессиональное выгорание, быстро найти подходящего кандидата и сформировать высокоэффективную команду с помощью Big Data – разбираемся в HR-аналитике и других важных вопросах «умного» управления персоналом. Откуда в HR большие данные ? Согласно исследованию аудиторской компании KPMG, Big Data используются примерно в 60% HR-департаментов различных организаций...

07Апр
2019

Big Data и блокчейн: комбо или противостояние?

Автор Анна Вичуговав категории Use Cases, Блог, Статьи

Big Data, Большие данные, блокчейн, обработка данных, blockchain, block chain, распределенный реестр

Сегодня большие данные и технологии распределенного реестра до сих пор являются самыми популярными ИТ-темами. Возможности их внедрения в каждую прикладную сферу, от банковской отрасли до медицины, обсуждаются на конференциях всех уровней, корпоративных совещаниях и государственных советах [1]. Принесет ли объединение Big Data и блокчейн дополнительные бонусы, в каких случаях не...

04Апр
2019

20 проблем для Data Scientist, от которых не спасет CRISP-DM

Автор Анна Вичуговав категории Machine Learning, Блог, Цифровая трансформация

машинное обучение, Machine Learning, обработка данных, Big Data, Большие данные, статистика, Data Science, Data Scientist

Иван Гуз, директор по аналитике и клиентскому сервису Avito, 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе компании [1] рассказал о самых главных проблемах, которые подстерегают исследователя данных на практических проектах и от чего не убережет даже подробно проработанный стандарт CRISP-DM. Из его...

02Апр
2019

Автор Анна Вичуговав категории Machine Learning, Блог, Цифровая трансформация

машинное обучение, Machine Learning, CRISP-DM, обработка данных, Big Data, Большие данные, статистика

Посмотрев выступление Станислава Гафарова [1], руководителя направления по развитию ИТ-систем АО «СберТех», от 24.04.2018 на митапе AI Community и AI Today для специалистов по Data Science в офисе Авито [2], мы составили ТОП-7 ошибок при работе с данными по методологии CRISP-DM. На основании жизненного цикла работы с информацией по стандарту...

28Мар
2019

Большие данные и машинное обучение в аэропортах: 7 практических примеров в России и за рубежом

Автор Анна Вичуговав категории Machine Learning, Use Cases, Блог, Распознавание лиц, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, транспорт, авиация, самолеты, аэропорты

Как большие данные и машинное обучение меняют современные аэропорты, обеспечивая безопасность, повышая продажи, управляя движением пассажиропотоков и самолетов: какие технологии успешно используется и что нас ждет в будущем – смотрим кейсы внедрения Big Data и Machine Learning в отечественных и зарубежных аэровокзалах. 1. Большие данные и машинное обучение обеспечивают безопасность...

26Мар
2019

Большие данные в авиации: 4 кейса применения Big Data в аэропортах и самолетах

Автор Анна Вичуговав категории Machine Learning, Use Cases, Блог, Распознавание лиц, Цифровая трансформация

Как большие данные и машинное обучение используется авиакомпаниями и аэропортами для обеспечения безопасности полетов, технического обслуживания самолетов и изучения клиентских предпочтений: разбираемся на примерах внедрения технологий Big Data и Machine Learning в отечественную и зарубежную авиаиндустрию. 1. Большие данные для обеспечения безопасности полетов, взлетов и посадок Технологии Big Data позволяют...

24Мар
2019

Как происходит цифровизация: 4 шага к эффективному бизнесу

Автор Анна Вичуговав категории Блог, Цифровая трансформация

Цифровизация, цифровая экономика, цифровая трансформация, digitalization

Как начинается цифровая трансформация, что и в какой последовательности необходимо сделать, чтобы корпоративная цифровизация завершилась успехом – разбираем этапы работ: от планирования к реализации. 1. Нарисуйте идеальный портрет своего цифрового предприятия Чтобы цифровизация не превратилась в банальную автоматизацию текущей деятельности (чем отличаются эти 2 понятия, мы подробно рассказывали здесь), необходима...

21Мар
2019

Почему вы не используете большие данные: разоблачаем 4 главных предубеждения о Big Data

Автор Анна Вичуговав категории Machine Learning, Use Cases, Блог, Цифровая трансформация

Big Data, Большие данные, машинное обучение, Machine Learning, маркетинг, churn rate, клиент, реклама, бизнес

Правда ли, что Большие Данные – это сложно, долго, дорого и нужно далеко не всем: анализируем и опровергаем причины отказа от использования Big Data в бизнесе любого масштаба, от крупного до малого. 1. Большие данные нам не актуальны Даже если вы производите товары вручную или оказываете индивидуальные услуги, для вас...