В этой статье поговорим про интеграцию информационных систем: обсудим SOA и ESB-подходы, рассмотрим стриминговую архитектуру и возможности Apache Kafka для организации быстрого и эффективного обмена данными между различными бизнес-приложениями. Также обсудим, что влияет на архитектуру интеграции корпоративных систем и распределенных Big Data приложений, что такое спагетти-структура и почему много сервисов...
Аналитика больших данных в Elasticsearch: возможности Machine Learning в ELK Stack
В этой статье рассмотрим несколько примеров по аналитике больших данных в Elasticsearch (ES), а также разберем возможности алгоритмов машинного обучения в ELK Stack. Читайте, как использовать NoSQL-СУБД ES в качестве озера данных для проверки различных бизнес-гипотез с помощью Machine Learning, показывая результаты моделирования в интерфейсе Kibana: практическая аналитика Big Data....
Завод, телеком и госсектор: 3 примера внедрения Arenadata
В этой статье мы продолжим рассказывать про практическое использование отечественных Big Data решений на примере российского дистрибутива Arenadata Hadoop (ADH) и массивно-параллельной СУБД для хранения и анализа больших данных Arenadata DB (ADB). Сегодня мы приготовили для вас еще 3 интересных кейса применения этих решений в проектах цифровизации бизнеса и государственном...
От банков до Газпрома: 4 крупных успеха Arenadata – интересные кейсы за последнюю пару лет
Сегодня мы поговорим про продукты компании Arenadata – отечественного разработчика дистрибутива Apache Hadoop (ADH), массивно-параллельной СУБД для хранения и анализа больших данных Arenadata DB (ADB) и других Big Data платформ. Читайте в нашей статье, где внедрены эти решения и какую пользу они уже успели принести бизнесу. Облака и банк: 3...
Как спроектировать КХД: 4 метода моделирования данных для архитектора Big Data
Сегодня мы поговорим о проектировании архитектуры корпоративных хранилищ данных (КХД) и рассмотрим, какие методы и инструменты используются для моделирования структуры DWH и динамики ETL-процессов. В этой статье про основы Data Modelling разберем, что такое OLAP и OLTP, почему 3-я нормальная форма стала стандартом в SQL-СУБД, чем схемы звезды отличается от...
Data Lake на 5-ку: озеро данных для зрелой компании
В этой статье рассмотрим 5 уровней управленческой зрелости бизнес-процессов компании и особенности построения озера данных (Data Lake) на каждом из них. Читайте дальше, что такое CMMI и при чем здесь большие данные (Big Data). CMMI: зрелость процессов для технологий Big Data Примерно с 2013 года тема технологий Big Data преподносится...
Новый курс по безопасности озера данных Hadoop
Знакомство с расширенными возможностями обеспечения безопасности озера данных под управлением Apache Ambari и Apache Ranger дистрибутива HortonWorks или Arenadata Hadoop. На протяжении 3 дней практического обучения вы рассмотрите вопросы установки и настройки эшелонированной защиты- безопасности озера данных (Data Lake security) Hadoop под управлением дистрибутива Hadoop компании HortonWorks с использованием протоколов...