Apache Flink для пакетной и потоковой обработки Big Data в больших компаниях: примеры Pinterest и Alibaba Group

Сегодня рассмотрим пару кейсов по использованию Apache Flink в качестве основного фреймворка пакетной и потоковой аналитики больших данных. Читайте далее, как фото-хостинг Pinterest построил вокруг Flink собственную инфраструктуру работы с изображениями в реальном времени, а китайский ритейл-гигант Alibaba Group успешно обрабатывал 7 ТБ в секунду во время глобального дня шопинга....

Как рассчитать конверсию контекстной рекламы с помощью Apache Flink SQL: практический пример

Реклама является одним из наиболее крупных сегментов практического применения технологий Big Data. Поэтому сегодня рассмотрим, как Flink SQL реализует потоковую аналитику больших данных в AdTech-кейсах. Разбираем пример JOIN-соединения двух потоков событий - показов и кликов, чтобы вычислить конверсию рекламной кампании средствами Apache Flink или Spark. Потоки Big Data за фасадом...

Как подготовить датасет к Machine Learning с PySpark и построить систему потоковой аналитики больших данных на Apache Kafka и ELK: пример прогнозирования CTR

В продолжение разговора о применении технологий Big Data и Machine Learning в рекламе и маркетинге, сегодня рассмотрим архитектуру системы прогнозирования конверсии рекламных объявлений. Читайте далее, как организовать предиктивную аналитику больших данных на Apache Kafka и компонентах ELK-стека (Elasticsearch, Logstash, Kibana), почему так важно тщательно подготовить данные к машинному обучению, какие...

Что под капотом ретаргетинга: прогнозирование намерений пользователя с Apache Hadoop и Spark Structured Streaming на сервисах Amazon

Мы уже рассказывали о возможностях ретаргетинга и использовании Apache Spark Structured Streaming для реализации этого рекламного подхода на примере Outbrain. Такое применение технологий Big Data сегодня считается довольно распространенным. Чтобы понять, как это работает на практике, рассмотрим кейс маркетинговой ИТ-компании MIQ, которая запускает Spark-приложения на платформе Qubole и сервисах Amazon,...

Веб-реклама, ретаргетинг и проблемы потоковой аналитики больших данных с Apache Kafka, Spark Streaming и Druid: кейс платформы Outbrain

Современная аналитика больших данных ориентируется на обработку Big Data в реальном времени. Такие вычисления «на лету» позволяют в режиме онлайн узнавать о критически важных производственных показателях и оперативно понимать клиентские потребности. Это существенно ускоряет и автоматизирует цикл принятия управленческих решений в соответствии с требованиями сегодняшнего бизнеса. Обычно для реализации архитектуры...

Что такое лямбда-архитектура: основы Big Data для начинающих

Рассматривая основы больших данных, сегодня мы расскажем лямбда-архитектуру, одну из двух главных подходов к построению Big Data систем. Читайте в нашей статье, зачем нужна эта концепция и как она работает, а также при чем тут машинное обучение, интернет вещей, Apache Spark и Hadoop. Что такое Лямбда-архитектура и зачем она нужна...

Почему вы не используете большие данные: разоблачаем 4 главных предубеждения о Big Data

Правда ли, что Большие Данные – это сложно, долго, дорого и нужно далеко не всем: анализируем и опровергаем причины отказа от использования Big Data в бизнесе любого масштаба, от крупного до малого. 1. Большие данные нам не актуальны Даже если вы производите товары вручную или оказываете индивидуальные услуги, для вас...

Большие данные (Big Data) в малом бизнесе: миф или реальность

Зачем малому бизнесу большие данные, где их взять и как использовать, минимизировав затраты на внедрение сложных технологий – разбираемся на практических примерах. Откуда большие данные (Big Data) в малом бизнесе и зачем они нужны Представьте удивление своего клиента, когда он, только переступив порог вашей уютной кофейни или семейной гостиницы, будет...

Монетизация Big Data: 4 способа заработать на больших данных вашего бизнеса

Превращаем большие данные в большие деньги: 4 важных бизнес-действия, которые вам помогут сделать технологии Big Data. 1. Монетизация знаний о клиентах: персонализация маркетинга Здесь мы уже рассказывали о том, что потребитель не хочет быть безликой единицей вашей целевой аудитории – клиенту нужны и важны рекламные предложения только по той продукции,...

Как большие данные (Big Data) убивают типичного клиента или почему вам срочно нужен персональный маркетинг

Как меняется маркетинг в эпоху социальных сетей и больших данных (Big Data) и чем это поможет вашему бизнесу: рассматриваем практические примеры персонализации рекламных предложений. Новый маркетинг: почему вашего типичного клиента больше нет Описывая портрет своего потенциального клиента, традиционный маркетинг попадает в ловушку обобщения. Например, целевая аудитория продукта: домохозяйки с маленькими...

Поиск по сайту