Продвигая наши курсы по Greenplum и Arenadata DB, сегодня рассмотрим, что представляет собой облачная платформа VMware Tanzu Greenplum, где ее можно развернуть и каковы преимущества cloud-решения по сравнению с локальной версией этой MPP-СУБД.
Что такое VMware Tanzu Greenplum и чем это отличается от open-source версии
Напомним, в 2020 году корпорация VMware приобрела компанию Pivotal, которая была вендором массивно-параллельной реляционной СУБД Greenplum (GP) с 2012 года. Теперь GP коммерциализируется под торговой маркой VMware Tanzu Greenplum, обеспечивая мощную и быструю и аналитику больших данных петабайтных объемов. Благодаря наличию GPORCA, продвинутого оптимизатора на основе затрат, VMware Tanzu Greenplum обеспечивает очень высокую производительность аналитических SQL-запросов для больших объемов данных.
При том, что Greenplum представляет собой несколько взаимосвязанных экземпляров объектно-реляционной СУБД PostgreSQL, объединенных в кластер по принципу без разделения ресурсов (Shared Nothing), она существенно отличается от Postgres архитектурными особенностями и сценариями использования. PostgreSQL отлично подходит для не слишком нагруженных OLTP-систем и небольших аналитических кейсов, Greenplum специально оптимизирована для аналитики больших данных. А в OLTP-сценариях, требующих практически мгновенного отклика, внутренние коммуникации между мастером и сегментами кластера Greenplum становятся источником дополнительных накладных расходов, увеличивая время выполнения SQL-запроса. Подробнее об этом мы писали в отдельной статье.
Адаптировав код open-source проекта Greenplum к корпоративным потребностям, компания VMware продолжает развивать это решение с учетом современных тенденций рынка Big Data. В частности, тренд на перевод локальной ИТ-инфраструктуры в облака. Именно для этого в августе 2021 году вышла облачная версия платформы VMware Tanzu Greenplum, которую можно развернуть на любой из основных площадок популярных Cloud-провайдеров: Amazon Web Services, Google Cloud Platform и Microsoft Azure.
Пользователи Greenplum для развертывания этой платформы в облачном сервисе теперь могут выбирать наиболее удобный для себя вариант в зависимости от остальных компонентов своей ИТ-инфраструктуры и стоимости. По сравнению с локальной версией Greenplum, такое облачное развертывание дает целый ряд преимуществ, которые мы рассмотрим далее. А в нашей новой статье вы узнаете преимущества автоматизации развертывания Arenadata DB с ADCM. О новинках свежего релиза GP 6.20 мы рассказываем здесь.
Greenplum для инженеров данных и аналитиков данных
Код курса
GPDE
Ближайшая дата курса
27 января, 2025
Продолжительность
24 ак.часов
Стоимость обучения
72 000 руб.
5 преимуществ облачного развертывания GP
С точки зрения бизнеса любое ИТ-решение должно не только корректно решать задачи, реализуя функциональные требования, но и быть экономически эффективным. Главной метрикой этого является совокупная стоимость владения (TCO, Total Cost Ownership). В случае облачного развертывания Greenplum это достигается благодаря следующим аспектам:
- отсутствие затрат на локальную инфраструктуру и собственный дата-центр — инфраструктура полностью находится в области ответственности облачного провайдера. Клиент не тратит деньги и время на покупку оборудования и ПО, а также управление ими. Типовые процедуры и инструменты автоматизированного развертывания обеспечивают быстрый и безопасный запуск независимо от времени, места и размера системы.
- Оптимизация производительности — облачная платформа предварительно настроена для наилучшей производительности по каждой площадке самых популярных Cloud-провайдеров (Amazon Web Services, Microsoft Azure и Google Cloud Platform), с учетом типовых конфигураций ОС, памяти, диска и сети. Шаблоны и образы вычислительных узлов проверяются каждым провайдером облачных услуг, а данные при хранении шифруются.
- 2 варианта оплаты за реальное потребление. Возможно использование существующих лицензий VMware Tanzu Greenplum (BYOL, Bring Your Own License), когда облачная платформа принимает для развертывания существующую локальную лицензию Greenplum на основе ядра, а клиенты получают такую же поддержку, как и при локальном развертывании. Также есть вариант почасовой оплаты (Hourly), когда VMware Tanzu Greenplum Cloud предоставляет лицензию по запросу для клиентов, которые хотят развернуть систему в общедоступной облачной среде без наличия действующей лицензии.
- Гибкое масштабирование – облачная инфраструктура позволяет легко увеличивать или уменьшать масштаб вычислений и хранилища пользовательского экземпляра в любое время независимо друг от друга, сохраняя устойчивость к сбоям оборудования, резервному копированию моментальных снимков и восстановлению.
Как показал экспресс-анализ клиентских отзывов на сайтах облачных провайдеров, многие компании из разных секторов экономики (телекоммуникации, ритейл, ИТ) уже по достоинству оценили облачную платформу VMware Tanzu Greenplum. Однако, администраторы и дата-инженеры отмечают некоторые сложности в ежедневной работе с этой MPP-СУБД, такие как:
- поддержка больших таблиц, к которым одновременно обращается множество пользователей;
- отдельные проблемы после обновления;
- отсутствие встроенных функций обслуживания типа автоматической очистки (vacuum);
- сложность настройки производительности;
- неожиданное поведение оптимизатора в некоторых кейсах;
- отсутствие колоночного режима для запросов;
- отсутствие встроенного агента метаданных таблиц в памяти о сегментах, которые будут использоваться для выполнения запроса.
Код курса
ADB
Ближайшая дата курса
по запросу
Продолжительность
ак.часов
Стоимость обучения
0 руб.
Освойте на практике, как избежать этих недостатков или смягчить их последствия с помощью специальных приемов администрирования и эксплуатации Greenplum с Arenadata DB для эффективного хранения и аналитики больших данных на специализированных курсах в нашем лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве:
- Greenplum для инженеров данных
- Greenplum для инженеров данных
- Администрирование Greenplum / Arenadata DB
Источники