Базовые операции в Hbase: основы Big Data для начинающих

hadoop hive, курсы по sparksql, курсы по apache spark, курсы для инженеров данных, курсы по apache phoenix, курсы arenadata Hadoop, курсы по sparksql

В этой статье мы поговорим про основные базовые операции распределенной СУБД Hbase. Также рассмотрим применение этих операций к данным, хранящимся в этой СУБД на практических примерах. Читайте далее про базовые CRUD-операции в Hbase и их особенности.

Основные CRUD-операции в распределенной СУБД Hbase

HBase — это распределенная NoSQL столбцово-ориентированная (данные представлены в виде набора столбцов) СУБД (система управления базами данных), построенная на основе файловой системы Hadoop (HDFS). При работе с данными Hbase использует собственный Hbase-язык. Главное отличие Hbase от реляционных СУБД состоит в том, что Hbase не содержит схем данных (которые определяют типы данных таблиц). Тип данных определяется семейством столбцов, которое задается при создании. Основными операциями в Hbase являются следующие CRUD-операции [1]:

  • create — операция создания Hbase-таблиц, которая задает семейство столбцов. Каждое семейство столбцов может иметь несколько столбцов;
  • get — read-операция, которая отвечает за получение (считывание) имеющихся данных таблиц Hbase;
  • put — update-операция, отвечающая за обновление или вставку новых данных в столбец определенного семейства;
  • delete — операция отвечающая за удаление конкретного семейства. За полное удаление таблицы отвечает команда drop.

Работа с CRUD-операциями: несколько практических примеров

Для того, чтобы создать таблицу, необходимо задать имя таблицы и семейства столбцов с помощью команды create:

create 'employee', 'Personal info', 'Professional Info'

Для того, чтобы записать данные в таблицу используется команда put, которая автоматически создает столбцы указанного семейства. При вставке данных создается столбцовый ключ, который присваивается каждой отдельной записи семейства столбца:

put 'employee', 1, 'Personal info:empId', 10
put 'employee', 1, 'Personal info:Name', 'Alex'
put 'employee', 1, 'Professional Info:Dept, 'IT'
put 'employee', 2, 'Personal info:empId', 20
put 'employee', 2, 'Personal info:Name', 'Bob'
put 'employee', 2, 'Professional Info:Dept', 'Sales'

Для считывания данных отвечает команда get, которая отвечает за считывание (получение) данных по параметрам. Следующий код отвечает за получение первой записи таблицы employee семейства столбца empId семейства  Personal info:

get 'employee', 1 ,{COLUMN => 'Personal info:empId'}

В качестве операции update также используется оператор put. Следующий код отвечает за изменение значения столбца empId, который относится к семейству Personal info:

put 'employee', 1, 'Personal info:empId', 30

Для того, чтобы полностью удалить таблицу в Hbase используется команда drop:

drop 'employee'

Стоит отметить, что удалять можно не только всю таблицу целиком, но и отдельные ее записи. В качестве примера рассмотрим код, который отвечает за удаление значения столбца Name записи с ключом 1:

delete 'employee',1, 'Personal info:Name'

Из приведенного примера видно, что для удаления конкретных значений используется команда delete [2].

Администрирование кластера HBase

Код курса
HBASE
Ближайшая дата курса
18 ноября, 2024
Продолжительность
32 ак.часов
Стоимость обучения
96 000 руб.

Таким образом, благодаря поддержке CRUD-операций, Hbase обеспечивает разработчика весьма удобным и интуитивно понятным интерфейсом для работы с объектами Big Data. Это делает Hbase весьма удобным средством для работы с Big Data.

Больше подробностей про применение MongoDB в проектах анализа больших данных вы узнаете на практических курсах по NoSQL в нашем лицензированном учебном центре обучения и повышения квалификации ИТ-специалистов в Москве:

MPA: CLOUDERA IMPALA DATA ANALYTICS
ADQM: ЭКСПЛУАТАЦИЯ ARENADATA QUICKMARTS
ADBR: Arenadata DB для разработчиков
ADB: Эксплуатация Arenadata DB
HBASE: Администрирование кластера HBase
HIVE: Hadoop SQL администратор Hive
NoSQL: Интеграция Hadoop и NoSQL

Записаться на курс

Смотреть раcписание

Источники

  1. https://coderlessons.com/tutorials/bolshie-dannye-i-analitika/uznaite-hbase/hbase-kratkoe-rukovodstvo
  2. https://dataunbox.com/habse-crud/

Добавить комментарий

Поиск по сайту