В этой статье мы поговорим про основные базовые операции распределенной СУБД Hbase. Также рассмотрим применение этих операций к данным, хранящимся в этой СУБД на практических примерах. Читайте далее про базовые CRUD-операции в Hbase и их особенности.
Основные CRUD-операции в распределенной СУБД Hbase
HBase — это распределенная NoSQL столбцово-ориентированная (данные представлены в виде набора столбцов) СУБД (система управления базами данных), построенная на основе файловой системы Hadoop (HDFS). При работе с данными Hbase использует собственный Hbase-язык. Главное отличие Hbase от реляционных СУБД состоит в том, что Hbase не содержит схем данных (которые определяют типы данных таблиц). Тип данных определяется семейством столбцов, которое задается при создании. Основными операциями в Hbase являются следующие CRUD-операции [1]:
create
— операция создания Hbase-таблиц, которая задает семейство столбцов. Каждое семейство столбцов может иметь несколько столбцов;get
— read-операция, которая отвечает за получение (считывание) имеющихся данных таблиц Hbase;put
— update-операция, отвечающая за обновление или вставку новых данных в столбец определенного семейства;delete
— операция отвечающая за удаление конкретного семейства. За полное удаление таблицы отвечает командаdrop
.
Работа с CRUD-операциями: несколько практических примеров
Для того, чтобы создать таблицу, необходимо задать имя таблицы и семейства столбцов с помощью команды create
:
create 'employee', 'Personal info', 'Professional Info'
Для того, чтобы записать данные в таблицу используется команда put, которая автоматически создает столбцы указанного семейства. При вставке данных создается столбцовый ключ, который присваивается каждой отдельной записи семейства столбца:
put 'employee', 1, 'Personal info:empId', 10 put 'employee', 1, 'Personal info:Name', 'Alex' put 'employee', 1, 'Professional Info:Dept, 'IT' put 'employee', 2, 'Personal info:empId', 20 put 'employee', 2, 'Personal info:Name', 'Bob' put 'employee', 2, 'Professional Info:Dept', 'Sales'
Для считывания данных отвечает команда get
, которая отвечает за считывание (получение) данных по параметрам. Следующий код отвечает за получение первой записи таблицы employee семейства столбца empId
семейства Personal info
:
get 'employee', 1 ,{COLUMN => 'Personal info:empId'}
В качестве операции update также используется оператор put. Следующий код отвечает за изменение значения столбца empId
, который относится к семейству Personal info
:
put 'employee', 1, 'Personal info:empId', 30
Для того, чтобы полностью удалить таблицу в Hbase используется команда drop
:
drop 'employee'
Стоит отметить, что удалять можно не только всю таблицу целиком, но и отдельные ее записи. В качестве примера рассмотрим код, который отвечает за удаление значения столбца Name
записи с ключом 1:
delete 'employee',1, 'Personal info:Name'
Из приведенного примера видно, что для удаления конкретных значений используется команда delete
[2].
Администрирование кластера HBase
Код курса
HBASE
Ближайшая дата курса
по запросу
Продолжительность
32 ак.часов
Стоимость обучения
96 000 руб.
Таким образом, благодаря поддержке CRUD-операций, Hbase обеспечивает разработчика весьма удобным и интуитивно понятным интерфейсом для работы с объектами Big Data. Это делает Hbase весьма удобным средством для работы с Big Data.
Больше подробностей про применение MongoDB в проектах анализа больших данных вы узнаете на практических курсах по NoSQL в нашем лицензированном учебном центре обучения и повышения квалификации ИТ-специалистов в Москве:
MPA: CLOUDERA IMPALA DATA ANALYTICS
ADQM: ЭКСПЛУАТАЦИЯ ARENADATA QUICKMARTS
ADBR: Arenadata DB для разработчиков
ADB: Эксплуатация Arenadata DB
HBASE: Администрирование кластера HBase
HIVE: Hadoop SQL администратор Hive
NoSQL: Интеграция Hadoop и NoSQL
Источники