【HBase入门】4. 常用 Shell 操作(1)
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
前言
我们可以以shell的方式来维护和管理HBase。例如执行建表语句、执行增删改查操作等等。
需求
有以下订单数据我们想要将这样的一些数据保存到HBase中。
订单ID | 订单状态 | 支付金额 | 支付方式ID | 用户ID | 操作时间 | 商品分类 |
---|---|---|---|---|---|---|
001 | 已付款 | 200.5 | 1 | 001 | 2020-5-2 18:08:53 | 手机; |
接下来我们将使用HBase shell来进行以下操作
1.创建表
2.添加数据
3.更新数据
4.删除数据
5.查询数据
创建表
在HBase中所有的数据也都是保存在表中的。要将订单数据保存到HBase中首先需要将表创建出来。
启动HBase Shell
HBase的shell其实JRuby的IRB交互式的Ruby但在其中添加了一些HBase的命令。
启动HBase shell
hbase shell
建表
语法
create '表名','列蔟名'...
创建订单表表名为ORDER_INFO该表有一个列蔟为C1
create ‘ORDER_INFO’,‘C1’;
注意
- create要写成小写
- 一个表可以包含若干个列蔟
- 命令解析调用hbase提供的ruby脚本的create方法传递两个字符串参数
- 通过下面链接可以看到每个命令都是一个ruby脚本
查看表
hbase(main):005:0> list
TABLE
ORDER_INFO
1 row(s)
Took 0.0378 seconds
=> ["ORDER_INFO"]
删除表
要删除某个表必须要先禁用表
禁用表
语法disable "表名"
删除表
语法drop "表名"
删除ORDER_INFO表
disable "ORDER_INFO"
drop "ORDER_INFO"
添加数据
需求
接下来我们需要往订单表中添加以下数据。
订单ID | 订单状态 | 支付金额 | 支付方式ID | 用户ID | 操作时间 | 商品分类 |
---|---|---|---|---|---|---|
ID | STATUS | PAY_MONEY | PAYWAY | USER_ID | OPERATION_DATE | CATEGORY |
000001 | 已提交 | 4070 | 1 | 4944191 | 2020-04-25 | 12:09:16 |
PUT操作
HBase中的put命令可以用来将数据保存到表中。但put一次只能保存一个列的值。以下是put的语法结构
put '表名','ROWKEY','列蔟名:列名','值'
要添加以上的数据需要使用7次put操作。如下
put 'ORDER_INFO','000001','C1:ID','000001'
put 'ORDER_INFO','000001','C1:STATUS','已提交'
put 'ORDER_INFO','000001','C1:PAY_MONEY',4070
put 'ORDER_INFO','000001','C1:PAYWAY',1
put 'ORDER_INFO','000001','C1:USER_ID',4944191
put 'ORDER_INFO','000001','C1:OPERATION_DATE','2020-04-25 12:09:16'
put 'ORDER_INFO','000001','C1:CATEGORY','手机;'
查看添加的数据
需求
要求将rowkey为000001对应的数据查询出来。
get命令
在HBase中可以使用get命令来获取单独的一行数据。语法
get '表名','rowkey'
查询指定订单ID的数据
get 'ORDER_INFO','000001'
COLUMN | CELL |
---|---|
C1:CATEGORY | timestamp=1588415690678, value=\xE6\x89\x8B\xE6\x9C\xBA; |
C1:OPERATION_DATE | timestamp=1588415689773, value=2020-04-25 12:09:16 |
C1:PAYWAY | timestamp=1588415689681, value=1 |
C1:PAY_MONEY | timestamp=1588415689643, value=4070 |
C1:STATUS | timestamp=1588415689591, value=\xE5\xB7\xB2\xE6\x8F\x90\xE4\xBA\xA4 |
C1:USER_ID | timestamp=1588415689721, value=4944191 |
显示中文
在HBase shell中如果在数据中出现了一些中文默认HBase shell中显示出来的是十六进制编码。要想将这些编码显示为中文我们需要在get命令后添加一个属性{FORMATTER => 'toString'}
- 查看订单的数据
get 'ORDER_INFO','000001', {FORMATTER => 'toString'}
注- { key => value}这个是Ruby语法表示定义一个HASH结构
- get是一个HBase Ruby方法’ORDER_INFO’、’000001’、{FORMATTER => ‘toString’}是put方法的三个参数
- FORMATTER要使用大写
- 在Ruby中用{}表示一个字典类似于hashtableFORMATTER表示key、’toString’表示值
更新操作
需求
将订单ID为000001的状态更改为「已付款」
使用put来更新数据
同样在HBase中也是使用put命令来进行数据的更新语法与之前的添加数据一模一样。
更新指定的列
put 'ORDER_INFO', '000001', 'C1:STATUS', '已付款'
注意
- HBase中会自动维护数据的版本
- 每当执行一次put后都会重新生成新的时间戳
C1:STATUS timestamp=1588748844082, value=已提交
C1:STATUS timestamp=1588748952074, value=已付款
C1:STATUS timestamp=1588748994244, value=已付款
删除操作
删除状态列数据
需求
将订单ID为000001的状态列删除。
delete命令
在HBase中可以使用delete命令来将一个单元格的数据删除。
语法格式如下
delete '表名', 'rowkey', '列蔟:列'。
注意此处HBase默认会保存多个时间戳的版本数据所以这里的delete删除的是最新版本的列数据。
删除指定的列
delete 'ORDER_INFO','000001','C1:STATUS'
删除整行数据
- 需求
将订单ID为000001的信息全部删除删除所有的列 - deleteall命令
deleteall命令可以将指定rowkey对应的所有列全部删除。语法
deleteall '表名','rowkey'
- 删除指定的订单
deleteall 'ORDER_INFO','000001'
清空表
- 需求
将ORDER_INFO的数据全部删除 - truncate命令
truncate命令用来清空某个表中的所有数据。语法
truncate "表名"
- 清空ORDER_INFO的所有数据
truncate 'ORDER_INFO'