HBase_HBase2.0 Java API 操作指南 (五) 计数器

2024-05-03 05:58

本文主要是介绍HBase_HBase2.0 Java API 操作指南 (五) 计数器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

HBase 的计数器在 点击流和广告统计中非常常用。本篇文章我们将从 shell 和 java API 两个方面去探索 Hbase 的计数器的使用。

 

1.shell 操作

2.JavaApi

   i.单计数器

  ii.多计数器

 

0.计数器介绍

在Hase 中,计数器机制是一种原子操作,需要注意的是,计数器是面向列的操作。即每次对特定计数器的操作只会锁住一列,而不是一行。然后读取数据,在对当前数据进行加法操作,最后再写入Hbase并释放该列的锁。在操作的过程中用户是可以访问这一行的其他数据的,否则如果用户对一整行的数据加锁然后读取数据,会造成大量资源抢占问题,这在一个高负载的系统中是致命的。

 

 

1.shell 操作

 

 创建一张测试表 表名 hits, 拥有 pu, uv 两个列族

create 'hits','pv','uv'

 

创建并修改计数器

NOTE : 没有计数器初始化单独的指令,初始化和操作指令相同

incr 'hits','20200424','pv:1',1
incr 'hits','20200424','uv:1',2

 

获取计数器的值

 get_counter 'hits','20200424','uv:1'

输出:

hbase(main):002:0> get_counter 'hits','20200424','uv:1'
COUNTER VALUE = 2
Took 0.8213 seconds   

 

扫描表

scan 'hits'

ROW                         COLUMN+CELL                                                                  20200423                   column=uv:1, timestamp=1587662324121, value=\x00\x00\x00\x00\x00\x00\x00\x04 20200424                   column=pv:1, timestamp=1587661726573, value=\x00\x00\x00\x00\x00\x00\x00\x01 20200424                   column=uv:1, timestamp=1587661734932, value=\x00\x00\x00\x00\x00\x00\x00\x02 
2 row(s)
Took 0.0296 seconds  

注意:在表中存储的数据实际是 bytes 字节数组,所以会看到数据实际上是不可直接读的。

 

 

操作计数器的指令

incr 'table' 'rowKey' 'columnFamily:column' 'increment-value'

'increment-value' 不同的值对计数器产生的影响

比零大的值                 按给定值增加计数器中的数值
零                               得到计数器当前值,与Shell命令get_counter的返回值相同
比零大的值                减少计数器的当前值

 

=========================================

 

2.JavaAPI

   i.单计数器

单计数器的相关Java API

  /*** See {@link #incrementColumnValue(byte[], byte[], byte[], long, Durability)}* <p>* The {@link Durability} is defaulted to {@link Durability#SYNC_WAL}.* @param row The row that contains the cell to increment.* @param family The column family of the cell to increment.* @param qualifier The column qualifier of the cell to increment.* @param amount The amount to increment the cell with (or decrement, if the* amount is negative).* @return The new value, post increment.* @throws IOException if a remote or network exception occurs.*/long incrementColumnValue(byte[] row, byte[] family, byte[] qualifier,long amount) throws IOException;/*** Atomically increments a column value. If the column value already exists* and is not a big-endian long, this could throw an exception. If the column* value does not yet exist it is initialized to <code>amount</code> and* written to the specified column.** <p>Setting durability to {@link Durability#SKIP_WAL} means that in a fail* scenario you will lose any increments that have not been flushed.* @param row The row that contains the cell to increment.* @param family The column family of the cell to increment.* @param qualifier The column qualifier of the cell to increment.* @param amount The amount to increment the cell with (or decrement, if the* amount is negative).* @param durability The persistence guarantee for this increment.* @return The new value, post increment.* @throws IOException if a remote or network exception occurs.*/long incrementColumnValue(byte[] row, byte[] family, byte[] qualifier,long amount, Durability durability) throws IOException;

注意 Java API 中也不存在对计数器初始化的api

如果想初始化一个计数器,可以像下面这样操作

long value2 = table.incrementColumnValue(Bytes.toBytes("20200423"),Bytes.toBytes("uv"),Bytes.toBytes("2"),0);
System.out.println(value2);

其中函数的返回值会返回计数器在修改过后的值

 

 

 

  ii.多计数器

另一个增加计数器的途径,是 table 的 increment() 方法。该方法可以操作多列数据。

首先我们需要创建一个Increment 对象,并把需要操作的装载进去。

Increment multiIncrement = new Increment(Bytes.toBytes("20200224"));
multiIncrement.addColumn(Bytes.toBytes("pv"),Bytes.toBytes("1"),-1);
multiIncrement.addColumn(Bytes.toBytes("uv"),Bytes.toBytes("1"),1);
multiIncrement.addColumn(Bytes.toBytes("pv"),Bytes.toBytes("2"),1);
multiIncrement.addColumn(Bytes.toBytes("uv"),Bytes.toBytes("2"),4);
Result result = table.increment(multiIncrement);

 

 

单计数器 与 多计数器 API操作示例

package hbase_2.counter;import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.Bytes;/*** Created by szh on 2020/4/24.* @author szh*/
public class Hbase_Counter {public static void main(String[] args) throws Exception {Configuration conf = HBaseConfiguration.create();conf.set("hbase.zookeeper.quorum", "cdh-manager,cdh-node1,cdh-node2");conf.set("hbase.zookeeper.property.clientPort", "2181");Connection conn = ConnectionFactory.createConnection(conf);TableName tableName = TableName.valueOf("hits");Table table = conn.getTable(tableName);//设置客户端缓存大小long value = table.incrementColumnValue(Bytes.toBytes("20200423"),Bytes.toBytes("uv"),Bytes.toBytes("1"),4);System.out.println(value);long value2 = table.incrementColumnValue(Bytes.toBytes("20200423"),Bytes.toBytes("uv"),Bytes.toBytes("2"),0);System.out.println(value2);Increment multiIncrement = new Increment(Bytes.toBytes("20200224"));multiIncrement.addColumn(Bytes.toBytes("pv"),Bytes.toBytes("1"),-1);multiIncrement.addColumn(Bytes.toBytes("uv"),Bytes.toBytes("1"),1);multiIncrement.addColumn(Bytes.toBytes("pv"),Bytes.toBytes("2"),1);multiIncrement.addColumn(Bytes.toBytes("uv"),Bytes.toBytes("2"),4);Result result = table.increment(multiIncrement);for(Cell cell : result.rawCells()){System.out.println(cell);}table.close();}
}

 

 

 

 

 

 

这篇关于HBase_HBase2.0 Java API 操作指南 (五) 计数器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/955972

相关文章

SpringBoot中HTTP连接池的配置与优化

《SpringBoot中HTTP连接池的配置与优化》这篇文章主要为大家详细介绍了SpringBoot中HTTP连接池的配置与优化的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录一、HTTP连接池的核心价值二、Spring Boot集成方案方案1:Apache HttpCl

Spring Boot项目打包和运行的操作方法

《SpringBoot项目打包和运行的操作方法》SpringBoot应用内嵌了Web服务器,所以基于SpringBoot开发的web应用也可以独立运行,无须部署到其他Web服务器中,下面以打包dem... 目录一、打包为JAR包并运行1.打包为可执行的 JAR 包2.运行 JAR 包二、打包为WAR包并运行

Java进行日期解析与格式化的实现代码

《Java进行日期解析与格式化的实现代码》使用Java搭配ApacheCommonsLang3和Natty库,可以实现灵活高效的日期解析与格式化,本文将通过相关示例为大家讲讲具体的实践操作,需要的可以... 目录一、背景二、依赖介绍1. Apache Commons Lang32. Natty三、核心实现代

Spring Boot 常用注解整理(最全收藏版)

《SpringBoot常用注解整理(最全收藏版)》本文系统整理了常用的Spring/SpringBoot注解,按照功能分类进行介绍,每个注解都会涵盖其含义、提供来源、应用场景以及代码示例,帮助开发... 目录Spring & Spring Boot 常用注解整理一、Spring Boot 核心注解二、Spr

Python文件操作与IO流的使用方式

《Python文件操作与IO流的使用方式》:本文主要介绍Python文件操作与IO流的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python文件操作基础1. 打开文件2. 关闭文件二、文件读写操作1.www.chinasem.cn 读取文件2. 写

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

python通过curl实现访问deepseek的API

《python通过curl实现访问deepseek的API》这篇文章主要为大家详细介绍了python如何通过curl实现访问deepseek的API,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编... API申请和充值下面是deepeek的API网站https://platform.deepsee

java变量内存中存储的使用方式

《java变量内存中存储的使用方式》:本文主要介绍java变量内存中存储的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、变量的定义3、 变量的类型4、 变量的作用域5、 内存中的存储方式总结1、介绍在 Java 中,变量是用于存储程序中数据

如何合理管控Java语言的异常

《如何合理管控Java语言的异常》:本文主要介绍如何合理管控Java语言的异常问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、Thorwable类3、Error4、Exception类4.1、检查异常4.2、运行时异常5、处理方式5.1. 捕获异常