Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?

本文主要是介绍Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1  go grpc-go 相关技术专栏 总入口

2  Protobuf介绍与实战 图文专栏 文章目录

本次测试环境是64位Mac系统

1、数据类型为int32,int64,uint32,uint64,bool,enum时,Varint是如何编码的?

1.1、测试用例1:先看一下十进制1的二进制形式;以及在64位操作系统下,1占用多少字节?

在这里插入图片描述

可以使用Varint编码进行改进。

1.2、测试用例2:使用Varint编码,传输十进制1的情况

在这里插入图片描述

如果不考虑是32位操作系统,还是64位操作系统的话,用1个字节来表示数值,当传输的数值小于128且 大于0时,Varint的编码结果跟二进制原码是一样的

1.3、测试用例3:使用Varint编码,传输十进制128的情况?

在这里插入图片描述

[00010000 10000000 00000001]

前面多余的0,可以不显示,为了分析,专门打印输出的。

好,先看第1个字节00010000
在这里插入图片描述

从第1个字节中,可以得到标识号,即得到变量类型,变量名称;以及变量值的编码方式

接下来,看第2,3个字节 10000000 00000001
在这里插入图片描述

在这里插入图片描述

即,通过解析第2,3字节,获得传输的是128。

uint32, int64,uint64类型就不再举例了,原理一样的。

1.4、测试用例4:使用Varint编码bool 类型的变量值

bool类型的变量值,本质可看做为0,1

在这里插入图片描述

在这里插入图片描述

1.4.1、当 bool类型的变量值为 false 时,其编码结果为空,为什么?

这是 Varint编码 为了提高编码效率做的一个小技巧:

若数据类型的变量值刚好为该类型的初始化值的话,Varint编码就采用空进行传输;

当接收方对某字段进行解析时,发现为空,就会按照此字段的默认值进行初始化;

1.4.2、验证一下:int32类型的变量,变量值为0时Varint编码的情况:

在这里插入图片描述

1.5、测试用例5:使用Varint编码,对enum 类型进行编码

在这里插入图片描述

在这里插入图片描述

enum类型的变量值,本质上还是整型数。

具体编码过程,跟int32类型是一样的,就不再具体写了。

2、数据类型为sint32,sint64时,Varint是如何编码的?(ZigZag编码)

前文我们已经分析了,如果使用Varint编码直接对负数进行编码的话,会占用很多字节,违背我们的初衷;

既然,Varint编码对正数很有效果,那么,能不能先将负数转换为正数呢?

sint32, sint64类型就是针对的是负数情况;

sin32,sint64类型,使用的是zigzag编码,该编码是对Varint编码的改进;

2.1、zigzag编码

zigzag编码的本质,是将负数按照一定的规则变换为一个正数,然后,在使用Varint编码的。

ZigZag编码将有符号数映射到无符号数以便具有较小绝对值的数字(如-1)也具有较小的varint编码值。

这样做的方式是通过正整数和负整数来回“曲折”,将-1编码为1,将1编码为2,将-2编码为3…………以此类推。

如下表所示:

Signed OriginalEncoded As
00
-11
12
-23
24
-35
21474836474294967294
-21474836484294967295

sint32类型的0,经过sint32编码后,为0

sint32类型的-1,经过sint32编码后,为1

sint32类型的1,经过sint32编码后,为2

sint32类型的-2,经过sint32编码后,为3

sint32类型的2,经过sint32编码后,为4


其实,

对于负奇数来说,公式:|-3|*2-1=5

对于正数来说,公式:数值*2

或者:可以从移位的角度看

如,int类型zigzag变换的代码表示为(n << 1) ^ (n >> 31)

有关介绍网址:
https://www.it610.com/article/1187247270198878208.htm
http://wikimore.github.io/2016/09/22/zig-zag-intro/
http://wikimore.github.io/2016/09/22/zig-zag-intro/
https://blog.csdn.net/mijichui2153/article/details/111475823

举例说明:
sint32类型的-300,
在这里插入图片描述

-300, 如果用int32类型表示的话,其实,|-300|*2-1=599

即,直接使用Varint对599进行编码:
在这里插入图片描述

如果某个类型的变量值一直是负数的话,可以使用sint32, sint64进行声明,从而提高了编码效率

或者说,某个类型的变量值大部分情况下是负数,也可以。

下一篇文章

  在proto文件中,数据类型为string,bytes,embedded messages,packed repeated fields时,变量值采用何种方式编码(Length-delimited)

这篇关于Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/374465

相关文章

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

python判断文件是否存在常用的几种方式

《python判断文件是否存在常用的几种方式》在Python中我们在读写文件之前,首先要做的事情就是判断文件是否存在,否则很容易发生错误的情况,:本文主要介绍python判断文件是否存在常用的几种... 目录1. 使用 os.path.exists()2. 使用 os.path.isfile()3. 使用

MybatisPlus service接口功能介绍

《MybatisPlusservice接口功能介绍》:本文主要介绍MybatisPlusservice接口功能介绍,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友... 目录Service接口基本用法进阶用法总结:Lambda方法Service接口基本用法MyBATisP

Mybatis的分页实现方式

《Mybatis的分页实现方式》MyBatis的分页实现方式主要有以下几种,每种方式适用于不同的场景,且在性能、灵活性和代码侵入性上有所差异,对Mybatis的分页实现方式感兴趣的朋友一起看看吧... 目录​1. 原生 SQL 分页(物理分页)​​2. RowBounds 分页(逻辑分页)​​3. Page

Linux链表操作方式

《Linux链表操作方式》:本文主要介绍Linux链表操作方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、链表基础概念与内核链表优势二、内核链表结构与宏解析三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势六、典型应用场景七、调试技巧与

MySQL复杂SQL之多表联查/子查询详细介绍(最新整理)

《MySQL复杂SQL之多表联查/子查询详细介绍(最新整理)》掌握多表联查(INNERJOIN,LEFTJOIN,RIGHTJOIN,FULLJOIN)和子查询(标量、列、行、表子查询、相关/非相关、... 目录第一部分:多表联查 (JOIN Operations)1. 连接的类型 (JOIN Types)

Linux实现线程同步的多种方式汇总

《Linux实现线程同步的多种方式汇总》本文详细介绍了Linux下线程同步的多种方法,包括互斥锁、自旋锁、信号量以及它们的使用示例,通过这些同步机制,可以解决线程安全问题,防止资源竞争导致的错误,示例... 目录什么是线程同步?一、互斥锁(单人洗手间规则)适用场景:特点:二、条件变量(咖啡厅取餐系统)工作流

RedisTemplate默认序列化方式显示中文乱码的解决

《RedisTemplate默认序列化方式显示中文乱码的解决》本文主要介绍了SpringDataRedis默认使用JdkSerializationRedisSerializer导致数据乱码,文中通过示... 目录1. 问题原因2. 解决方案3. 配置类示例4. 配置说明5. 使用示例6. 验证存储结果7.