Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?

本文主要是介绍Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1  go grpc-go 相关技术专栏 总入口

2  Protobuf介绍与实战 图文专栏 文章目录

本次测试环境是64位Mac系统

1、数据类型为int32,int64,uint32,uint64,bool,enum时,Varint是如何编码的?

1.1、测试用例1:先看一下十进制1的二进制形式;以及在64位操作系统下,1占用多少字节?

在这里插入图片描述

可以使用Varint编码进行改进。

1.2、测试用例2:使用Varint编码,传输十进制1的情况

在这里插入图片描述

如果不考虑是32位操作系统,还是64位操作系统的话,用1个字节来表示数值,当传输的数值小于128且 大于0时,Varint的编码结果跟二进制原码是一样的

1.3、测试用例3:使用Varint编码,传输十进制128的情况?

在这里插入图片描述

[00010000 10000000 00000001]

前面多余的0,可以不显示,为了分析,专门打印输出的。

好,先看第1个字节00010000
在这里插入图片描述

从第1个字节中,可以得到标识号,即得到变量类型,变量名称;以及变量值的编码方式

接下来,看第2,3个字节 10000000 00000001
在这里插入图片描述

在这里插入图片描述

即,通过解析第2,3字节,获得传输的是128。

uint32, int64,uint64类型就不再举例了,原理一样的。

1.4、测试用例4:使用Varint编码bool 类型的变量值

bool类型的变量值,本质可看做为0,1

在这里插入图片描述

在这里插入图片描述

1.4.1、当 bool类型的变量值为 false 时,其编码结果为空,为什么?

这是 Varint编码 为了提高编码效率做的一个小技巧:

若数据类型的变量值刚好为该类型的初始化值的话,Varint编码就采用空进行传输;

当接收方对某字段进行解析时,发现为空,就会按照此字段的默认值进行初始化;

1.4.2、验证一下:int32类型的变量,变量值为0时Varint编码的情况:

在这里插入图片描述

1.5、测试用例5:使用Varint编码,对enum 类型进行编码

在这里插入图片描述

在这里插入图片描述

enum类型的变量值,本质上还是整型数。

具体编码过程,跟int32类型是一样的,就不再具体写了。

2、数据类型为sint32,sint64时,Varint是如何编码的?(ZigZag编码)

前文我们已经分析了,如果使用Varint编码直接对负数进行编码的话,会占用很多字节,违背我们的初衷;

既然,Varint编码对正数很有效果,那么,能不能先将负数转换为正数呢?

sint32, sint64类型就是针对的是负数情况;

sin32,sint64类型,使用的是zigzag编码,该编码是对Varint编码的改进;

2.1、zigzag编码

zigzag编码的本质,是将负数按照一定的规则变换为一个正数,然后,在使用Varint编码的。

ZigZag编码将有符号数映射到无符号数以便具有较小绝对值的数字(如-1)也具有较小的varint编码值。

这样做的方式是通过正整数和负整数来回“曲折”,将-1编码为1,将1编码为2,将-2编码为3…………以此类推。

如下表所示:

Signed OriginalEncoded As
00
-11
12
-23
24
-35
21474836474294967294
-21474836484294967295

sint32类型的0,经过sint32编码后,为0

sint32类型的-1,经过sint32编码后,为1

sint32类型的1,经过sint32编码后,为2

sint32类型的-2,经过sint32编码后,为3

sint32类型的2,经过sint32编码后,为4


其实,

对于负奇数来说,公式:|-3|*2-1=5

对于正数来说,公式:数值*2

或者:可以从移位的角度看

如,int类型zigzag变换的代码表示为(n << 1) ^ (n >> 31)

有关介绍网址:
https://www.it610.com/article/1187247270198878208.htm
http://wikimore.github.io/2016/09/22/zig-zag-intro/
http://wikimore.github.io/2016/09/22/zig-zag-intro/
https://blog.csdn.net/mijichui2153/article/details/111475823

举例说明:
sint32类型的-300,
在这里插入图片描述

-300, 如果用int32类型表示的话,其实,|-300|*2-1=599

即,直接使用Varint对599进行编码:
在这里插入图片描述

如果某个类型的变量值一直是负数的话,可以使用sint32, sint64进行声明,从而提高了编码效率

或者说,某个类型的变量值大部分情况下是负数,也可以。

下一篇文章

  在proto文件中,数据类型为string,bytes,embedded messages,packed repeated fields时,变量值采用何种方式编码(Length-delimited)

这篇关于Protobuf 介绍与实战51:在proto文件中,数据类型为int32,int64,uint32,uint64,sint32,sint64,bool,enum时,对变量值采用何种方式编码?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/374465

相关文章

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

Vue3视频播放组件 vue3-video-play使用方式

《Vue3视频播放组件vue3-video-play使用方式》vue3-video-play是Vue3的视频播放组件,基于原生video标签开发,支持MP4和HLS流,提供全局/局部引入方式,可监听... 目录一、安装二、全局引入三、局部引入四、基本使用五、事件监听六、播放 HLS 流七、更多功能总结在 v

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型:

Java发送SNMP至交换机获取交换机状态实现方式

《Java发送SNMP至交换机获取交换机状态实现方式》文章介绍使用SNMP4J库(2.7.0)通过RCF1213-MIB协议获取交换机单/多路状态,需开启SNMP支持,重点对比SNMPv1、v2c、v... 目录交换机协议SNMP库获取交换机单路状态获取交换机多路状态总结交换机协议这里使用的交换机协议为常

Python 常用数据类型详解之字符串、列表、字典操作方法

《Python常用数据类型详解之字符串、列表、字典操作方法》在Python中,字符串、列表和字典是最常用的数据类型,它们在数据处理、程序设计和算法实现中扮演着重要角色,接下来通过本文给大家介绍这三种... 目录一、字符串(String)(一)创建字符串(二)字符串操作1. 字符串连接2. 字符串重复3. 字

5 种使用Python自动化处理PDF的实用方法介绍

《5种使用Python自动化处理PDF的实用方法介绍》自动化处理PDF文件已成为减少重复工作、提升工作效率的重要手段,本文将介绍五种实用方法,从内置工具到专业库,帮助你在Python中实现PDF任务... 目录使用内置库(os、subprocess)调用外部工具使用 PyPDF2 进行基本 PDF 操作使用

k8s admin用户生成token方式

《k8sadmin用户生成token方式》用户使用Kubernetes1.28创建admin命名空间并部署,通过ClusterRoleBinding为jenkins用户授权集群级权限,生成并获取其t... 目录k8s admin用户生成token创建一个admin的命名空间查看k8s namespace 的