探索C语言位段的秘密

2024-02-27 00:20
文章标签 语言 探索 秘密 位段

本文主要是介绍探索C语言位段的秘密,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

位段

  • 1. 什么是位段
  • 2. 位段的内存分配
  • 3. 位段的跨平台问题
  • 4. 位段的应用
  • 4. 使用位段的注意事项

1. 什么是位段

我们使用结构体实现位段,位段的声明和结构体是类似的,有两个不同:

  1. 位段的成员必须是int,unsigned int,或signed int。(注:只要是整型家族都可以,如char)
  2. 位段的成员名后面有一个冒号和一个数字。
    (注:数字表示该成员所占空间的比特位的多少,并且不能超过该类型的大小。)

比如:

struct A
{int _a : 2;int _b : 5;int _c : 10;int _d : 30;
};

A就是一个位段类型。

那有人会产生疑问,int不是4个字节,32个比特位吗,怎么_a是2个比特位呢?

解答:int确实是32bit没错,但是:2的意思是_a不需要那么多的空间,只要分配2bit就可以啦。
比如在结构体中我们定义一个变量int flag;只是用来表示真假(0或1),要存一个0或1其实没有必要用一个整型(32bit)来储存的,只需要1bit即可。这时就可以使用位段。

结论:位段是可以节省空间的!!

那位段A的大小是多少呢?

struct A
{int _a : 2;int _b : 5;int _c : 10;int _d : 30;
};int main()
{printf("%zd\n", sizeof(struct A));//8return 0;
}

有人就开始思考,2+5+10+30=47bit,那么用6byte就可以了。究竟是不是呢,输出结果如下:

在这里插入图片描述

所以位段只是在一定的程度上节省空间(本来要16byte,使用位段后只要8byte),并不是那么死板,要知足常乐。

为什么是8byte呢,就需要了解位段的内存分配了。

2. 位段的内存分配

  1. 位段的成员可以是int,unsigned int,signed int或者char(属于整型家族)类型。
  2. 位段的空间上是按照需要,以4个字节(int)或是1个字节(char)的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

注意:位段成员一般是同类型的,不要把不同类型的混在一起

举一个例子:

struct S
{char a : 3;char b : 4;char c : 5;char d : 4;
};int main()
{struct S s = { 0 };printf("%zd\n", sizeof(struct S));//在a,b,c,d中放入数据s.a = 10;s.b = 12;s.c = 3;s.d = 4;return 0;
}

首先我们给a开辟8bit(char类型,1byte),a只需要3bit,用后还剩下5bit,b需要4bit,用后还剩下1bit,c需要5bit,此时空间不够用了,又会开辟8bit,这时问题来了,c是从新开辟的8bit开始用,还是仍会使用前面剩下的1bit呢?

如果从新开辟的空间开始用,c用后还剩3bit,d需要4bit,这时空间又不够了,又会开辟8bit,一共开辟了3byte。

但是如果会使用前面剩下的1bit,则再开辟8bit后c,d刚好使用完,一共开辟了2byte。

到底是哪一种情况呢,输出结果如下:

在这里插入图片描述

结论:说明浪费了前面那一个bit位

那么a,b,c,d的数据是如何存放的呢?画图演示:
在这里插入图片描述
调试结果如下:
在这里插入图片描述
如图所示,说明至少在VS2022编译器上,我们的猜测是正确的。

3. 位段的跨平台问题

  1. int位段被当成有符号数还是无符号数是不确定的。
    (意思是当位段的成员是int时,到底是unsigned int 还是signed int是不确定的)
  2. 位段中最大位的数目不能确定。
    (意思是在16位的机器上int最大是2byte,16bit,而在32位机器上是4byte,32bit,如果写成27,在16位的机器上和处问题)
  3. 位段中的成员在内存中从左向右分配还是从右向左分配标准尚未定义
    (由前文可知在VS2022上是从右往左分配的,在其他编译器上不一定)
  4. 当⼀个结构包含两个位段,第⼆个位段成员比较大,无法容纳于第⼀个位段剩余的位时,是舍弃
    剩余的位还是利用,这是不确定的。

结论:跟结构相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。

4. 位段的应用

下图是网络协议中,IP数据报的格式,我们可以看到其中很多的属性只需要几个bit位就能描述,这里使用位段,能够实现想要的效果,也节省了空间,这样网络传输的数据报大小也会较小⼀些,对网络的畅通是有帮助的。

在这里插入图片描述

4. 使用位段的注意事项

位段的几个成员共有同⼀个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的。内存中每个字节分配⼀个地址,⼀个字节内部的bit位是没有地址的

所以不能对位段的成员使用&操作符,这样就不能使用scanf直接给位段的成员输入值,只能是先输入
放在⼀个变量中,然后赋值给位段的成员。

struct A
{int _b : 5;int _c : 10;int _d : 30;
};
int main()
{struct A sa = {0};scanf("%d", &sa._b);//这是错误的 //正确的⽰范 int b = 0;scanf("%d", &b);sa._b = b;return 0;
}

这篇关于探索C语言位段的秘密的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/750637

相关文章

Go语言中泄漏缓冲区的问题解决

《Go语言中泄漏缓冲区的问题解决》缓冲区是一种常见的数据结构,常被用于在不同的并发单元之间传递数据,然而,若缓冲区使用不当,就可能引发泄漏缓冲区问题,本文就来介绍一下问题的解决,感兴趣的可以了解一下... 目录引言泄漏缓冲区的基本概念代码示例:泄漏缓冲区的产生项目场景:Web 服务器中的请求缓冲场景描述代码

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

Go语言中Recover机制的使用

《Go语言中Recover机制的使用》Go语言的recover机制通过defer函数捕获panic,实现异常恢复与程序稳定性,具有一定的参考价值,感兴趣的可以了解一下... 目录引言Recover 的基本概念基本代码示例简单的 Recover 示例嵌套函数中的 Recover项目场景中的应用Web 服务器中

Go语言中使用JWT进行身份验证的几种方式

《Go语言中使用JWT进行身份验证的几种方式》本文主要介绍了Go语言中使用JWT进行身份验证的几种方式,包括dgrijalva/jwt-go、golang-jwt/jwt、lestrrat-go/jw... 目录简介1. github.com/dgrijalva/jwt-go安装:使用示例:解释:2. gi

Go 语言中的 Struct Tag 的用法详解

《Go语言中的StructTag的用法详解》在Go语言中,结构体字段标签(StructTag)是一种用于给字段添加元信息(metadata)的机制,常用于序列化(如JSON、XML)、ORM映... 目录一、结构体标签的基本语法二、json:"token"的具体含义三、常见的标签格式变体四、使用示例五、使用

Go语言使用slices包轻松实现排序功能

《Go语言使用slices包轻松实现排序功能》在Go语言开发中,对数据进行排序是常见的需求,Go1.18版本引入的slices包提供了简洁高效的排序解决方案,支持内置类型和用户自定义类型的排序操作,本... 目录一、内置类型排序:字符串与整数的应用1. 字符串切片排序2. 整数切片排序二、检查切片排序状态:

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

如何合理管控Java语言的异常

《如何合理管控Java语言的异常》:本文主要介绍如何合理管控Java语言的异常问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、Thorwable类3、Error4、Exception类4.1、检查异常4.2、运行时异常5、处理方式5.1. 捕获异常

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进

$在R语言中的作用示例小结

《$在R语言中的作用示例小结》在R语言中,$是一个非常重要的操作符,主要用于访问对象的成员或组件,它的用途非常广泛,不仅限于数据框(dataframe),还可以用于列表(list)、环境(enviro... 目录1. 访问数据框(data frame)中的列2. 访问列表(list)中的元素3. 访问jav