【C++】哈希的应用---位图

2024-05-02 18:36
文章标签 c++ 应用 哈希 位图

本文主要是介绍【C++】哈希的应用---位图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1、引入

2、位图的概念

3、位图的实现

①框架的搭建 

 ②设置存在

 ③设置不存在

④检查存在

​4、位图计算出现的次数

5、完整代码


1、引入

我们可以看一道面试题

给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在 这40亿个数中。【腾讯】

常用可能有三种解决方式:

🟢遍历,时间复杂度O(N)

🟢排序(O(NlogN)),利用二分查找: logN

遍历和排序查找的工程量太大了,这肯定是不行的,因为,光是把数据存起来就要用掉16GB的内存,而且要求空间连续内存开不出这么大的连续空间。所以最佳是用位图来解决。

🟢位图解决 数据是否在给定的整形数据中,结果是在或者不在,刚好是两种状态,那么可以使用一 个二进制比特位来代表数据是否存在的信息,如果二进制比特位为1,代表存在,为0 代表不存在。

2、位图的概念

所谓位图,就是用每一位来存放某种状态,适用于海量数据,数据无重复的场景。通常是用来判断某个数据存不存在的。

我们都知道计算机的数据和指令都是二进制的,二进制是由0,1两个数字组成,这就意味着这两个数字可以表示两个不同的状态,位图的基础也是基于这一点。

所以,我们利用这一点。假设我们现在有一堆海量的数据,我可以通过某种方式让数字对应到相应的二进制的数位上,同时规定0表示该数字不存在,1表示存在。这本质上也是一种哈希的思想。

3、位图的实现

我们想要的位图大概是这一种:所以我们需要两个变量,一个计算数据在哪一个32位里,一个计算是32中的哪一位。

①框架的搭建 

 ②设置存在

我们需要找到相应的位置,如果存在就变成1,如果不存在就不变。

比如有一个数字150,我们要将他插入到位图中,并将相对应的位图变为1.

现在我们找到了相应的位置,现在我们要将这个位从0变成1,表示241已经存在,但是我们不能影响其他位的状态,这个时候我们可以使用位运算:

步骤:

我们使用1,1的二进制是0000 0000 0000 0000 0000 0000 0000 0001

将1的二进制向左移动 j 个位置

原二进制和这个位置采取运算,有1为1,如果都为0为0;

 ③设置不存在

找到了相应的位置,将这个位从1变成0,这个时候我们可以使用取反+&运算:

步骤

我们使用1,1的二进制是0000 0000 0000 0000 0000 0000 0000 0001

将1的二进制向左移动 j 个位置

按位取反

原二进制和这个位置采取按位与运算,有0为0,都为1为1;

④检查存在

步骤:

我们使用1,1的二进制是0000 0000 0000 0000 0000 0000 0000 0001

将1的二进制向左移动 j 个位置

原二进制和这个位置采取按位与运算,有0为0,都为1为1;

一个整型值只要有一位为1就是非0,非0就是真。

【代码检查】 

 4、位图计算出现的次数

上述我们封装好了一个位图,但是我们只是解决了数据的储存,我们还没有解决如何只找出出现一次的数。我们可以将数字分为三种状态:

一次都没有出现的,出现一次,出现两次及以上。

因此可以再次封装一个位图来寻找只出现了一次的数,两个位图合起来表示数据出现的次数:

00 表示一次都没有出现过

01 表示出现一次

10 表示出现两次及以上

用两个位图来实现: 

可以定义一个打印函数,将其打印出来

【代码检查】

【总结】

位图的优点

速度快,节省空间

缺点:只能映射整型 

5、完整代码

#define  _CRT_SECURE_NO_WARNINGS
#pragma once
namespace zhou
{// N是需要多少比特位template<size_t N>class bitset{public://计算出需要多少空间,如果不是32的倍数,多开辟一个字节bitset(){_bits.resize(N/32+1, 0);}//将对应的 j 设置为1void set(size_t x){size_t i = x / 32;size_t j = x % 32;_bits[i] |= (1 << j);}void reset(size_t x){size_t i = x / 32;size_t j = x % 32;_bits[i] &= ~(1 << j);}bool test(size_t x){size_t i = x / 32;size_t j = x % 32;return _bits[i] & (1 << j);}private:vector<int> _bits;};template<size_t N>class twobitset{public://set是在原来的次数上+1void set(size_t x){//00->01//01->10//10->11//11->不变if (_bs1.test(x) == false && _bs2.test(x) == false){_bs2.set(x);}else if (_bs1.test(x) == false && _bs2.test(x) == true){_bs1.set(x);_bs2.reset(x);}else if (_bs1.test(x) == true && _bs2.test(x) == false){_bs1.set(x);_bs2.set(x);}}void Print(){for (size_t i = 0; i < N; i++){if (_bs1.test(i) == false && _bs2.test(i) == true){cout << "1->" << i << endl;}else if (_bs1.test(i) == true && _bs2.test(i) == false){cout << "2->" << i << endl;}}cout << endl;}private:bitset<N> _bs1;bitset<N> _bs2;};
}

这篇关于【C++】哈希的应用---位图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/954907

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法