【C++】unordered_set和unordered_map

2024-04-16 21:04
文章标签 c++ set map unordered

本文主要是介绍【C++】unordered_set和unordered_map,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

底层哈希结构

namespace hash_bucket
{template<class T>struct HashData{T _data;struct HashData* next = nullptr;HashData(const T& data):_data(data){}};//仿函数:这里直接用开散列仿函数template <class K>struct HashFunc{size_t operator()(const K& key){return (size_t)key;}};template <>struct HashFunc<string>//特化{size_t operator()(const string& key){size_t res = 0;for (auto e : key){res *= 131;res += e;}return res;}};//迭代器//前置声明template<class K, class T, class Hash, class KeyOfT>class HashTable;template<class K, class T, class Hash, class KeyOfT>struct _HashTableIterator{typedef HashData<T> Node;typedef HashTable<K, T, Hash, KeyOfT> Ht;typedef _HashTableIterator<K, T, Hash, KeyOfT> Self;Node* _node;Ht* _pht;_HashTableIterator(Node* node,Ht* pht):_node(node),_pht(pht){}T& operator*(){return _node->_data;}T* operator->(){return &_node->_data;}Self& operator++(){if (_node->next){//当前桶_node = _node->next;}else{//下一个桶KeyOfT kot;Hash hash;size_t i = hash(kot(_node->_data)) % _pht->_size;for (++i; i < _pht->_tables.size(); i++){if (_pht->_tables[i]){_node = _pht->_tables[i];if(node)break;}}if (i == _pht->_tables.size()){_node = nullptr;}}return *this;}bool operator!=(Self& s)const{return s._node != _node;}bool operator==(Self& s)const{return !operator!=(s);}};template<class K, class T, class Hash, class KeyOfT>class HashTable{typedef HashData<T> Node;typedef _HashTableIterator<K, T, Hash, KeyOfT> iterator;public:iterator begin(){for (size_t i = 0; i < _tables.size(); i++){if (_tables[i] != nullptr)return iterator(_tables[i], this);}return end();}iterator end(){return iterator(nullptr, this);}public:HashTable():_size(0),_tables(10, nullptr){}~HashTable()//这里的析构函数得自己添加,否则只会析构哈希表,导致节点数据没有被释放{//这里的操作和底下的打印有点像for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){Node* next = cur->next;delete cur;cur = next;}_tables[i] = nullptr;}}bool Insert(const T& data){Hash hash;KeyOfT kot;if (Find(kot(data)))return false;//负载因子到 1 就扩容if (_size == _tables.size())//扩容{size_t newSize = _tables.size() * 2;vector<Node*> newTables(newSize, nullptr);size_t hashi = 0;for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){Node* next = cur->next;hashi = hash(kot(cur->_data)) % newTables.size();cur->next = newTables[hashi];newTables[hashi] = cur;cur = next;}_tables[i] = nullptr;}_tables.swap(newTables);}size_t hashi = hash(kot(data)) % _tables.size();//头插Node* old = _tables[hashi];_tables[hashi] = new Node(data);_tables[hashi]->next = old;_size++;return true;}Node* Find(const K& key){if (_size == 0)return nullptr;Hash hash;KeyOfT kot;size_t hashi = hash(key) % _tables.size();Node* cur = nullptr;for (size_t i = 0; i < _tables.size(); i++){cur = _tables[i];while (cur){if (kot(cur->_data) == key){return cur;}cur = cur->next;}}return nullptr;}void Print(){KeyOfT kot;for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){cout << "[" << kot(cur->_data) << ": " << kot(cur->_data) << "]-->";cur = cur->next;}}cout << endl;}bool Erase(const K& key){Hash hash;KeyOfT kot;size_t hashi = hash(key) % _tables.size();Node* cur = _tables[hashi];Node* prev = nullptr;while (cur){if (kot(cur->_data) == key){if (prev){prev->next = cur->next;}else{_tables[hashi] = cur->next;}delete cur;cur = nullptr;return true;}else{prev = cur;cur = cur->next;}}return false;}size_t size(){return _size;}private:size_t _size = 0;//有效数据个数vector<Node*> _tables;};
}

unordered_set

namespace hash_bucket
{template<class K, class Hash = HashFunc<K>>class unordered_set{struct SetKeyOfT{const K& operator()(const K& key){return key;}};private:HashTable<K, K,Hash,SetKeyOfT> _ht;public:typedef  typename HashTable<K, K, Hash, SetKeyOfT> ::iterator iterator;iterator begin(){return _ht.begin();}iterator end(){return _ht.end();}bool insert(const K& Node){return _ht.Insert(Node);}};void unorderedset_test1(){unordered_set<int> s;s.insert(2);s.insert(4);s.insert(9);s.insert(1);s.insert(2);s.insert(3);for (auto e : s){cout << e << " ";}}
}

unordered_map

namespace hash_bucket
{template<class K,class V, class Hash = HashFunc<K>>class unordered_map{struct MapKeyOfT{const K& operator()(const pair<K, V>& key){return key.first;}};private:HashTable<K, pair<K, V>, Hash, MapKeyOfT> _ht;public:typedef  typename HashTable<K, pair<K, V>, Hash, MapKeyOfT>::iterator iterator;iterator begin(){return _ht.begin();}iterator end(){return _ht.end();}bool insert(const pair<K, V>& Node){return _ht.Insert(Node);}};void unorderedmap_test1(){unordered_map<string, string> dict;dict.insert(make_pair("insert", "插入"));dict.insert(make_pair("sort" , "排序"));dict.insert(make_pair("delete", "删除"));dict.insert(make_pair("string", "字符串"));dict.insert(make_pair("iterator", "迭代器"));unordered_map<string, string>::iterator umit = dict.begin();//while (umit != dict.end())//{//	cout << umit->first << ":" << umit->second << endl;//	++umit;//}//cout << endl;}
}

此时编译:
在这里插入图片描述报错!
HashTable和其迭代器互相调用
从逻辑上讲,HashTable应该给迭代器开放权限,如下设置一个友元类即可
在这里插入图片描述
因为是模板故必须带参数。
经检测,以上代码有个小bug,可能会导致数据打印时无法跳出迭代器,形成死循环打印;
提示:错误点在该段代码中

		Self& operator++(){if (_node->next){//当前桶_node = _node->next;}else{//下一个桶KeyOfT kot;Hash hash;size_t i = hash(kot(_node->_data)) % _pht->_size;for (++i; i < _pht->_tables.size(); i++){if (_pht->_tables[i]){_node = _pht->_tables[i];if(node)break;}}if (i == _pht->_tables.size()){_node = nullptr;}}return *this;}

在这里插入图片描述
在这里我们是不是应该对哈希表的大小取模,而不是对现在的有效数据个数取模

size_t i = hash(kot(_node->_data)) % _pht->_tables.size();

完整代码

代码实现标准化,实现[ ]重载

#pragma once
#include "hash.h"
namespace hash_bucket
{template<class K, class Hash = HashFunc<K>>class unordered_set{struct SetKeyOfT{const K& operator()(const K& key){return key;}};private:HashTable<K, K,Hash,SetKeyOfT> _ht;public:typedef  typename HashTable<K, K, Hash, SetKeyOfT> ::iterator iterator;iterator begin(){return _ht.begin();}iterator end(){return _ht.end();}pair<iterator, bool> insert(const K& Node){return _ht.Insert(Node);}};void unorderedset_test1(){unordered_set<int> s;s.insert(2);s.insert(4);s.insert(9);s.insert(1);s.insert(2);s.insert(3);for (auto e : s){cout << e << " ";}}
}
#pragma once
#include "hash.h"
namespace hash_bucket
{template<class K,class V, class Hash = HashFunc<K>>class unordered_map{struct MapKeyOfT{const K& operator()(const pair<K, V>& key){return key.first;}};private:HashTable<K, pair<K, V>, Hash, MapKeyOfT> _ht;public:typedef  typename HashTable<K, pair<K, V>, Hash, MapKeyOfT>::iterator iterator;iterator begin(){return _ht.begin();}iterator end(){return _ht.end();}pair<iterator,bool> insert(const pair<K, V>& Node){return _ht.Insert(Node);}V& operator[](const K& key){pair<iterator, bool> ret = insert(make_pair(key, V()));return ret.first->second;}};void unorderedmap_test1(){unordered_map<string, string> dict;dict.insert(make_pair("insert", "插入"));dict.insert(make_pair("sort" , "排序"));dict.insert(make_pair("delete", "删除"));dict.insert(make_pair("string", "字符串"));dict.insert(make_pair("iterator", "迭代器"));unordered_map<string, string>::iterator umit = dict.begin();while (umit != dict.end()){cout << umit->first << ":" << umit->second << endl;++umit;}cout << endl;}void unorderedmap_test2(){string arr[] = { "梨子","苹果","猕猴桃","桃" ,"梨子","苹果", "猕猴桃","猕猴桃","猕猴桃","梨子","猕猴桃" };unordered_map<string, int> countMap;for (const auto& str : arr){countMap[str]++;}unordered_map<string, int>::iterator it = countMap.begin();while (it != countMap.end()){cout << (*it).first << ":" << (*it).second << endl;++it;}cout << endl << endl;for (auto e : countMap){cout << e.first << ":" << e.second << endl;}cout << endl;}
}
namespace hash_bucket
{template<class T>struct HashData{T _data;struct HashData* next = nullptr;HashData(const T& data):_data(data){}};//仿函数:这里直接用开散列仿函数template <class K>struct HashFunc{size_t operator()(const K& key){return (size_t)key;}};template <>struct HashFunc<string>//特化{size_t operator()(const string& key){size_t res = 0;for (auto e : key){res *= 131;res += e;}return res;}};//迭代器//前置声明template<class K, class T, class Hash, class KeyOfT>class HashTable;template<class K, class T, class Hash, class KeyOfT>struct _HashTableIterator{typedef HashData<T> Node;typedef HashTable<K, T, Hash, KeyOfT> Ht;typedef _HashTableIterator<K, T, Hash, KeyOfT> Self;Node* _node;Ht* _pht;_HashTableIterator(Node* node,Ht* pht):_node(node),_pht(pht){}T& operator*(){return _node->_data;}T* operator->(){return &_node->_data;}Self& operator++(){if (_node->next){//当前桶_node = _node->next;}else{//下一个桶KeyOfT kot;Hash hash;size_t i = hash(kot(_node->_data)) % _pht->_tables.size();for (++i; i < _pht->_tables.size(); i++){if (_pht->_tables[i]){_node = _pht->_tables[i];if (_node){break;}}}if (i == _pht->_tables.size()){_node = nullptr;}}return *this;}Self& operator++(int){Self tmp = this;if (_node->next){//当前桶_node = _node->next;}else{//下一个桶KeyOfT kot;Hash hash;size_t i = hash(kot(_node->_data)) % _pht->size();for (++i; i < _pht->_tables.size(); i++){if (_pht->_tables[i]){_node = _pht->_tables[i];break;}}if (i == _pht->_tables.size()){_node = nullptr;}}return tmp;}bool operator!=(const Self& s) const{return s._node != _node;}bool operator==(const Self& s) const{return s._node == _node;}};template<class K, class T, class Hash, class KeyOfT>class HashTable{template<class K, class T, class Hash, class KeyOfT>friend struct _HashTableIterator;typedef HashData<T> Node;public:typedef _HashTableIterator<K, T, Hash, KeyOfT> iterator;iterator begin(){for (size_t i = 0; i < _tables.size(); i++){if (_tables[i] != nullptr)return iterator(_tables[i], this);}return end();}iterator end(){return iterator(nullptr, this);}public:HashTable():_size(0),_tables(10, nullptr){}~HashTable()//这里的析构函数得自己添加,否则只会析构哈希表,导致节点数据没有被释放{//这里的操作和底下的打印有点像for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){Node* next = cur->next;delete cur;cur = next;}_tables[i] = nullptr;}}pair<iterator,bool> Insert(const T& data){Hash hash;KeyOfT kot;iterator ret = Find(kot(data));if (ret != end())return make_pair(ret, false); //负载因子到 1 就扩容if (_size == _tables.size())//扩容{size_t newSize = _tables.size() * 2;vector<Node*> newTables(newSize, nullptr);//这里为了减少调用,不像开散列那样采用复用insert的形式,而是直接将原表中的节点拿下来直接用//而且复用insert的时候会涉及空间的申请释放问题(申请新节点,将旧节点的值给新节点,然后释放新旧结点)size_t hashi = 0;//旧表数据移到新表//特别注意:一个一个数据移动,不可一串一串移动,那样的话会造成映射位置错误,最后使其数据不能被正常找到for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){Node* next = cur->next;hashi = hash(kot(cur->_data)) % newTables.size();cur->next = newTables[hashi];newTables[hashi] = cur;cur = next;}_tables[i] = nullptr;}_tables.swap(newTables);}size_t hashi = hash(kot(data)) % _tables.size();//头插Node* old = _tables[hashi];_tables[hashi] = new Node(data);_tables[hashi]->next = old;_size++;return make_pair(iterator(_tables[hashi], this), true);}iterator Find(const K& key){if (_size == 0)return iterator(nullptr, this);Hash hash;KeyOfT kot;size_t hashi = hash(key) % _tables.size();Node* cur = nullptr;for (size_t i = 0; i < _tables.size(); i++){cur = _tables[i];while (cur){if (kot(cur->_data) == key){return iterator(cur, this);}cur = cur->next;}}return end();}void Print(){KeyOfT kot;for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){cout << "[" << kot(cur->_data) << ": " << kot(cur->_data) << "]-->";cur = cur->next;}}cout << endl;}bool Erase(const K& key){Hash hash;KeyOfT kot;size_t hashi = hash(key) % _tables.size();Node* cur = _tables[hashi];Node* prev = nullptr;while (cur){if (kot(cur->_data) == key){if (prev){prev->next = cur->next;}else{_tables[hashi] = cur->next;}delete cur;cur = nullptr;return true;}else{prev = cur;cur = cur->next;}}return false;}size_t size(){return _size;}private:size_t _size = 0;//有效数据个数vector<Node*> _tables;};
}

这篇关于【C++】unordered_set和unordered_map的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/909893

相关文章

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

C++ STL-string类底层实现过程

《C++STL-string类底层实现过程》本文实现了一个简易的string类,涵盖动态数组存储、深拷贝机制、迭代器支持、容量调整、字符串修改、运算符重载等功能,模拟标准string核心特性,重点强... 目录实现框架一、默认成员函数1.默认构造函数2.构造函数3.拷贝构造函数(重点)4.赋值运算符重载函数

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

c++日志库log4cplus快速入门小结

《c++日志库log4cplus快速入门小结》文章浏览阅读1.1w次,点赞9次,收藏44次。本文介绍Log4cplus,一种适用于C++的线程安全日志记录API,提供灵活的日志管理和配置控制。文章涵盖... 目录简介日志等级配置文件使用关于初始化使用示例总结参考资料简介log4j 用于Java,log4c

C++归并排序代码实现示例代码

《C++归并排序代码实现示例代码》归并排序将待排序数组分成两个子数组,分别对这两个子数组进行排序,然后将排序好的子数组合并,得到排序后的数组,:本文主要介绍C++归并排序代码实现的相关资料,需要的... 目录1 算法核心思想2 代码实现3 算法时间复杂度1 算法核心思想归并排序是一种高效的排序方式,需要用

C++11范围for初始化列表auto decltype详解

《C++11范围for初始化列表autodecltype详解》C++11引入auto类型推导、decltype类型推断、统一列表初始化、范围for循环及智能指针,提升代码简洁性、类型安全与资源管理效... 目录C++11新特性1. 自动类型推导auto1.1 基本语法2. decltype3. 列表初始化3

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

C++中detach的作用、使用场景及注意事项

《C++中detach的作用、使用场景及注意事项》关于C++中的detach,它主要涉及多线程编程中的线程管理,理解detach的作用、使用场景以及注意事项,对于写出高效、安全的多线程程序至关重要,下... 目录一、什么是join()?它的作用是什么?类比一下:二、join()的作用总结三、join()怎么