Linux内核常用数据结构——顺序表之哈希表

2024-03-15 14:32

本文主要是介绍Linux内核常用数据结构——顺序表之哈希表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、线性表

线性表按照数据结构的存储形式有分为:顺序表和链式表。

顺序表中数据存储的地址在内存中是连续的,所以可以通过计算地址实现随机存取;如:数组、哈希表等。

链式表中数据存储的地址不一定连续,只能通过结点的指针顺序存取;如:我们常用的线性链表、线性循环链表等。

二、顺序表和链式表各自优势

1.顺序表:查找速度快,尤其是哈希表可以根据关键字进行查找、更灵活和方便;缺点是内存必须提前分配好,并且必须是连续内存空间。

2.链式表:内存可以在使用是malloc随机分配;缺点是查找必须单独实现算法,而且算法查找速度慢。

以上就是时间和空间的矛盾。

三、哈希表

1.哈希表与数组的关系

区别:哈希表是通过元素关键码的值直接查找元素存储位置的数据结构;数组是通过下标可以直接访问到下标对应位置上元素的数据结构。

联系:元素的关键码通过散射/哈希函数映射得到的函数值就是哈希表数组的下标(一般的哈希表组织元素的方法还是数组)。

2.哈希冲突算法

  因为哈希函数根据关键码计算哈希表数组下标会出现不同关键码计算得到同一个数组下标的可能性;这也是散射/哈希函数不能避免的。

如“除余留数”法实现的哈希函数:hash(key) = key%17;

此时,当key为6、23、40和57时,下标值都为6;这时就需要添加冲突解决。

常用冲突解决有如下两种:

1).再哈希法:采用“再哈希”法解决冲突的哈希表是一个固定大小的结构体数组,然后给哈希表元素设置一个冲突标志位,同时、当执行哈希函数时对使用过的数组下标对应的元素冲突位置1;当下次获得的下标值对应的元素冲突位为1时,则再次利用哈希算法再次算出一个下标值。在查找时,方法类似。下边将实现这种方法。

2).链地址法:采用“链地址”法解决冲突的哈希表是一个固定大小的指针数组,数组的每个元素是一个链表(单向或双向)的头指针。将关键字作为参数、利用哈希函数计算出数据应该属于哈希表中的哪个指针数组;然后,从该指针数组所指地址处构建线性链表。Linux2.6内核的哈希表就是采用这种方法实现。

其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他哈希表,该方法中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。

  最后,总的来说、哈希表的查询是飞快的。因为它不需要从头搜索,它利用Key的“哈希算法”直接定位,查找非常快,各种数据库中的数据结构基本都是它。但带来的问题是,哈希表的尺寸、哈希算法。

3.看看我们的demo

test.c

#include <stdio.h>/*
关键在于creathashaddr和hashsearch函数的实现;关键点是哈希表的构造方法和哈希冲突的解决算法
本demo哈希表的构造采用“除留余数”法,处理冲突采用“再哈希”法。
而Linux2.6内核处理冲突使用的是“链地址”法、因此会看到结构体中有线性链表存在。
下面从设计思想上说下链地址法:其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他方法,
由于哈希表中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、
提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。
*/#define HASH_SIZE 17
typedef struct node{char *name;int age;int flag;//标志位,当前节点是否冲突;Linux2.6内核中“链地址”法,此处是一个链表指针
}mynode;
mynode hashlist[HASH_SIZE];//创建哈希表int creathashaddr(int key)
{int i; int addr = -1;for(i=0; i < HASH_SIZE; i++){addr = key%HASH_SIZE;if(hashlist[addr].flag == 0){hashlist[addr].flag = 1;return addr;}else{//哈希冲突printf("TK------->>>>gethashaddr is chongtu!!!!!\n");//add by tankaido{addr = (key + addr%10 + 1)%HASH_SIZE;}while(hashlist[addr].flag != 0);//二次哈希冲突hashlist[addr].flag = 1;return addr;}}
}void hashsearch(int age)
{int addr = age%HASH_SIZE;if(hashlist[addr].age == age){ printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}elseif(hashlist[addr].flag == 0){printf("TK------>>1111>>no this!\n");return;}else{//哈希冲突do{addr = (age + addr%10 + 1)%HASH_SIZE;if(hashlist[addr].age == age){printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}}while(hashlist[addr].flag != 0);//二次哈希冲突}printf("TK------>>2222>>no this!\n");return;
}int main()
{int i;for (i=0; i<HASH_SIZE; i++)  {hashlist[i].name="";hashlist[i].age=0;hashlist[i].flag=0;}int j = creathashaddr(23);hashlist[j].name = "tan";hashlist[j].age = 23;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(40);hashlist[j].name = "kai";hashlist[j].age = 40;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(6);hashlist[j].name = "tankai";hashlist[j].age = 6;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);int test;do{printf("#######please input user age:##########\n");scanf("%d",&test);printf("TK--------->>>>>age is %d\n",test);hashsearch(test);}while(test != 0);return 0;
}/*
gcc test.c -o test
./test
result is : 
TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########
*/

gcc test.c -o test

./test

TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########


这篇关于Linux内核常用数据结构——顺序表之哈希表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/812285

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

Linux创建服务使用systemctl管理详解

《Linux创建服务使用systemctl管理详解》文章指导在Linux中创建systemd服务,设置文件权限为所有者读写、其他只读,重新加载配置,启动服务并检查状态,确保服务正常运行,关键步骤包括权... 目录创建服务 /usr/lib/systemd/system/设置服务文件权限:所有者读写js,其他

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信