Linux内核常用数据结构——顺序表之哈希表

2024-03-15 14:32

本文主要是介绍Linux内核常用数据结构——顺序表之哈希表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、线性表

线性表按照数据结构的存储形式有分为:顺序表和链式表。

顺序表中数据存储的地址在内存中是连续的,所以可以通过计算地址实现随机存取;如:数组、哈希表等。

链式表中数据存储的地址不一定连续,只能通过结点的指针顺序存取;如:我们常用的线性链表、线性循环链表等。

二、顺序表和链式表各自优势

1.顺序表:查找速度快,尤其是哈希表可以根据关键字进行查找、更灵活和方便;缺点是内存必须提前分配好,并且必须是连续内存空间。

2.链式表:内存可以在使用是malloc随机分配;缺点是查找必须单独实现算法,而且算法查找速度慢。

以上就是时间和空间的矛盾。

三、哈希表

1.哈希表与数组的关系

区别:哈希表是通过元素关键码的值直接查找元素存储位置的数据结构;数组是通过下标可以直接访问到下标对应位置上元素的数据结构。

联系:元素的关键码通过散射/哈希函数映射得到的函数值就是哈希表数组的下标(一般的哈希表组织元素的方法还是数组)。

2.哈希冲突算法

  因为哈希函数根据关键码计算哈希表数组下标会出现不同关键码计算得到同一个数组下标的可能性;这也是散射/哈希函数不能避免的。

如“除余留数”法实现的哈希函数:hash(key) = key%17;

此时,当key为6、23、40和57时,下标值都为6;这时就需要添加冲突解决。

常用冲突解决有如下两种:

1).再哈希法:采用“再哈希”法解决冲突的哈希表是一个固定大小的结构体数组,然后给哈希表元素设置一个冲突标志位,同时、当执行哈希函数时对使用过的数组下标对应的元素冲突位置1;当下次获得的下标值对应的元素冲突位为1时,则再次利用哈希算法再次算出一个下标值。在查找时,方法类似。下边将实现这种方法。

2).链地址法:采用“链地址”法解决冲突的哈希表是一个固定大小的指针数组,数组的每个元素是一个链表(单向或双向)的头指针。将关键字作为参数、利用哈希函数计算出数据应该属于哈希表中的哪个指针数组;然后,从该指针数组所指地址处构建线性链表。Linux2.6内核的哈希表就是采用这种方法实现。

其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他哈希表,该方法中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。

  最后,总的来说、哈希表的查询是飞快的。因为它不需要从头搜索,它利用Key的“哈希算法”直接定位,查找非常快,各种数据库中的数据结构基本都是它。但带来的问题是,哈希表的尺寸、哈希算法。

3.看看我们的demo

test.c

#include <stdio.h>/*
关键在于creathashaddr和hashsearch函数的实现;关键点是哈希表的构造方法和哈希冲突的解决算法
本demo哈希表的构造采用“除留余数”法,处理冲突采用“再哈希”法。
而Linux2.6内核处理冲突使用的是“链地址”法、因此会看到结构体中有线性链表存在。
下面从设计思想上说下链地址法:其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他方法,
由于哈希表中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、
提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。
*/#define HASH_SIZE 17
typedef struct node{char *name;int age;int flag;//标志位,当前节点是否冲突;Linux2.6内核中“链地址”法,此处是一个链表指针
}mynode;
mynode hashlist[HASH_SIZE];//创建哈希表int creathashaddr(int key)
{int i; int addr = -1;for(i=0; i < HASH_SIZE; i++){addr = key%HASH_SIZE;if(hashlist[addr].flag == 0){hashlist[addr].flag = 1;return addr;}else{//哈希冲突printf("TK------->>>>gethashaddr is chongtu!!!!!\n");//add by tankaido{addr = (key + addr%10 + 1)%HASH_SIZE;}while(hashlist[addr].flag != 0);//二次哈希冲突hashlist[addr].flag = 1;return addr;}}
}void hashsearch(int age)
{int addr = age%HASH_SIZE;if(hashlist[addr].age == age){ printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}elseif(hashlist[addr].flag == 0){printf("TK------>>1111>>no this!\n");return;}else{//哈希冲突do{addr = (age + addr%10 + 1)%HASH_SIZE;if(hashlist[addr].age == age){printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}}while(hashlist[addr].flag != 0);//二次哈希冲突}printf("TK------>>2222>>no this!\n");return;
}int main()
{int i;for (i=0; i<HASH_SIZE; i++)  {hashlist[i].name="";hashlist[i].age=0;hashlist[i].flag=0;}int j = creathashaddr(23);hashlist[j].name = "tan";hashlist[j].age = 23;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(40);hashlist[j].name = "kai";hashlist[j].age = 40;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(6);hashlist[j].name = "tankai";hashlist[j].age = 6;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);int test;do{printf("#######please input user age:##########\n");scanf("%d",&test);printf("TK--------->>>>>age is %d\n",test);hashsearch(test);}while(test != 0);return 0;
}/*
gcc test.c -o test
./test
result is : 
TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########
*/

gcc test.c -o test

./test

TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########


这篇关于Linux内核常用数据结构——顺序表之哈希表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/812285

相关文章

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

Python中pywin32 常用窗口操作的实现

《Python中pywin32常用窗口操作的实现》本文主要介绍了Python中pywin32常用窗口操作的实现,pywin32主要的作用是供Python开发者快速调用WindowsAPI的一个... 目录获取窗口句柄获取最前端窗口句柄获取指定坐标处的窗口根据窗口的完整标题匹配获取句柄根据窗口的类别匹配获取句

Linux之systemV共享内存方式

《Linux之systemV共享内存方式》:本文主要介绍Linux之systemV共享内存方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、工作原理二、系统调用接口1、申请共享内存(一)key的获取(二)共享内存的申请2、将共享内存段连接到进程地址空间3、将

SpringBoot中配置文件的加载顺序解读

《SpringBoot中配置文件的加载顺序解读》:本文主要介绍SpringBoot中配置文件的加载顺序,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot配置文件的加载顺序1、命令⾏参数2、Java系统属性3、操作系统环境变量5、项目【外部】的ap

快速修复一个Panic的Linux内核的技巧

《快速修复一个Panic的Linux内核的技巧》Linux系统中运行了不当的mkinitcpio操作导致内核文件不能正常工作,重启的时候,内核启动中止于Panic状态,该怎么解决这个问题呢?下面我们就... 感谢China编程(www.chinasem.cn)网友 鸢一雨音 的投稿写这篇文章是有原因的。为了配置完

Python的time模块一些常用功能(各种与时间相关的函数)

《Python的time模块一些常用功能(各种与时间相关的函数)》Python的time模块提供了各种与时间相关的函数,包括获取当前时间、处理时间间隔、执行时间测量等,:本文主要介绍Python的... 目录1. 获取当前时间2. 时间格式化3. 延时执行4. 时间戳运算5. 计算代码执行时间6. 转换为指

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

usb接口驱动异常问题常用解决方案

《usb接口驱动异常问题常用解决方案》当遇到USB接口驱动异常时,可以通过多种方法来解决,其中主要就包括重装USB控制器、禁用USB选择性暂停设置、更新或安装新的主板驱动等... usb接口驱动异常怎么办,USB接口驱动异常是常见问题,通常由驱动损坏、系统更新冲突、硬件故障或电源管理设置导致。以下是常用解决

Linux命令之firewalld的用法

《Linux命令之firewalld的用法》:本文主要介绍Linux命令之firewalld的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux命令之firewalld1、程序包2、启动firewalld3、配置文件4、firewalld规则定义的九大

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at