Linux内核常用数据结构——顺序表之哈希表

2024-03-15 14:32

本文主要是介绍Linux内核常用数据结构——顺序表之哈希表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、线性表

线性表按照数据结构的存储形式有分为:顺序表和链式表。

顺序表中数据存储的地址在内存中是连续的,所以可以通过计算地址实现随机存取;如:数组、哈希表等。

链式表中数据存储的地址不一定连续,只能通过结点的指针顺序存取;如:我们常用的线性链表、线性循环链表等。

二、顺序表和链式表各自优势

1.顺序表:查找速度快,尤其是哈希表可以根据关键字进行查找、更灵活和方便;缺点是内存必须提前分配好,并且必须是连续内存空间。

2.链式表:内存可以在使用是malloc随机分配;缺点是查找必须单独实现算法,而且算法查找速度慢。

以上就是时间和空间的矛盾。

三、哈希表

1.哈希表与数组的关系

区别:哈希表是通过元素关键码的值直接查找元素存储位置的数据结构;数组是通过下标可以直接访问到下标对应位置上元素的数据结构。

联系:元素的关键码通过散射/哈希函数映射得到的函数值就是哈希表数组的下标(一般的哈希表组织元素的方法还是数组)。

2.哈希冲突算法

  因为哈希函数根据关键码计算哈希表数组下标会出现不同关键码计算得到同一个数组下标的可能性;这也是散射/哈希函数不能避免的。

如“除余留数”法实现的哈希函数:hash(key) = key%17;

此时,当key为6、23、40和57时,下标值都为6;这时就需要添加冲突解决。

常用冲突解决有如下两种:

1).再哈希法:采用“再哈希”法解决冲突的哈希表是一个固定大小的结构体数组,然后给哈希表元素设置一个冲突标志位,同时、当执行哈希函数时对使用过的数组下标对应的元素冲突位置1;当下次获得的下标值对应的元素冲突位为1时,则再次利用哈希算法再次算出一个下标值。在查找时,方法类似。下边将实现这种方法。

2).链地址法:采用“链地址”法解决冲突的哈希表是一个固定大小的指针数组,数组的每个元素是一个链表(单向或双向)的头指针。将关键字作为参数、利用哈希函数计算出数据应该属于哈希表中的哪个指针数组;然后,从该指针数组所指地址处构建线性链表。Linux2.6内核的哈希表就是采用这种方法实现。

其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他哈希表,该方法中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。

  最后,总的来说、哈希表的查询是飞快的。因为它不需要从头搜索,它利用Key的“哈希算法”直接定位,查找非常快,各种数据库中的数据结构基本都是它。但带来的问题是,哈希表的尺寸、哈希算法。

3.看看我们的demo

test.c

#include <stdio.h>/*
关键在于creathashaddr和hashsearch函数的实现;关键点是哈希表的构造方法和哈希冲突的解决算法
本demo哈希表的构造采用“除留余数”法,处理冲突采用“再哈希”法。
而Linux2.6内核处理冲突使用的是“链地址”法、因此会看到结构体中有线性链表存在。
下面从设计思想上说下链地址法:其实这种方法是将哈希查找算法和链表有机结合起来。不仅利用了hash提高查找速度,并且能很好的解决冲突;同时、比起其他方法,
由于哈希表中元素是指针(哈希表是一个指针数组)、这时除了指针数组元素空间需要提前分配外,具体数据存储还是动态分配的、
提高了内存使用率。这种方法在内存使用率和查找效率上是一个很好的权衡。
*/#define HASH_SIZE 17
typedef struct node{char *name;int age;int flag;//标志位,当前节点是否冲突;Linux2.6内核中“链地址”法,此处是一个链表指针
}mynode;
mynode hashlist[HASH_SIZE];//创建哈希表int creathashaddr(int key)
{int i; int addr = -1;for(i=0; i < HASH_SIZE; i++){addr = key%HASH_SIZE;if(hashlist[addr].flag == 0){hashlist[addr].flag = 1;return addr;}else{//哈希冲突printf("TK------->>>>gethashaddr is chongtu!!!!!\n");//add by tankaido{addr = (key + addr%10 + 1)%HASH_SIZE;}while(hashlist[addr].flag != 0);//二次哈希冲突hashlist[addr].flag = 1;return addr;}}
}void hashsearch(int age)
{int addr = age%HASH_SIZE;if(hashlist[addr].age == age){ printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}elseif(hashlist[addr].flag == 0){printf("TK------>>1111>>no this!\n");return;}else{//哈希冲突do{addr = (age + addr%10 + 1)%HASH_SIZE;if(hashlist[addr].age == age){printf("TK--------->>>>>>hashlist[%d].name is %s\n",addr,hashlist[addr].name);return;}}while(hashlist[addr].flag != 0);//二次哈希冲突}printf("TK------>>2222>>no this!\n");return;
}int main()
{int i;for (i=0; i<HASH_SIZE; i++)  {hashlist[i].name="";hashlist[i].age=0;hashlist[i].flag=0;}int j = creathashaddr(23);hashlist[j].name = "tan";hashlist[j].age = 23;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(40);hashlist[j].name = "kai";hashlist[j].age = 40;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);///j = creathashaddr(6);hashlist[j].name = "tankai";hashlist[j].age = 6;printf("TK--------->>>>>>age is %d,hashlist[%d].name is %s\n",hashlist[j].age,j,hashlist[j].name);int test;do{printf("#######please input user age:##########\n");scanf("%d",&test);printf("TK--------->>>>>age is %d\n",test);hashsearch(test);}while(test != 0);return 0;
}/*
gcc test.c -o test
./test
result is : 
TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########
*/

gcc test.c -o test

./test

TK--------->>>>>>age is 23,hashlist[6].name is tan
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 40,hashlist[13].name is kai
TK------->>>>gethashaddr is chongtu!!!!!
TK--------->>>>>>age is 6,hashlist[10].name is tankai
#######please input user age:##########
23
TK--------->>>>>age is 23
TK--------->>>>>>hashlist[6].name is tan
#######please input user age:##########
40
TK--------->>>>>age is 40
TK--------->>>>>>hashlist[13].name is kai
#######please input user age:##########
6
TK--------->>>>>age is 6
TK--------->>>>>>hashlist[10].name is tankai
#######please input user age:##########
57
TK--------->>>>>age is 57
TK------>>2222>>no this!
#######please input user age:##########
5
TK--------->>>>>age is 5
TK------>>1111>>no this!
#######please input user age:##########


这篇关于Linux内核常用数据结构——顺序表之哈希表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/812285

相关文章

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

Linux中SSH服务配置的全面指南

《Linux中SSH服务配置的全面指南》作为网络安全工程师,SSH(SecureShell)服务的安全配置是我们日常工作中不可忽视的重要环节,本文将从基础配置到高级安全加固,全面解析SSH服务的各项参... 目录概述基础配置详解端口与监听设置主机密钥配置认证机制强化禁用密码认证禁止root直接登录实现双因素

在Linux终端中统计非二进制文件行数的实现方法

《在Linux终端中统计非二进制文件行数的实现方法》在Linux系统中,有时需要统计非二进制文件(如CSV、TXT文件)的行数,而不希望手动打开文件进行查看,例如,在处理大型日志文件、数据文件时,了解... 目录在linux终端中统计非二进制文件的行数技术背景实现步骤1. 使用wc命令2. 使用grep命令

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信

Spring如何使用注解@DependsOn控制Bean加载顺序

《Spring如何使用注解@DependsOn控制Bean加载顺序》:本文主要介绍Spring如何使用注解@DependsOn控制Bean加载顺序,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录1.javascript 前言2. 代码实现总结1. 前言默认情况下,Spring加载Bean的顺

linux重启命令有哪些? 7个实用的Linux系统重启命令汇总

《linux重启命令有哪些?7个实用的Linux系统重启命令汇总》Linux系统提供了多种重启命令,常用的包括shutdown-r、reboot、init6等,不同命令适用于不同场景,本文将详细... 在管理和维护 linux 服务器时,完成系统更新、故障排查或日常维护后,重启系统往往是必不可少的步骤。本文

基于Linux的ffmpeg python的关键帧抽取

《基于Linux的ffmpegpython的关键帧抽取》本文主要介绍了基于Linux的ffmpegpython的关键帧抽取,实现以按帧或时间间隔抽取关键帧,文中通过示例代码介绍的非常详细,对大家的学... 目录1.FFmpeg的环境配置1) 创建一个虚拟环境envjavascript2) ffmpeg-py

gitlab安装及邮箱配置和常用使用方式

《gitlab安装及邮箱配置和常用使用方式》:本文主要介绍gitlab安装及邮箱配置和常用使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装GitLab2.配置GitLab邮件服务3.GitLab的账号注册邮箱验证及其分组4.gitlab分支和标签的

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删