让星星⭐月亮告诉你,HashMap在put数据时是如何找到要存放的位置的?

2024-05-14 14:08

本文主要是介绍让星星⭐月亮告诉你,HashMap在put数据时是如何找到要存放的位置的?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

⭐⭐⭐初印象🌙🌙🌙:

初识HashMap时,知道HashMap是用来存放Key-Value这样的键值对的,也知道HashMap的底层数据结构是:数组+链表+红黑树,且数组长度为2的x次幂。

⭐⭐⭐疑问🌙🌙🌙:

那么往HashMap中添加键值对时,是什么决定了键值对的存放位置呢?即存放位置是如何计算出来的呢?相同的疑问可能还会以下面的问题描述方式提出来:
其他描述方式:
1.向HashMap中put数据时,数据是如何找到HashMap中Node<K,V>[] table数组的对应索引下标位置的?
2.HashMap在put<K,V>时是如何找到要存放的数组索引下标的位置的?键值对是如何与数组索引下标产生映射关联关系的?
比如有个HashMap的数组中有16个索引下标位置,一个数据过来要put到HashMap中,是谁来决定该元素会被分配到具体哪个索引下标位置的?如何保证哪块代码处理的?

⭐⭐⭐分析🌙🌙🌙:

既然是由put方法引出的问题,自然要到put的源代码里找寻线索。当我们认真研读put的源码时会发现下面这三段代码,我们分别解读一下:

  1. put调用putVal方法:
    public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
    }
  2. 根据Key-键值计算出新的哈希码值:
    static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
     这段代码里首先调用Object的hashCode()方法,计算出key的原始哈希码;
     然后,将原始哈希码无符号右移了16位,即高16位被移到了低16位(
    问1:为啥做无符号右移操作,即为啥要从高位往低位移动呢?移动后又为何要做异或操作?
    答1:低位不确保有没有1,但高位肯定有1,拿无符号右移后的值与原值做异或操作,可以得到一个1的分布在高低位相对更加均匀的结果。(为啥要得到这样的结果呢?是为了在跟数组长度一起做&与运算计算索引下标时,得到相对更加均匀分撒的结果,这样根据不同key得出的数组索引下标尽可能分撒的话,就不容易发生哈希碰撞,也就降低了一开始往HashMap中添加数据时链表的产生几率)
    问2:为啥又非得是16位呢?
    答2:因为hashCode是一个int整形32位,高16位无符号右移16位,可以保证高位与低位能充分混合,这样的话,再拿无符号右移后的值与原值做异或操作,可以使得1在高低位的分布更加均匀。
    )
     然后无符号右移后的值与原哈希码值做异或操作,得到一个1的分布在高低位相对更加均匀的新哈希码值。
  3. 根据数组长度及新哈希码计算索引位置:
    在put调用的putVal方法的里,有这么一段代码:
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
    ………………………………后续代码省略…………………………………………
    注意第2个if语句里隐藏了这么一句:p = tab[i = (n - 1) & hash]
    这里就是根据数组长度和新哈希码值计算数组下标的地方,其中:
     tab从第三段代码可以看到是从table得来的,而table就是HashMap中的存放链表头节点的数组:Node<K,V> table;
     n是数组的长度,为2的x次幂的数,故(n-1)代表的二进制位全是1;
     hash是从第二段代码中得到的新哈希值
     由上可以进而推导出,在公式(n-1)&hash中:
    当hash全为0时,得到最小值为0;
    当hash全为1时,得到最大值为(n-1);
    当hash部分为0部分为1时,得到介于最大值和最小值之间的整数;
    这样就确保了,根据就根据key得到了要存放的数组索引下标,而且该下标肯定会落在数组长度对应的索引范围内。

这篇关于让星星⭐月亮告诉你,HashMap在put数据时是如何找到要存放的位置的?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/988948

相关文章

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很