深入Java集合:HashSet实现原理

2024-08-26 20:18

本文主要是介绍深入Java集合:HashSet实现原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

概述

HashSet 实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。它不保证 set 的 迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用null 元素。

实现

对于 HashSet 而言,它是基于 HashMap 实现的,HashSet 底层使用 HashMap 来保存 所有元素,因此HashSet 的实现比较简单,相关 HashSet 的操作,基本上都是直接调用底 层 HashMap 的相关方法来完成, HashSet 的源代码如下:

 public class HashSet<E>extends AbstractSet<E>implementsSet<E>, Cloneable, java.io.Serializable{static final long serial VersionUID = -5024744406713321676L;// 底层使用HashMap来保存HashSet中所有元素。private transient HashMap<E,Object> map;// 定义一个虚拟的 Object 对象作为HashMap 的value,将此对象定义为 static final。private static final Object PRESENT = new Object();/*** 默认的无参构造器,构造一个空的HashSet。** 实际底层会初始化一个空的HashMap,并使用默认初始容量为16 和加载因子0.75。*/public HashSet() {map = new HashMap<E,Object>();}/*** 构造一个包含指定collection中的元素的新set。** 实际底层使用默认的加载因子0.75和足以包含指定* collection 中所有元素的初始容量来创建一个HashMap。* @param c 其中的元素将存放在此set中的 collection。*/public HashSet(Collection<? extendsE> c) {map = newHashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c);}/*** 以指定的initialCapacity和 loadFactor构造一个空的HashSet。** 实际底层以相应的参数构造一个空的HashMap。* @param initialCapacity 初始容量。* @param loadFactor 加载因子。*/public HashSet(intinitialCapacity, floatloadFactor) {map = new HashMap<E,Object>(initialCapacity, loadFactor);}/*** 以指定的initialCapacity构造一个空的HashSet。** 实际底层以相应的参数及加载因子loadFactor为 0.75构造一个空的HashMap。* @param initialCapacity 初始容量。*/public HashSet(intinitialCapacity) {map = newHashMap<E,Object>(initialCapacity);}/*** 以指定的initialCapacity和 loadFactor构造一个新的空链接哈希集合。* 此构造函数为包访问权限,不对外公开,实际只是是对LinkedHashSet的支持。** 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。* @param initialCapacity 初始容量。* @param loadFactor 加载因子。* @param dummy 标记。*/HashSet(intinitialCapacity, floatloadFactor, booleandummy) {map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);}/*** 返回对此set 中元素进行迭代的迭代器。返回元素的顺序并不是特定的。** 底层实际调用底层HashMap的 keySet来返回所有的key。* 可见 HashSet中的元素,只是存放在了底层HashMap的 key 上,* value 使用一个staticfinal的 Object对象标识。* @return 对此set 中元素进行迭代的Iterator。*/public Iterator<E> iterator() {return map.keySet().iterator();}/*** 返回此 set 中的元素的数量(set 的容量)。** 底层实际调用 HashMap 的 size()方法返回 Entry 的数量,就得到该 Set 中元素的个数。* @return 此set 中的元素的数量(set 的容量)。*/public int size() {return map.size();}/*** 如果此set不包含任何元素,则返回true。** 底层实际调用HashMap的 isEmpty()判断该HashSet是否为空。* @return 如果此set不包含任何元素,则返回true。*/public boolean isEmpty() {return map.isEmpty();}/*** 如果此set包含指定元素,则返回true。* 更确切地讲,当且仅当此set包含一个满足(o==null? e==null : o.equals(e))* 的e 元素时,返回true。** 底层实际调用HashMap的 containsKey判断是否包含指定key。* @param o 在此 set中的存在已得到测试的元素。* @return 如果此set包含指定元素,则返回true。*/public boolean contains(Object o) {return map.containsKey(o);}/*** 如果此set中尚未包含指定元素,则添加指定元素。* 更确切地讲,如果此set没有包含满足(e==null? e2==null : e.equals(e2))* 的元素e2,则向此set 添加指定的元素e。* 如果此set已包含该元素,则该调用不更改set 并返回false。** 底层实际将将该元素作为key放入 HashMap。* 由于 HashMap 的 put()方法添加 key-value 对时,当新放入 HashMap 的 Entry 中 key* 与集合中原有Entry的 key相同(hashCode()返回值相等,通过equals比较也返回t rue),* 新添加的Entry的 value会将覆盖原来Entry的 value,但key不会有任何改变,* 因此如果向HashSet中添加一个已经存在的元素时,新添加的集合元素将不会被放入H ashMap 中,* 原来的元素也不会有任何改变,这也就满足了Set 中元素不重复的特性。* @param e 将添加到此set 中的元素。* @return 如果此set尚未包含指定元素,则返回true。*/public boolean add(E e){return map.put(e, PRESENT)==null;}/*** 如果指定元素存在于此set 中,则将其移除。* 更确切地讲,如果此set包含一个满足(o==null? e==null : o.equals(e))的元素e,* 则将其移除。如果此set已包含该元素,则返回true* (或者:如果此 set 因调用而发生更改,则返回 true)。(一旦调用返回,则此 set 不再 包含该元素)。** 底层实际调用HashMap的 remove方法删除指定Entry。* @param o 如果存在于此set中则需要将其移除的对象。* @return 如果set 包含指定元素,则返回true。*/public boolean remove(Object o){return map.remove(o)==PRESENT;}/*** 从此set 中移除所有元素。此调用返回后,该set将为空。** 底层实际调用HashMap的 clear方法清空Entry中所有元素。*/public void clear() {map.clear();}/*** 返回此HashSet实例的浅表副本:并没有复制这些元素本身。** 底层实际调用HashMap的 clone()方法,获取HashMap的浅表副本,并设置到HashSet 中。*/public Object clone() {try{HashSet<E> newSet = (HashSet<E>) super.clone();newSet.map = (HashMap<E, Object>) map.clone();return newSet;} catch(CloneNotSupportedException e) {throw newInternalError();}}
}

相关说明

1) 相关 HashMap 的实现原理,请参考上一遍总结:深入 Java 集合:HashMap 实现原理

2) 对于 HashSet 中保存的对象,请注意正确重写其 equals 和 hashCode 方法,以保证 放入的对象的唯一性。

业务思想

HashSet部分的总结个人感觉是很枯燥的,研究了一遍源码,深感痛彻,很值得去学习提升一下呢!其在业务中的使用也是比较多的,建议大家有时间花上个半晚上研究一下,你收获甚多的。


这篇关于深入Java集合:HashSet实现原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109578

相关文章

使用shardingsphere实现mysql数据库分片方式

《使用shardingsphere实现mysql数据库分片方式》本文介绍如何使用ShardingSphere-JDBC在SpringBoot中实现MySQL水平分库,涵盖分片策略、路由算法及零侵入配置... 目录一、ShardingSphere 简介1.1 对比1.2 核心概念1.3 Sharding-Sp

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java 正则表达式的使用实战案例

《Java正则表达式的使用实战案例》本文详细介绍了Java正则表达式的使用方法,涵盖语法细节、核心类方法、高级特性及实战案例,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录一、正则表达式语法详解1. 基础字符匹配2. 字符类([]定义)3. 量词(控制匹配次数)4. 边

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java中的stream流分组示例详解

《Java中的stream流分组示例详解》Java8StreamAPI以函数式风格处理集合数据,支持分组、统计等操作,可按单/多字段分组,使用String、Map.Entry或Java16record... 目录什么是stream流1、根据某个字段分组2、按多个字段分组(组合分组)1、方法一:使用 Stri

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

使用Spring Cache本地缓存示例代码

《使用SpringCache本地缓存示例代码》缓存是提高应用程序性能的重要手段,通过将频繁访问的数据存储在内存中,可以减少数据库访问次数,从而加速数据读取,:本文主要介绍使用SpringCac... 目录一、Spring Cache简介核心特点:二、基础配置1. 添加依赖2. 启用缓存3. 缓存配置方案方案

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

python 线程池顺序执行的方法实现

《python线程池顺序执行的方法实现》在Python中,线程池默认是并发执行任务的,但若需要实现任务的顺序执行,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋... 目录方案一:强制单线程(伪顺序执行)方案二:按提交顺序获取结果方案三:任务间依赖控制方案四:队列顺序消