【JVM精通之路】垃圾回收-三色标记算法

2024-05-29 00:12

本文主要是介绍【JVM精通之路】垃圾回收-三色标记算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先预期你已经基本了解垃圾回收的相关知识,包括新生代垃圾回收器,老年代垃圾回收器,以及他们的算法,可达性分析等等。


先想象一个场景

最开始黑色节点是GC-Roots的根节点,这些对象有这样的特点因此被选为垃圾回收的根节点。

虚拟机栈(栈桢中的本地变量表)中的引用的对象 
方法区中的类静态属性引用的对象 
方法区中的常量引用的对象 
本地方法栈中JNI的引用的对象

记不住没事~你只需要知道,这些对象都有长生不老的特点,它一直存在,所以从它开始遍历查找,才知道哪些对象没有人使用,可以被回收。

那么最开始堆里的对象默认都是白色的。

现在要开始垃圾回收了。

如果是你你怎么设计,嗯,我们因为有这张图从三维看二维开天眼立马知道哪些对象是活着的。

但是程序不知道,它需要遍历。这里需要注意一个其他博客都没有提到的点,这里是GC-Roots引用了右边的对象,而不是右边的对象引用了GC-Roots。

你可以这么思考,因为是Roots依赖了右边的某些对象,又因为Roots是持久存在的,那么右边某些对象也必须存在。所以是Roots引用了某些对象,所以这些对象必须存活。很多博客在这里没有说清楚引用关系。

如果是右边对象依赖了GC-Roots,那么右边的对象存在与否和Roots有什么关系?

因为人引用了空气,他需要空气,所以必须空气存在。

1.定义

黑色:一直存在不需要清理的对象,它用到的对象都确定需要存活。下一次不扫描黑色对象。

灰色:一直存在不需要清理的对象,它用到的其他对象还没确定是否存活。下一次从它开始扫描。

白色:扫描完毕后,还是白色的对象,就清理掉。

颜色的标记 记录在每个对象的头部信息的Markword中!

CMS有四步,初始标记(STW),并发标记,重复标记(STW),并发清除四步。

1.开始遍历

第一次遍历:

第二次遍历:

 第三次扫描:

 第四次扫描:

 第五次扫描:

 第六次扫描

 

 第七次扫描:

 然后这时候把所有白色对象清理掉。

以上的图的过程都是发生在并发标记中。先不考虑重复标记。

2.思考

2.1 三色标记解决了什么问题

思考一下,你现在幻身为一个线程,你只知道堆里有一堆对象,你并不知道他们是什么颜色,你现在只知道根节点在堆内存的哪个地址下。老板叫你去清理堆内存的废物对象。而且你随时可能会被CPU抽掉灵魂。(线程被阻塞)

你:我特么不能每次醒过来都从根节点去遍历吧。不行我得有个记事本,(线程可以访问标记记录集合)记住哪些我标记了的。这样下次直接从已经标记的对象开始遍历。

那这时候只需要黑白二色标记就够了。

但是有几个问题:

1.黑色太多了。我需要从很多黑色对象开始找,费时,麻烦!

2.我在把对象18由白色变黑的过程中,如果对象7对象18抛弃了。那我是不是多标了。让本来应该死亡清除的对象18没有被清除。

3.现在堆内存中全都黑了,我要清理垃圾了。正要清理的时候,对象7突然引用了对象17,这时候就会出现漏标的问题。

如何解决呢?

思考...


问题1,那么能不能有个中间态。把还需要往下扫描的对象变成灰色,把不需要继续往下扫描的对象变成黑色。这时候往回看上文的扫描图,可以看见灰色节点的集合是非常少的,因此每次我只需要从较少的节点开始扫描

好了我手里有两个笔记本了。一个灰色笔记本,一个黑色笔记本。

解决了扫描对象过多的问题的同时也能解决STW的时间。

重新想起CMS有四步过程,初始标记(STW),并发标记,重复标记(STW),并发清除四步。

因为重新标记阶段也只需要从灰色节点开始扫描了。因为黑色是确定是活的,就算重新标记之后死掉了,也最多变成浮动垃圾,因为重新标记阶段是STW的,所以也不会有引用的变化。

并且只有并发标记的过程才会有引用的变化。


问题2,本来应该清除的对象没有被清除,这问题不大,当成浮动垃圾下一次垃圾回收再扫描一次就行了。多标本质造成浮动垃圾的问题。问题不大。

问题3,漏标怎么办,不能错杀啊。没有被标记的对象是要被杀掉的。不能被错杀。那么我必须stop the world了!STW。

只有停止所有用户线程才能避免我在标记对象的过程中,有对象复活了但是没被我标记,被活埋了!这个很重要。并不是因为三色标记才能避免漏标问题。三色标记只是为了减少STW的时间,以及减少遍历树的时间。

很多博客这里压根没讲清楚因果关系。只告诉你三色标记和标记清除算法里,有初始标记,并发标记,重复标记,怎么变色,多标,漏标问题。但是没把问题和解决方案对应起来。

我们都知道CMS有四步,初始标记(STW),并发标记,重复标记(STW),并发清除四步。

我不能从GC-Roots开始遍历的时候就STW一直到并发清除吧。STW这么长那么CMS的意义就不存在了。那么考虑哪些步骤可以与用户线程并发执行。

初始标记:将直接与GC-Roots的对象变灰,这部分速度很快,且不能出错,可以STW,性价比高。

并发标记:需要将对所有灰色节点遍历树结构,比较耗时,这部分肯定不能STW。

重复标记:这部分是最后扫尾工作,肯定不能让用户线程来参一脚,必须STW。并且修复并发标记时的错误标记,把并发标记漏标的白色变灰。

这里很多博客也没说清楚是什么错误。那么我们研究一下:并发标记只会让白变灰,或让灰变黑。

因为到重复标记时,堆内存只有黑白色了。

那么修复错误:

让白变灰:因为并发标记没有遍历到的对象一直白色,并发标记到重复标记开始之前如果有黑色对象引用到了白色对象。那么重复标记需要将白变灰。同时它是STW,这时变灰正好解决漏标。

为什么没有让黑变灰:正常来说并发标记标记为黑色后,但是之后黑色对象如果没有被任何对象引用了。需要将它变灰。但是重复标记只是扫尾工作,它是STW的,并且需要解决漏标问题。如果此时又让黑变灰,那么是否又考虑让灰变白。但是这两步完全可以放到下一轮垃圾回收的并发标记中去做,因为并发标记不STW,同时也能扫描到灰色对象。这里也是CMS单次回收不能很好解决浮动垃圾的问题,他可以解决,但是没必要。

之后并发清除可以清除白色对象了。

总结:

也就是三色标记法,可以区分标记的过程中的粒度,从而让垃圾回收器根据不同的标记阶段,更好的做出不一样的行为,并且对不同的行为采用不一样的STW规则,从而减少STW时间,增加用户线程运行时间。黑色就是需要活着的对象,灰色就是还需要往下遍历的对象,白色就是需要清除的对象。三个颜色也是标明了对象处于的扫描阶段。

这篇关于【JVM精通之路】垃圾回收-三色标记算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1012092

相关文章

Spring事务传播机制最佳实践

《Spring事务传播机制最佳实践》Spring的事务传播机制为我们提供了优雅的解决方案,本文将带您深入理解这一机制,掌握不同场景下的最佳实践,感兴趣的朋友一起看看吧... 目录1. 什么是事务传播行为2. Spring支持的七种事务传播行为2.1 REQUIRED(默认)2.2 SUPPORTS2

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java进程异常故障定位及排查过程

《Java进程异常故障定位及排查过程》:本文主要介绍Java进程异常故障定位及排查过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、故障发现与初步判断1. 监控系统告警2. 日志初步分析二、核心排查工具与步骤1. 进程状态检查2. CPU 飙升问题3. 内存

java中新生代和老生代的关系说明

《java中新生代和老生代的关系说明》:本文主要介绍java中新生代和老生代的关系说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、内存区域划分新生代老年代二、对象生命周期与晋升流程三、新生代与老年代的协作机制1. 跨代引用处理2. 动态年龄判定3. 空间分

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

从原理到实战深入理解Java 断言assert

《从原理到实战深入理解Java断言assert》本文深入解析Java断言机制,涵盖语法、工作原理、启用方式及与异常的区别,推荐用于开发阶段的条件检查与状态验证,并强调生产环境应使用参数验证工具类替代... 目录深入理解 Java 断言(assert):从原理到实战引言:为什么需要断言?一、断言基础1.1 语

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1