Netty组件之ByteBuf详解 源码分析

2023-11-05 09:59

本文主要是介绍Netty组件之ByteBuf详解 源码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

学习了前面的一些netty组件,此篇将讲解最后一个组件ByteBuf,ByteBuf是对Nio的ByteBuffer的一个增强。

1.创建ByteBuf对象

ByteBuf buf = ByteBufAllocator.DEFAULT.buffer();

这是最基本的创建方式,我们也可指定其初始容量和最大容量(可扩容)。

首先概要看看源码,有一个大致的了解

点进我们上面的buffer方法,源码的关键代码如下

 继续查看AbstractByteBufAllocator子实现抽象类,对应三个buffer方法的重载并判断需要创建直接内存或是堆内存,和NIO的ByteBuffer雷同:

 继续查看分配的一些细节,点入分配的方法,可以看到一些初始值

进入关键方法,newHeaoBuffer方法,如下,是两个抽象方法,我们可以看到下面的两个实现类

2.直接内存vs堆内存

分配两种不同空间的方式如下,底层就是上面看过的源码。其中堆内存的空间分配空间效率较快但是读写效率较高,直接内存相反,如果对Nio不了解的可以看看Nio的零拷贝那一篇。

ByteBuf buf = ByteBufAllocator.DEFAULT.directBuffer();ByteBufAllocator.DEFAULT.heapBuffer();
  • 直接内存创建和销毁的代价昂贵,但读写性能高(少一次内存复制),适合配合池化功能一起用
  • 直接内存对GC压力小,因为这部分内存不受JVM垃圾回收的管理,但也要注意及时主动释放

如果使用buffer方法默认分配的直接内存

3.池化vs非池化

这里池化的思想和数据库连接池和线程池一个思想,netty的ByteBuf也支持这一种的池化

池化的最大意义在于可以重用 ByteBuf,优点有

  • 没有池化、则每次都需要创建新的ByteBuf实例,这个操作对直接内存代价昂贵,就算是堆内存,内存也会,也会增加GC的压力
  • 有了池化,则可以重用池中 ByteBuf实例,并且采用了与jemalloc类似的内存分配算法提升分配效率
  • 高并发时,池化功能更节约内存,减少内存溢出的可能

池化功能是否开启,可以通过下面的系统环境变量来设置(默认开启)

  • 4.1以后,非 Android平台默认启用池化实现,Android平台启用非池化实现
  • 4.1之前,池化功能还不成熟,默认是非池化实现

查看源码:

        我们创建ByteBuf时,调用的是该接口的一个成员变量,它是ByteBufUtil类中的类变量,类型依然是ByteBufAllocator

         进入ByteBufUtil找到该静态变量,并查看该类中的静态代码块

 这也就验证了我们可以使用-Dio.netty.allocator.type={unpooled|pooled}来设置是否池化ByteBuf,

-D的全称是defintion,就是定义的意思,差不多应该表达的就是用户自定义参数的意思。必须加-D

需要查看当前的ByteBuf是什么类型的,只需要打印该对象的.getClass()查看是哪个类创建的即可,带pooled的即池化,带direct的即分配直接内存。如class UnpooledByteBufAllocator$InstrumentedUnpooledUnsafeNoCleanerDirectByteBuf

4.组成

ByteBuf由四部分组成

 也就是一边写一边读,读到后面前面的数据也就没用了,当写满后还会动态扩容,最大扩容大小可以自己设定,默认为int的最大值。此部分和ByteBuffer的区别显而易见,有两个指针,所以不需要切换读写模式,方便使用。

5.写入

方法名含义备注
writeInt(int value)写入int值Big Endian,大端写入,即0x250,写入后 00 00 02 50
writeIntLE(int value)写入int值Little Endian,小端写入,即0x250,写入后 50 02 00 00
writeBoolean(int value)写入boolean值用一字节01|00代表true|false
writeByte(int value)写入byte值
writeBytes(byte[] src)写入byte[]
writeBytes(ByteBuf src)写入netty的ByteBuf
writeBytes(ByteBuffer src)写入nio的ByteBuf

int writeCharSequence(CharSequence

sequence,Charset charset)

写入字符串
  • 这些方法的未指明返回值的,其返回值都是 ByteBuf,意味着可以链式调用
  • 网络传输默认习惯是 Big Endian

小端存储指从内存的低地址开始,先存储数据的低序字节再存高序字节;相反,大端存储指从内存的低地址开始,先存储数据的高序字节再存储数据的低序字节。

 还有一类方法是set开头的一系列方法,也可以写入数据,但不会改变写指针位置

6.扩容

  • 如果写入后数据大小未超过512,则选择下一个16的整数倍,例如写入后大小为12,则扩容后capacity是16
  • 如果写入后数据大小超过512,则选择下一个2^n,例如写入后大小为513,则扩容后capacity是2^10=1024 (2^9=512已经不够了)
  • 扩容不能超过max capacity会报错

7.读取

和write相对应

 读过的内容,就属于废弃部分了,再读只能读那些尚未读取的部分

如果需要重复读取int整数5,怎么办?
可以在read前先做个标记mark

buf.markReaderIndex();//做一个读标记
buf.resetReaderIndex();//回到标记

除了做标记,还可以通过一个个的索引get()值

8.retain&release

由于Netty中有堆外内存的ByteBuf 实现,堆外内存最好是手动来释放,而不是等GC垃圾回收。

  • UnpooledHeapByteBuf使用的是JVM内存,只需等GC回收内存即可
  • UnpooledDirectByteBuf使用的就是直接内存了,需要特殊的方法来回收内存
  • PooledByteBuf和它的子类使用了池化机制,需要更复杂的规则来回收内存
     

Netty这里采用了引用计数法来控制回收内存,每个ByteBuf都实现了ReferenceCounted引用计数法接口

  • 每个ByteBuf对象的初始计数为1
  • 调用release方法计数减1,如果计数为0,ByteBuf内存被回收
  • 调用retain方法计数加1,表示调用者没用完之前,其它handler即使调用了release 也不会造成回收
  • 当计数为0时,底层内存会被回收,这时即使ByteBuf对象还在,其各个方法均无法正常使用
     

源码如下:

 ReferenceCounted接口,具体的实现针对不同的ByteBuf实现

 谁来负责release呢?

我们都知道ByteBuf存在在一个管道里互相传递,当有哪一个handler中不在需要传递该ByteBuf时,就可以销毁了。

想象这么一个情景,我们读取到ByteBuf在h1Hadnler里把该ByteBuf转为了String,h1把String传递给h2,而不是ByteBuf,此时为了能给及时的释放,h1就应该释放此ByteBuf的分配的空间;如果h1把ByteBuf传给h2,h2继续传下去给tail,则已经到尾部,ByteBuf已经没用了,需要由tail释放。

基本规则是,谁是最后使用者,谁负责release,详细分析如下

TailContext分析

找到一个名为TailContext的类,此类就是我们最后的tail节点,如下

 因为它实现了ChannelInboundHandler,所以可以找到它实现的channelRead方法,如下:

深入查看,可以看到

可以看到,如果msg是一个ReferenceCounted实现的话,Tail就会调用该该对象的release方法。 

HeadContext分析

 头结点不仅实现了Inboud还实现了outbound,因为HeadContex也需要做一个收尾动作,Netty 组件 Channel 、Future 、Promise_清风拂来水波不兴的博客-CSDN博客

前面说过write事件是从后往前传递,从tail开始,一直到head,head当然要留意write事件了

9.slice

【零拷贝】的体现之一,对原始ByteBuf进行切片成多个ByteBuf,切片后的ByteBuf并没有发生内存复制,还是使用原始ByteBuf的内存,切片后的 ByteBuf维护独立的read,write指针

ByteBuf buf = ByteBufAllocator.DEFAULT.buffer(10);
buf.writeBytes(new byte[]{'a','b','c','d','e','f'});
// slice(int index, int length)从index切length个,返回一个新的ByteBuf对象
ByteBuf slice = buf.slice(0,5);
  • 也就是这个新的对象和以前的公用同一段内存,任意一个改了的话其他的也会改;
  • 切片后的新ByteBuf容量不能增加,因为增加的话再写数据就乱套了
  • 如果切片后的ByteBuf进行了release的话,就不能再使用了,所以一般分片后都会给原始的ByteBuf进行retain,防止被回收,导致切片的使用出异常,但一定要记得release,否则会导致幽灵空间,也就是内存泄漏

10.deplicate

【零拷贝】的体现之一,就好比截取了原始ByteBuf所有内容,并且没有max capacity的限制,也是与原始ByteBuf使用同一块底层内存,只是读写指针是独立的

11.copy

会将底层内存数据进行深拷贝,因此无论读写,都与原始 ByteBuf 无关

12.composite

把多个小的ByteBuf组合成一个大的ByteBuf,也没用复制操作,但是却带来了更复杂的维护,因为这只是逻辑上的合并

ByteBuf buf = ByteBufAllocator.DEFAULT.buffer(5);
ByteBuf buf1 = ByteBufAllocator.DEFAULT.buffer(5);
buf.writeBytes(new byte[]{1,2,3,4,5});
buf1.writeBytes(new byte[]{6,7,8,9,10});
//创建CompositeByteBuf对象
CompositeByteBuf buffer = ByteBufAllocator.DEFAULT.compositeBuffer();
//addComponents(boolean increaseWriterIndex,ByteBuf... buffers),布尔值表示组合后读写指针要更新,这是个小小的坑
buffer.addComponents(true,buf, buf1);
System.out.println(buffer);

13.UnPooled

Unpooled是一个工具类,类如其名,提供了非池化的ByteBuf创建、组合、复制等操作这里仅介绍其跟【零拷贝】相关的wrappedBuffer方法,可以用来包装ByteBuf
 

ByteBuf buf1 = ByteBufAllocator.DEFAULT.buffer(5);
buf1.writeBytes(new byte[]{1, 2, 3, 4, 5});
ByteBuf buf2 = ByteBufAllocator.DEFAULT.buffer(5);
buf2.writeBytes(new byte[]{6,7,8,9,10});
//当包装ByteBuf个数超过一个时,底层使用了CompositeByteBuf
ByteBuf buf3 = Unpooled.wrappedBuffer(buf1, buf2);
System.out.println(ByteBufUtil.prettyHexDump(buf3));

输出

 

这篇关于Netty组件之ByteBuf详解 源码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/349095

相关文章

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

mysql表操作与查询功能详解

《mysql表操作与查询功能详解》本文系统讲解MySQL表操作与查询,涵盖创建、修改、复制表语法,基本查询结构及WHERE、GROUPBY等子句,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随... 目录01.表的操作1.1表操作概览1.2创建表1.3修改表1.4复制表02.基本查询操作2.1 SE

MySQL中的锁机制详解之全局锁,表级锁,行级锁

《MySQL中的锁机制详解之全局锁,表级锁,行级锁》MySQL锁机制通过全局、表级、行级锁控制并发,保障数据一致性与隔离性,全局锁适用于全库备份,表级锁适合读多写少场景,行级锁(InnoDB)实现高并... 目录一、锁机制基础:从并发问题到锁分类1.1 并发访问的三大问题1.2 锁的核心作用1.3 锁粒度分