tcp的拆包,黏包解决方案

2023-11-04 22:30
文章标签 解决方案 tcp 拆包 黏包

本文主要是介绍tcp的拆包,黏包解决方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在进行Java NIO学习时,发现,如果客户端连续不断的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起的情况,这就是TCP协议中经常会遇到的粘包以及拆包的问题。

我们都知道TCP属于传输层的协议,传输层除了有TCP协议外还有UDP协议。那么UDP是否会发生粘包或拆包的现象呢?答案是不会。UDP是基于报文发送的,从UDP的帧结构可以看出,在UDP首部采用了16bit来指示UDP数据报文的长度,因此在应用层能很好的将不同的数据报文区分开,从而避免粘包和拆包的问题。而TCP是基于字节流的,虽然应用层和TCP传输层之间的数据交互是大小不等的数据块,但是TCP把这些数据块仅仅看成一连串无结构的字节流,没有边界;另外从TCP的帧结构也可以看出,在TCP的首部没有表示数据长度的字段,基于上面两点,在使用TCP传输数据时,才有粘包或者拆包现象发生的可能。

粘包、拆包表现形式

现在假设客户端向服务端连续发送了两个数据包,用packet1和packet2来表示,那么服务端收到的数据可以分为三种,现列举如下:

第一种情况,接收端正常收到两个数据包,即没有发生拆包和粘包的现象,此种情况不在本文的讨论范围内。normal

第二种情况,接收端只收到一个数据包,由于TCP是不会出现丢包的,所以这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。one

第三种情况,这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。这两种情况如果不加特殊处理,对于接收端同样是不好处理的。half_oneone_half

粘包、拆包发生原因

发生TCP粘包或拆包有很多原因,现列出常见的几点,可能不全面,欢迎补充,

1、要发送的数据大于TCP发送缓冲区剩余空间大小,将会发生拆包。

2、待发送数据大于MSS(最大报文长度),TCP在传输前将进行拆包。

3、要发送的数据小于TCP发送缓冲区的大小,TCP将多次写入缓冲区的数据一次发送出去,将会发生粘包。

4、接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。

等等。

粘包、拆包解决办法

通过以上分析,我们清楚了粘包或拆包发生的原因,那么如何解决这个问题呢?解决问题的关键在于如何给每个数据包添加边界信息,常用的方法有如下几个:

1、发送端给每个数据包添加包首部,首部中应该至少包含数据包的长度,这样接收端在接收到数据后,通过读取包首部的长度字段,便知道每一个数据包的实际长度了。

2、发送端将每个数据包封装为固定长度(不够的可以通过补0填充),这样接收端每次从接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。

3、可以在数据包之间设置边界,如添加特殊符号,这样,接收端通过这个边界就可以将不同的数据包拆分开。

等等。

样例程序

我将在程序中使用两种方法来解决粘包和拆包问题,固定数据包长度和添加长度首部,这两种方法各有优劣。固定数据包长度传输效率一般,尤其是在要发送的数据长度长短差别很大的时候效率会比较低,但是编程实现比较简单;添加长度首部虽然可以获得较高的传输效率,冗余信息少且固定,但是编程实现较为复杂。下面给出的样例程序是基于之前的文章《Java中BIO,NIO和AIO使用样例》中提到的NIO实例的,如果对NIO的使用还不是很熟悉,可以先了解一下Java中NIO编程。

固定数据包长度

这种处理方式的思路很简单,发送端在发送实际数据前先把数据封装为固定长度,然后在发送出去,接收端接收到数据后按照这个固定长度进行拆分即可。发送端程序如下:

 
  1. // 发送端

  2. String msg = "hello world " + number++;

  3. socketChannel.write(ByteBuffer.wrap(new FixLengthWrapper(msg).getBytes()));

  4.  
  5. // 封装固定长度的工具类

  6. public class FixLengthWrapper {

  7.  
  8. public static final int MAX_LENGTH = 32;

  9. private byte[] data;

  10.  
  11. public FixLengthWrapper(String msg) {

  12. ByteBuffer byteBuffer = ByteBuffer.allocate(MAX_LENGTH);

  13. byteBuffer.put(msg.getBytes());

  14. byte[] fillData = new byte[MAX_LENGTH - msg.length()];

  15. byteBuffer.put(fillData);

  16. data = byteBuffer.array();

  17. }

  18.  
  19. public FixLengthWrapper(byte[] msg) {

  20. ByteBuffer byteBuffer = ByteBuffer.allocate(MAX_LENGTH);

  21. byteBuffer.put(msg);

  22. byte[] fillData = new byte[MAX_LENGTH - msg.length];

  23. byteBuffer.put(fillData);

  24. data = byteBuffer.array();

  25. }

  26.  
  27. public byte[] getBytes() {

  28. return data;

  29. }

  30.  
  31. public String toString() {

  32. StringBuilder sb = new StringBuilder();

  33. for (byte b : getBytes()) {

  34. sb.append(String.format("0x%02X ", b));

  35. }

  36. return sb.toString();

  37. }

  38. }

可以看到客户端在发送数据前首先把数据封装为长度为32bytes的数据包,这个长度是根据目前实际数据包长度来规定的,这个长度必须要大于所有可能出现的数据包的长度,这样才不会出现把数据“截断”的情况。接收端程序如下:

 
  1. private static void processByFixLength(SocketChannel socketChannel) throws IOException {

  2. while (socketChannel.read(byteBuffer) > 0) {

  3.  
  4. byteBuffer.flip();

  5. while (byteBuffer.remaining() >= FixLengthWrapper.MAX_LENGTH) {

  6. byte[] data = new byte[FixLengthWrapper.MAX_LENGTH];

  7. byteBuffer.get(data, 0, FixLengthWrapper.MAX_LENGTH);

  8. System.out.println(new String(data) + " <---> " + number++);

  9. }

  10. byteBuffer.compact();

  11. }

  12. }

可以看出接收端的处理很简单,只需要每次读取固定的长度即可区分出来不同的数据包。

添加长度首部

这种方式的处理较上面提到的方式稍微复杂一点。在发送端需要给待发送的数据添加固定的首部,然后再发送出去,然后在接收端需要根据这个首部的长度信息进行数据包的组合或拆分,发送端程序如下:

 
  1. // 发送端

  2. String msg = "hello world " + number++;

  3. // add the head represent the data length

  4. socketChannel.write(ByteBuffer.wrap(new PacketWrapper(msg).getBytes()));

  5.  
  6. // 添加长度首部的工具类

  7. public class PacketWrapper {

  8.  
  9. private int length;

  10. private byte[] payload;

  11.  
  12. public PacketWrapper(String payload) {

  13. this.payload = payload.getBytes();

  14. this.length = this.payload.length;

  15. }

  16.  
  17. public PacketWrapper(byte[] payload) {

  18. this.payload = payload;

  19. this.length = this.payload.length;

  20. }

  21.  
  22. public byte[] getBytes() {

  23. ByteBuffer byteBuffer = ByteBuffer.allocate(this.length + 4);

  24. byteBuffer.putInt(this.length);

  25. byteBuffer.put(payload);

  26. return byteBuffer.array();

  27. }

  28.  
  29. public String toString() {

  30. StringBuilder sb = new StringBuilder();

  31. for (byte b : getBytes()) {

  32. sb.append(String.format("0x%02X ", b));

  33. }

  34. return sb.toString();

  35. }

  36. }

从程序可以看到,发送端在发送数据前首先给待发送数据添加了代表长度的首部,首部长为4bytes(即int型长度),这样接收端在收到这个数据之后,首先需要读取首部,拿到实际数据长度,然后再继续读取实际长度的数据,即实现了组包和拆包的操作。程序如下:

 
  1. private static void processByHead(SocketChannel socketChannel) throws IOException {

  2.  
  3. while (socketChannel.read(byteBuffer) > 0) {

  4. // 保存bytebuffer状态

  5. int position = byteBuffer.position();

  6. int limit = byteBuffer.limit();

  7. byteBuffer.flip();

  8. // 判断数据长度是否够首部长度

  9. if (byteBuffer.remaining() < 4) {

  10. byteBuffer.position(position);

  11. byteBuffer.limit(limit);

  12. continue;

  13. }

  14. // 判断bytebuffer中剩余数据是否足够一个包

  15. int length = byteBuffer.getInt();

  16. if (byteBuffer.remaining() < length) {

  17. byteBuffer.position(position);

  18. byteBuffer.limit(limit);

  19. continue;

  20. }

  21. // 拿到实际数据包

  22. byte[] data = new byte[length];

  23.  
  24. byteBuffer.get(data, 0, length);

  25. System.out.println(new String(data) + " <---> " + number++);

  26. byteBuffer.compact();

  27. }

  28. }

关键信息已经在程序中做了注释,可以很明显的感觉到这种方法的处理难度相对于固定长度要大一些,不过这种方式可以获取更大的传输效率。

这里需要提醒各位同学一个问题,由于我在测试的时候采用的是一台机器连续发送数据来模拟高并发的场景,所以在测试的时候会发现服务器端收到的数据包的个数经常会小于包的序号,好像发生了丢包。但经过仔细分析可以发现,这种情况是因为TCP发送缓存溢出导致的丢包,也就是这个数据包根本没有发出来。也就是说,发送端发送数据过快,导致接收端缓存很快被填满,这个时候接收端会把通知窗口设置为0从而控制发送端的流量,这样新到的数据只能暂存在发送端的发送缓存中,当发送缓存溢出后,就出现了我上面提到的丢包,这个问题可以通过增大发送端缓存来缓解这个问题,

socketChannel.socket().setSendBufferSize(102400);  

当然这个话题不在本文的讨论范围,如果有兴趣的同学可以参阅《TCP/IP详解卷一》中的拥塞窗口一章。

关于源码说明,源码默认是把粘包和拆包处理这一部分注释掉了,分别位于NIOTcpServer和NIOTcpClient文件中,需要测试粘包和拆包处理程序的同学需要把这一段注释给去掉。

最后给出源码下载地址

参考

Netty精粹之TCP粘包拆包问题

这篇关于tcp的拆包,黏包解决方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/345607

相关文章

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏

C#文件复制异常:"未能找到文件"的解决方案与预防措施

《C#文件复制异常:未能找到文件的解决方案与预防措施》在C#开发中,文件操作是基础中的基础,但有时最基础的File.Copy()方法也会抛出令人困惑的异常,当targetFilePath设置为D:2... 目录一个看似简单的文件操作问题问题重现与错误分析错误代码示例错误信息根本原因分析全面解决方案1. 确保

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

SpringBoot3匹配Mybatis3的错误与解决方案

《SpringBoot3匹配Mybatis3的错误与解决方案》文章指出SpringBoot3与MyBatis3兼容性问题,因未更新MyBatis-Plus依赖至SpringBoot3专用坐标,导致类冲... 目录SpringBoot3匹配MyBATis3的错误与解决mybatis在SpringBoot3如果

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

Python 字符串裁切与提取全面且实用的解决方案

《Python字符串裁切与提取全面且实用的解决方案》本文梳理了Python字符串处理方法,涵盖基础切片、split/partition分割、正则匹配及结构化数据解析(如BeautifulSoup、j... 目录python 字符串裁切与提取的完整指南 基础切片方法1. 使用切片操作符[start:end]2

Linux部署中的文件大小写问题的解决方案

《Linux部署中的文件大小写问题的解决方案》在本地开发环境(Windows/macOS)一切正常,但部署到Linux服务器后出现模块加载错误,核心原因是Linux文件系统严格区分大小写,所以本文给大... 目录问题背景解决方案配置要求问题背景在本地开发环境(Windows/MACOS)一切正常,但部署到

Java中InputStream重复使用问题的几种解决方案

《Java中InputStream重复使用问题的几种解决方案》在Java开发中,InputStream是用于读取字节流的类,在许多场景下,我们可能需要重复读取InputStream中的数据,这篇文章主... 目录前言1. 使用mark()和reset()方法(适用于支持标记的流)2. 将流内容缓存到字节数组

MybatisPlus中removeById删除数据库未变解决方案

《MybatisPlus中removeById删除数据库未变解决方案》MyBatisPlus中,removeById需实体类标注@TableId注解以识别数据库主键,若字段名不一致,应通过value属... 目录MyBATisPlus中removeBypythonId删除数据库未变removeById(Se

创建springBoot模块没有目录结构的解决方案

《创建springBoot模块没有目录结构的解决方案》2023版IntelliJIDEA创建模块时可能出现目录结构识别错误,导致文件显示异常,解决方法为选择模块后点击确认,重新校准项目结构设置,确保源... 目录创建spChina编程ringBoot模块没有目录结构解决方案总结创建springBoot模块没有目录