记录ssl epoll的tcp socket服务端在客户端断开时崩溃的问题

2024-09-05 18:04

本文主要是介绍记录ssl epoll的tcp socket服务端在客户端断开时崩溃的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 当客户端关闭后,Epoll 的 TCP socket 服务端会收到两次断开事件可能有以下原因及解决方法:
    • 原因分析
    • 解决方法
  • 问题ssl socket服务端代码
  • 出错现象
  • 第一次尝试修改
  • 正确改法
  • 附上客户端代码

记录ssl epoll的tcp socket服务端在客户端断开时接收到多次disconnect事件导致崩溃的问题.
流程:在linux服务器上跑socke服务, 客户端连接后发送数据,服务端回复, 客户端接收到回复后关闭.

当客户端关闭后,Epoll 的 TCP socket 服务端会收到两次断开事件可能有以下原因及解决方法:

原因分析

  1. 网络延迟或数据包重传
    网络环境不稳定可能导致数据包延迟到达或重传。当客户端关闭连接时,发送的断开信号可能由于网络延迟在服务端被接收多次。
    这种情况下,服务端可能会误认为有多个断开事件发生。
  2. 服务端处理逻辑问题
    服务端在处理断开事件时,如果没有正确地标记已处理的事件或者没有及时清理相关资源,可能会导致后续再次触发相同的断开事件。
    例如,在处理第一个断开事件后,服务端可能没有将对应的文件描述符从 Epoll 实例中移除,导致下一次轮询时再次触发该事件。
  3. SSL 层的影响
    如果使用了 SSL 加密,SSL 层的关闭过程可能会与底层的 TCP 连接关闭产生交互问题,导致服务端收到多次断开事件。
    SSL 的关闭握手过程可能会产生额外的数据包,被服务端误认为是新的断开事件。

解决方法

  1. 处理网络问题
    可以通过优化网络环境、增加超时时间等方式来减少网络延迟和数据包重传的影响。
    对于关键的应用,可以考虑使用更稳定的网络连接或者采用网络冗余技术。
  2. 优化服务端处理逻辑
    在服务端处理断开事件时,确保正确地标记已处理的事件,并及时清理相关资源。
    例如,在处理断开事件后,立即将对应的文件描述符从 Epoll 实例中移除,避免再次触发相同的事件。

问题ssl socket服务端代码

这段代码是用AI工具自动生成的, 拿来调试后发现有问题

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/socket.h>
#include <sys/epoll.h>
#include <netinet/in.h>
#include <openssl/ssl.h>
#include <openssl/err.h>#define MAX_EVENTS 10
#define BUFFER_SIZE 1024void handle_error(const char* msg) {perror(msg);exit(EXIT_FAILURE);
}SSL_CTX* init_ssl_context() {SSL_library_init();OpenSSL_add_all_algorithms();SSL_load_error_strings();SSL_CTX* ctx = SSL_CTX_new(TLS_server_method());if (!ctx) {ERR_print_errors_fp(stderr);exit(EXIT_FAILURE);}if (SSL_CTX_use_certificate_file(ctx, "server.crt", SSL_FILETYPE_PEM) <= 0) {ERR_print_errors_fp(stderr);exit(EXIT_FAILURE);}if (SSL_CTX_use_PrivateKey_file(ctx, "server.key", SSL_FILETYPE_PEM) <= 0) {ERR_print_errors_fp(stderr);exit(EXIT_FAILURE);}return ctx;
}void handle_client(SSL* ssl, int epollfd, int client_socket) {char buffer[BUFFER_SIZE];int bytes_read = SSL_read(ssl, buffer, BUFFER_SIZE - 1);if (bytes_read > 0) {buffer[bytes_read] = '\0';printf("Received: %s", buffer);SSL_write(ssl, buffer, bytes_read);} else {if (bytes_read == 0) {printf("Connection closed by client\n");} else {ERR_print_errors_fp(stderr);}close(client_socket);SSL_shutdown(ssl);SSL_free(ssl);epoll_ctl(epollfd, EPOLL_CTL_DEL, client_socket, NULL);}
}int main() {int server_socket, client_socket;struct sockaddr_in server_addr, client_addr;socklen_t client_addr_len = sizeof(client_addr);SSL_CTX* ssl_ctx = init_ssl_context();server_socket = socket(AF_INET, SOCK_STREAM, 0);if (server_socket == -1) {handle_error("socket");}memset(&server_addr, 0, sizeof(server_addr));server_addr.sin_family = AF_INET;server_addr.sin_addr.s_addr = INADDR_ANY;server_addr.sin_port = htons(12345);if (bind(server_socket, (struct sockaddr*)&server_addr, sizeof(server_addr)) == -1) {handle_error("bind");}if (listen(server_socket, 10) == -1) {handle_error("listen");}int epollfd = epoll_create1(0);if (epollfd == -1) {handle_error("epoll_create1");}struct epoll_event event;event.events = EPOLLIN;event.data.fd = server_socket;if (epoll_ctl(epollfd, EPOLL_CTL_ADD, server_socket, &event) == -1) {handle_error("epoll_ctl");}printf("EPOLL_CTL_ADD:%d\n", server_socket);struct epoll_event events[MAX_EVENTS];while (1) {int nfds = epoll_wait(epollfd, events, MAX_EVENTS, -1);if (nfds == -1) {handle_error("epoll_wait");}for (int i = 0; i < nfds; i++) {if (events[i].data.fd == server_socket) {client_socket = accept(server_socket, (struct sockaddr*)&client_addr, &client_addr_len);if (client_socket == -1) {handle_error("accept");}SSL* ssl = SSL_new(ssl_ctx);SSL_set_fd(ssl, client_socket);if (SSL_accept(ssl) <= 0) {ERR_print_errors_fp(stderr);close(client_socket);continue;}event.events = EPOLLIN;event.data.ptr = ssl; // 重点是这两行, 后面会分析//event.data.fd = client_socket;if (epoll_ctl(epollfd, EPOLL_CTL_ADD, client_socket, &event) == -1) {handle_error("epoll_ctl");}printf("New client connected, EPOLL_CTL_ADD:%d, ssl:%p\n",  client_socket, ssl);} else {// 这里用了data.ptr 与data.fdSSL* ssl = (SSL*)events[i].data.ptr;printf("data fd:%d ssl:%p\n", events[i].data.fd, ssl);handle_client(ssl, epollfd, events[i].data.fd);}}}close(server_socket);SSL_CTX_free(ssl_ctx);return 0;
}

出错现象

EPOLL_CTL_ADD:3
New client connected, EPOLL_CTL_ADD:5
Received: 1
Connection closed by client
Connection closed by client
段错误 (核心已转储)

经过调试发现,每次客户端close后,服务端会接收到两次的disconnect事件, 导致重复关闭从而崩溃.

第一次尝试修改

handle_client(SSL* ssl, int epollfd, int client_socket)中会调用close(client_socket), 发现client_socket值没传.

                event.data.ptr = ssl; // 重点是这两行, 后面会分析event.data.fd = client_socket;// 把这行注释打开,把client_socket传递到event中

这么改后,还是会崩溃.
通过man查看event的结构体epoll_data原型, 发现data是union类型, ptr与fd不能同时赋值, 所以第一次改法失败.
epoll_data结构如下

           typedef union epoll_data {void        *ptr;int          fd;uint32_t     u32;uint64_t     u64;} epoll_data_t;struct epoll_event {uint32_t     events;      /* Epoll events */epoll_data_t data;        /* User data variable */};

正确改法

client_socket从ssl中获取,不需要额外传递, 如图, 左边是问题代码, 右边是改正过的代码
在这里插入图片描述

附上客户端代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/socket.h>
#include <sys/epoll.h>
#include <netinet/in.h>
#include <openssl/ssl.h>
#include <openssl/err.h>
#include <arpa/inet.h>#define BUFFER_SIZE 1024void handle_error(const char* msg) {perror(msg);exit(EXIT_FAILURE);
}SSL_CTX* init_ssl_context() {SSL_library_init();OpenSSL_add_all_algorithms();SSL_load_error_strings();SSL_CTX* ctx = SSL_CTX_new(TLS_client_method());if (!ctx) {ERR_print_errors_fp(stderr);exit(EXIT_FAILURE);}return ctx;
}int main() {int client_socket;struct sockaddr_in server_addr;SSL_CTX* ssl_ctx = init_ssl_context();client_socket = socket(AF_INET, SOCK_STREAM, 0);if (client_socket == -1) {handle_error("socket");}memset(&server_addr, 0, sizeof(server_addr));server_addr.sin_family = AF_INET;server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");server_addr.sin_port = htons(12345);if (connect(client_socket, (struct sockaddr*)&server_addr, sizeof(server_addr)) == -1) {handle_error("connect");}SSL* ssl = SSL_new(ssl_ctx);SSL_set_fd(ssl, client_socket);if (SSL_connect(ssl) <= 0) {ERR_print_errors_fp(stderr);close(client_socket);exit(EXIT_FAILURE);}char buffer[BUFFER_SIZE];printf("Enter a message to send to the server: ");fgets(buffer, BUFFER_SIZE, stdin);SSL_write(ssl, buffer, strlen(buffer));int bytes_read = SSL_read(ssl, buffer, BUFFER_SIZE - 1);if (bytes_read > 0) {buffer[bytes_read] = '\0';printf("Received from server: %s", buffer);} else {ERR_print_errors_fp(stderr);}SSL_shutdown(ssl);SSL_free(ssl);close(client_socket);SSL_CTX_free(ssl_ctx);return 0;
}

作者:帅得不敢出门 原创文章谢绝转载

这篇关于记录ssl epoll的tcp socket服务端在客户端断开时崩溃的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1139676

相关文章

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Spring的RedisTemplate的json反序列泛型丢失问题解决

《Spring的RedisTemplate的json反序列泛型丢失问题解决》本文主要介绍了SpringRedisTemplate中使用JSON序列化时泛型信息丢失的问题及其提出三种解决方案,可以根据性... 目录背景解决方案方案一方案二方案三总结背景在使用RedisTemplate操作redis时我们针对

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red

nginx 负载均衡配置及如何解决重复登录问题

《nginx负载均衡配置及如何解决重复登录问题》文章详解Nginx源码安装与Docker部署,介绍四层/七层代理区别及负载均衡策略,通过ip_hash解决重复登录问题,对nginx负载均衡配置及如何... 目录一:源码安装:1.配置编译参数2.编译3.编译安装 二,四层代理和七层代理区别1.二者混合使用举例