Linux网络编程(3)使用select处理多个连接的回射服务器

本文主要是介绍Linux网络编程(3)使用select处理多个连接的回射服务器,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作为一个服务器,只处理一个连接是在有点说不过去。当有多个客户端建立连接时,需要保持较好的并发性,以及时处理每个连接。

最简单的一种方法就是把socket设置为非阻塞方式(使用ioctl()函数),然后在一个死循环中一直轮流测试每个连接的recv(),如果收到数据,再发送回去。这样做最大的坏处就是在没有可以读的数据时,CPU一直处于忙等待的状态,浪费了宝贵的CPU资源。

有一种不使用忙等待的方法,那就是对于每个连接,都在一个子线程或者子进程中来进行IO操作,主线程或者主进程只负责accept(),每当有新的连接建立时,新建一个子线程或者子进程,把这个连接的socket描述符传给它。这样做保持了很好的并发性。用子线程来代替子进程当然是更好的选择,因为它占用更少的资源,而且线程之间可以方便的使用共享的内存。但是这样做也有不足的地方,就是当连接数非常大时,比如说几千个或者上万个,线程之间的切换则会造成不小的代价。如果一个服务器只需要维护很少的连接,比如几个或者十几个,使用这种方法还是比较可行的。

还有一种方法,也就是下面详细介绍的方法,I/O复用的一种:使用select()函数。整个过程可以先大致这么理解:有三个socket描述符集合,分别代表可以读的描述符,可以写的描述符,和有待处理异常的描述符。调用select()函数之前,先把需要关注的描述符放入对应的描述符集合里,然后调用select(),返回时,依次检查每个描述符,看看它是否可读或者可写或者有异常。如果所有描述符都没有准备就绪,select()函数默认会一直阻塞。

下面介绍一下相关的函数和数据结构:

#include <sys/select.h>
#include <sys/time.h>
int select(int maxfdp1, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);struct timeval
{long tv_sec;long tv_usec;
}void FD_ZERO(fd_set *fdset);
void FD_SET(int fd, fd_set *fdset);
void FD_CLR(int fd, fd_set *fdset);
int FD_ISSET(int fd, fd_set *fdset);
如果有描述符准备好了,select()函数返回描述符的个数, 超时返回0, 出错返回-1。第一个参数maxfdp1的值是待测试的最大描述符加1,它代表这一次select()函数需要测试的描述符的个数(后面还会再解释这个参数的含义)。第二、三、四个参数分别代表程序关注的可读、可写和有异常的描述符的指针。第四个参数指向一个timeval结构体,它代表了select的超时时间。timeval的第一个成员代表秒,第二个成员代表微秒。readset,writeset和exceptest,如果我们对某个集合不感兴趣,就把它设置为NULL。如果这三个参数都是NULL,那么select()函数就成了一个微秒级别的定时器。如果timeout设置为NULL,则select()函数会永远等待下去。如果把timeval的两个成员都设置为0,则select()函数会立刻返回。

FD_ZERO()、FD_SET()、FD_CLR()、FD_ISSET()这四个宏函数分别提供了把fd_set的所有位置零、设置fd_set的某一位为一、把fd_set的某一位清零和检测fd_set的某一位是否是1。fd_set可以理解成是一个比特数组,每一个比特代表一个描述符。每个描述符根据它的值被映射到相应的比特上。fd_set一般最多可以放置1024个描述符,也就是说fd_set一共有1024比特。select()函数会测试fd_set中前maxfdp1个比特,看它们是否准备好。剩下的比特就不用再检测了,可以提高效率。这就很好解释maxfdp1这个参数的含义了,因为描述符的值是从0开始的。举个例子,比如有3个需要测试是否可读的描述符,它们的值分别为1,3,5,那么fd_set的前6位分别为010101(注意,描述符是从0开始编号的),select需要依次检测6个描述符,即从0至5,所以maxfdp1的值是最大的描述符的值(5)加一。

select()函数返回后,会把满足条件的描述符所对应的比特置为1,不满足的置为0。使用FD_ISSET()宏函数一次检测每个描述符,就可以知道哪个描述符准备好了,并对它进行对应的操作。有一点需要注意,每次调用select()函数之前,fd_set都必须重新设定,因为select()函数会修改fd_set中的比特。

下面简单介绍一下可读、可写和有异常的定义。

可读的4种定义:(1)套接字缓冲区收到了足够的数据(和TCP的实现有关),也就是说这时调用recv()函数不会阻塞,而且返回一个大于0的值。(2)套接字的读半部被关闭,也就是说它收到了一个FIN标志。此时调用recv()函数返回0。(3)在服务器端套接字成功开始监听,并且完成了至少1个连接。也就是说这时调用accept()函数不会阻塞。(4)有一个套接字出错了,这时调用recv()函数则返回-1。

可写的4中定义:(1)套接字的发送缓冲区有足够的空间接收数据此时调用send()函数不会阻塞且返回一个大于0的值。(2)套接字的写半部被关闭。(3)非阻塞的connect()函数成功建立了连接,或者失败。(4)有一个套接字出错了,这时调用send()函数则返回-1。

有异常的定义:TCP有带外数据。

下面的程序是使用了select()函数的回射服务器程序。为了使用STL提供的set,map等数据结构,这次使用C++,但是没有用到面向对象编程。

#include <stdlib.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <sys/select.h>
#include <string.h>
#include <string>
#include <set>
#include <map>
#include <iostream>using namespace std;#define BUFFER_SIZE 1024int getSetMax(set<int> &s)
{if(s.empty() == true)return 0;int max = (*(s.begin()));set<int>::iterator it;for(it = s.begin(); it != s.end(); it++)if((*it) > max)max = (*it);return max;
}int getMapMax(map<int, string> &m)
{if(m.empty() == true)return 0;map<int, string>::iterator it;int max = m.begin()->first;for(it = m.begin(); it != m.end(); it++)if(it->first > max)max = it->first;return max;
}int main(int argc, char** argv)
{if(argc != 2){cout<<"Usage:"<<endl<<argv[0]<<" <port>"<<endl;return 0;}char buffer[BUFFER_SIZE];int socketFd, clientFd;unsigned int clientAddrLength;int receivedLength;struct sockaddr_in myAddr;struct sockaddr_in clientAddr;fd_set readSet;fd_set writeSet;set<int> socketSet;map<int, string> receivedMessages;memset(&myAddr, 0, sizeof(myAddr));myAddr.sin_family = AF_INET;myAddr.sin_port = htons(atoi(argv[1]));myAddr.sin_addr.s_addr = htonl(INADDR_ANY);socketFd = socket(AF_INET, SOCK_STREAM, 0);bind(socketFd, (struct sockaddr*)&myAddr, sizeof(myAddr));listen(socketFd, 8);set<int>::iterator it;map<int, string>::iterator mapIt;while(true){FD_ZERO(&readSet);FD_SET(socketFd, &readSet);for(it = socketSet.begin(); it != socketSet.end(); it++)FD_SET((*it), &readSet);select(max(getSetMax(socketSet), socketFd) + 1, &readSet, NULL, NULL, NULL);if(FD_ISSET(socketFd, &readSet)){clientAddrLength = sizeof(clientAddr);clientFd = accept(socketFd, (struct sockaddr*)&clientAddr, &clientAddrLength);cout<<"Accept a connection: "+ string(inet_ntoa(clientAddr.sin_addr)) + ':'<<ntohs(clientAddr.sin_port)<<endl;socketSet.insert(clientFd);}for(it = socketSet.begin(); it != socketSet.end(); it++){if(FD_ISSET((*it), &readSet)){receivedLength = recv((*it), buffer, BUFFER_SIZE, 0);if(receivedLength <= 0){shutdown((*it), SHUT_RDWR);socketSet.erase(*it);receivedMessages.erase(*it);}else{buffer[receivedLength] = '\0';cout<<"Receive a message: "<<buffer<<endl;receivedMessages[*it].append(string(buffer, receivedLength));}}}if(receivedMessages.empty() == false){FD_ZERO(&writeSet);for(mapIt = receivedMessages.begin();mapIt != receivedMessages.end(); mapIt ++)FD_SET(mapIt->first, &writeSet);select(getMapMax(receivedMessages) + 1, NULL, &writeSet, NULL, NULL);for(mapIt = receivedMessages.begin();mapIt != receivedMessages.end(); mapIt ++){if(FD_ISSET(mapIt->first, &writeSet)){send(mapIt->first, mapIt->second.c_str(), mapIt->second.length(), 0);receivedMessages.erase(mapIt);}}}}return 0;
}

可以多开几个netcat测试一下,或者写个脚本测试一下。

上面这个程序是在单线程下使用select来处理多个TCP连接的。现代CPU都有多个核心,所以使用多线程可以很大地提升性能。在主线程中只用select()函数测试已建立的连接,然后看一看子线程中哪个线程的可读描述符集合最小,就把新的描述符传给它。在子线程里,先等待有可读的描述符,收到数据后再把数据发送给可写的描述符。但是建立多少个线程最合适?我认为子线程个个数应该是CPU物理核心数的2倍。因为超线程技术可以使单个核心的并行性能得到提升。




这篇关于Linux网络编程(3)使用select处理多个连接的回射服务器的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/502185

相关文章

Java Lambda表达式的使用详解

《JavaLambda表达式的使用详解》:本文主要介绍JavaLambda表达式的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言二、Lambda表达式概述1. 什么是Lambda表达式?三、Lambda表达式的语法规则1. 无参数的Lambda表

Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析

《Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析》InstantiationAwareBeanPostProcessor是Spring... 目录一、什么是InstantiationAwareBeanPostProcessor?二、核心方法解

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Spring @RequestMapping 注解及使用技巧详解

《Spring@RequestMapping注解及使用技巧详解》@RequestMapping是SpringMVC中定义请求映射规则的核心注解,用于将HTTP请求映射到Controller处理方法... 目录一、核心作用二、关键参数说明三、快捷组合注解四、动态路径参数(@PathVariable)五、匹配请

Java 枚举的基本使用方法及实际使用场景

《Java枚举的基本使用方法及实际使用场景》枚举是Java中一种特殊的类,用于定义一组固定的常量,枚举类型提供了更好的类型安全性和可读性,适用于需要定义一组有限且固定的值的场景,本文给大家介绍Jav... 目录一、什么是枚举?二、枚举的基本使用方法定义枚举三、实际使用场景代替常量状态机四、更多用法1.实现接

java连接opcua的常见问题及解决方法

《java连接opcua的常见问题及解决方法》本文将使用EclipseMilo作为示例库,演示如何在Java中使用匿名、用户名密码以及证书加密三种方式连接到OPCUA服务器,若需要使用其他SDK,原理... 目录一、前言二、准备工作三、匿名方式连接3.1 匿名方式简介3.2 示例代码四、用户名密码方式连接4

springboot项目中使用JOSN解析库的方法

《springboot项目中使用JOSN解析库的方法》JSON,全程是JavaScriptObjectNotation,是一种轻量级的数据交换格式,本文给大家介绍springboot项目中使用JOSN... 目录一、jsON解析简介二、Spring Boot项目中使用JSON解析1、pom.XML文件引入依

Java中的record使用详解

《Java中的record使用详解》record是Java14引入的一种新语法(在Java16中成为正式功能),用于定义不可变的数据类,这篇文章给大家介绍Java中的record相关知识,感兴趣的朋友... 目录1. 什么是 record?2. 基本语法3. record 的核心特性4. 使用场景5. 自定

Python使用Tkinter打造一个完整的桌面应用

《Python使用Tkinter打造一个完整的桌面应用》在Python生态中,Tkinter就像一把瑞士军刀,它没有花哨的特效,却能快速搭建出实用的图形界面,作为Python自带的标准库,无需安装即可... 目录一、界面搭建:像搭积木一样组合控件二、菜单系统:给应用装上“控制中枢”三、事件驱动:让界面“活”

C/C++ chrono简单使用场景示例详解

《C/C++chrono简单使用场景示例详解》:本文主要介绍C/C++chrono简单使用场景示例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友... 目录chrono使用场景举例1 输出格式化字符串chrono使用场景China编程举例1 输出格式化字符串示