IO端口复用之poll的底层实现

2024-09-02 01:08
文章标签 实现 端口 底层 复用 io poll

本文主要是介绍IO端口复用之poll的底层实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

介绍

    解说中存在一些函数和数据结构,具体出处可以参照上一篇关于select的分析 《IO端口复用之select的底层实现》,里面提及了一些储备知识点,本篇不再赘述。

    由于tcp过于复杂,取个巧,全篇以udp连接来说明一下,内核版本依旧对应2.6.32。

poll系统调用做了什么

接口说明

    poll系统调用接口,一共需要3个参数。

    第一个参数是监听集指针ufds(struct pollfd结构类型指针),第二个参数是监听套接字的个数nfds(int类型),最后一个参数是超时事件timeout_msecs(long类型)。

    内核中对ufds的定义是:

     struct pollfd {

        int fd;

        short events;

        short revents;

    }; 

    参数中使用了ufds变量,指向可以存储多个struct pollfd结构的空间,每一份struct pollfd就代表监听的一个套接字,其中的fd成员是套接字文件描述符值,该值理论上不受限制(不过每个进程自身的文件描述符数是受到限制的,再大也不能突破系统的限制,可通过ulimit -n查看,也可以进行修改)。既然ufds指向的是一块空间,理论上可以开辟出来nfds个空间来存储所有要监听的套接字信息,nfds也在理论上不受限制,不过受进程自身的描述符个数影响,可进行配置扩展。

     此时,poll与select的第一个显著的不同点出来了,所监听的文件描述符个数是不同的,select限制在1024,而poll是根据进程的文件描述符限定值来确定的。

    events用来描述期待监听事件的类型,可通过POLLIN、POLLOUT、POLLERR等进行或运算来赋值。revents代表对应套接字描述符的哪些事件已就绪。

    此时,poll与select的第二个显著不同点也出来了,select预期监听集合和结果集合在应用层空间公用了一个,有监听的预期事件到来时,监听集就被拷贝成了结果集,select调用过程中fd_set得来回进行拷贝,而poll中使用了两个不同的变量events与revent来承接的。

内核代码追踪

    sys_poll -> do_sys_poll

  • 在do_sys_poll函数中,预开辟了空间stack_pps,其对应结构为struct poll_list类型,用head指针(struct poll_list *类型)指向stack_pps空间。stack_pps是为了承接poll函数传入的ufds,空间可能会不够。do_sys_poll函数在一个循环中,通过循环开辟空间walk(struct poll_list*类型),每次新开辟的walk包括若干个entries(struct pollfd结构),此处的若干个是通过min(剩余未拷贝个数,POLLFD_PER_PAGE)来确定的。并通过链表串联起来:例如head->next = walk。也就是说poll函数传递的参数依次拷贝到了以head为头节点的链表上,每个节点的结构都是struct poll_list类型,里面包括了若干个entries成员,len成员储存着entries的个数。

    对比select会发现,select与poll都会开辟空间来存储对应的监听集合,只不过所采用的数据结构不太一样,poll函数稍微会浪费一些。

  • 拷贝完成跳出for循环后,调用do_poll函数。do_poll函数的核心操作是一个循环体for(;;),在主循环里面遍历所有的walk节点中的每一个entries对象pfd(struct pollfd类型指针),随后调用do_pollfd函数。
  • 在do_pollfd函数中,通过fd得到对应的监听套接字的文件描述符file(struct file类型指针),随后调用f_op->poll函数,socket_file_ops中的poll函数为sock_poll。
  • 在sock_poll函数中,通过file->private_data提取出来sock指针(struct socket结构指针)。而sock中的ops指向的是inet_dgram_ops,执行sock->ops->poll实际上调用了inet_dgram_ops中的poll函数udp_poll。
  • 在udp_poll函数中,调用了datagram_poll函数,在datagram_poll函数中将在函数sock_poll_wait中调用__pollwait,在__pollwait中,将table结构中的entry(struct poll_table_entry结构)里面的wait作为挂载点,挂载到sk->sk_sleep中。在datagram_poll函数中,随后通过skb_queue_empty来判断sk的sk_error_queue(错误队列是否为空),如果不为空则对mask置POLLERR。随后通过sk的sk_receive_queue是否为空,不为空则对mask置POLLIN。随后调用sock_writeable,通过sk->sk_sndbuf >> 1与sk->sk_wmem_alloc进行比较,如果缓冲区中剩余空间比发送缓冲区的一半还多,则可以继续进行发送,对mask置POLLOUT。
  • do_pollfd将上述mask清除掉不需要的事件标记,赋值给对应的pfd中的revents成员。
  • do_poll判断do_pollfd的返回值(返回mask),当有事件到来时,mask非0,使用count进行计数累加。
  • do_poll随后会调用poll_schedule_timeout函数,并在poll_schedule_timeout中调用了schedule_hrtimeout_range函数,函数会将超时时间通过expires(ktime_t类型,既计算出来的总nsec数)。当超时时间值为0时,则设置当前进程状态为TASK_RUNNING,并返回0。当超时时间为NULL时,此时整个poll是所谓的阻塞状态,此时主动调用schedule进行进程调度,则设置当前进程状态为TASK_RUNNING,并返回-EINTR。后续通过hrtimer来判断阻塞时间,时间到了则返回0。
  • 当返回0时候,do_poll函数中的timeout设置为1,意味着阻塞时间到或者无需阻塞。
  • 在主循环体中,当time_out为1,或者count计数的值大于0时,或者当前进程有信号(signal_pending)需要处理时,do_poll都会跳出主循环体for(;;)返回。

小结

    通过上述的流程总结,我们基本上对poll的所谓的轮训机制有了了解,这里的轮训并非单一的死循环,他对操作系统本身是没有太多的性能损耗,在永久阻塞或者超时模式下,都会主动进行schedule任务调度,即便使用NULL进行立即返回,我们在应用层处理的时候也是需要调用sleep或usleep来进行睡眠。

    对比select和poll的底层实现可以发现,不考虑各自所能监听的套接字数量以及承接监听集合所开辟的空间大小,两者的轮训方式没有什么本质区别,在性能上也不会存在什么明显差异。

这篇关于IO端口复用之poll的底层实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1128571

相关文章

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin