RDMA内核态函数ib_post_send()源码分析

2024-02-25 22:04

本文主要是介绍RDMA内核态函数ib_post_send()源码分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近调用linux内核下RDMA的Verb API ib_post_send()出现了问题,因此从源码分析一下这个函数的调用过程。
我使用的内核版本为5.15.0-94
这是函数ib_post_send的头文件定义,这个函数的意义是向发送队列提交发送请求,他会调用qp对应设备的post_send操作
在这里插入图片描述
post_send是一个函数指针
在这里插入图片描述
post_send函数的具体实现在infiniband驱动程序里,这是驱动程序的路径
在这里插入图片描述
mlx5驱动作为内核模块载入内核:
在这里插入图片描述
模块载入过程中会进行相关变量、函数的绑定和初始化。其中post_send函数指针对应的函数为mlx5_ib_post_send_nodrain
在这里插入图片描述

而这个函数会调用mlx5_ib_post_send函数。
在这里插入图片描述
下面这个函数就是最后调用的函数。
在这里插入图片描述
这个函数的完整代码如下:

int mlx5_ib_post_send(struct ib_qp *ibqp, const struct ib_send_wr *wr,const struct ib_send_wr **bad_wr, bool drain)
{struct mlx5_wqe_ctrl_seg *ctrl = NULL;  /* compiler warning */struct mlx5_ib_dev *dev = to_mdev(ibqp->device);struct mlx5_core_dev *mdev = dev->mdev;struct mlx5_ib_qp *qp = to_mqp(ibqp);struct mlx5_wqe_xrc_seg *xrc;struct mlx5_bf *bf;void *cur_edge;int size;unsigned long flags;unsigned int idx;int err = 0;int num_sge;void *seg;int nreq;int i;u8 next_fence = 0;u8 fence;if (unlikely(mdev->state == MLX5_DEVICE_STATE_INTERNAL_ERROR &&!drain)) {*bad_wr = wr;return -EIO;}if (qp->type == IB_QPT_GSI)return mlx5_ib_gsi_post_send(ibqp, wr, bad_wr);bf = &qp->bf;spin_lock_irqsave(&qp->sq.lock, flags);for (nreq = 0; wr; nreq++, wr = wr->next) {if (unlikely(wr->opcode >= ARRAY_SIZE(mlx5_ib_opcode))) {mlx5_ib_warn(dev, "\n");err = -EINVAL;*bad_wr = wr;goto out;}num_sge = wr->num_sge;if (unlikely(num_sge > qp->sq.max_gs)) {mlx5_ib_warn(dev, "\n");err = -EINVAL;*bad_wr = wr;goto out;}err = begin_wqe(qp, &seg, &ctrl, wr, &idx, &size, &cur_edge,nreq);if (err) {mlx5_ib_warn(dev, "\n");err = -ENOMEM;*bad_wr = wr;goto out;}if (wr->opcode == IB_WR_REG_MR ||wr->opcode == IB_WR_REG_MR_INTEGRITY) {fence = dev->umr_fence;next_fence = MLX5_FENCE_MODE_INITIATOR_SMALL;} else  {if (wr->send_flags & IB_SEND_FENCE) {if (qp->next_fence)fence = MLX5_FENCE_MODE_SMALL_AND_FENCE;elsefence = MLX5_FENCE_MODE_FENCE;} else {fence = qp->next_fence;}}switch (qp->type) {case IB_QPT_XRC_INI:xrc = seg;seg += sizeof(*xrc);size += sizeof(*xrc) / 16;fallthrough;case IB_QPT_RC:err = handle_qpt_rc(dev, qp, wr, &ctrl, &seg, &size,&cur_edge, &idx, nreq, fence,next_fence, &num_sge);if (unlikely(err)) {*bad_wr = wr;goto out;} else if (wr->opcode == IB_WR_REG_MR_INTEGRITY) {goto skip_psv;}break;case IB_QPT_UC:handle_qpt_uc(wr, &seg, &size);break;case IB_QPT_SMI:if (unlikely(!dev->port_caps[qp->port - 1].has_smi)) {mlx5_ib_warn(dev, "Send SMP MADs is not allowed\n");err = -EPERM;*bad_wr = wr;goto out;}fallthrough;case MLX5_IB_QPT_HW_GSI:handle_qpt_hw_gsi(qp, wr, &seg, &size, &cur_edge);break;case IB_QPT_UD:handle_qpt_ud(qp, wr, &seg, &size, &cur_edge);break;case MLX5_IB_QPT_REG_UMR:err = handle_qpt_reg_umr(dev, qp, wr, &ctrl, &seg,&size, &cur_edge, idx);if (unlikely(err))goto out;break;default:break;}if (wr->send_flags & IB_SEND_INLINE && num_sge) {err = set_data_inl_seg(qp, wr, &seg, &size, &cur_edge);if (unlikely(err)) {mlx5_ib_warn(dev, "\n");*bad_wr = wr;goto out;}} else {for (i = 0; i < num_sge; i++) {handle_post_send_edge(&qp->sq, &seg, size,&cur_edge);if (unlikely(!wr->sg_list[i].length))continue;set_data_ptr_seg((struct mlx5_wqe_data_seg *)seg,wr->sg_list + i);size += sizeof(struct mlx5_wqe_data_seg) / 16;seg += sizeof(struct mlx5_wqe_data_seg);}}qp->next_fence = next_fence;finish_wqe(qp, ctrl, seg, size, cur_edge, idx, wr->wr_id, nreq,fence, mlx5_ib_opcode[wr->opcode]);
skip_psv:if (0)dump_wqe(qp, idx, size);}out:if (likely(nreq)) {qp->sq.head += nreq;/* Make sure that descriptors are written before* updating doorbell record and ringing the doorbell*/wmb();qp->db.db[MLX5_SND_DBR] = cpu_to_be32(qp->sq.cur_post);/* Make sure doorbell record is visible to the HCA before* we hit doorbell.*/wmb();mlx5_write64((__be32 *)ctrl, bf->bfreg->map + bf->offset);/* Make sure doorbells don't leak out of SQ spinlock* and reach the HCA out of order.*/bf->offset ^= bf->buf_size;}spin_unlock_irqrestore(&qp->sq.lock, flags);return err;
}

此函数介绍如下:
1.函数参数:这个函数接收四个参数,分别是一个指向ib_qp结构的指针(代表一个InfiniBand队列对),一个指向ib_send_wr结构的指针(代表一个发送工作请求),一个指向ib_send_wr指针的指针(用于返回出错的工作请求),以及一个布尔值(表示是否为"drain"操作)。

2.函数首先进行错误检查,例如检查设备状态,检查工作请求的操作码,以及检查工作请求的SGE(Scatter/Gather Entry)数量。

3.函数的主要部分是一个循环,对每个工作请求进行处理。处理包括开始一个WQE(Work Queue Entry),设置控制段,处理不同类型的QP(例如RC、UC、UD等),设置数据段,以及完成WQE。
4.在处理完所有的工作请求后,函数会更新doorbell record,并通过写入doorbell来通知硬件开始处理WQE。

综上所述,当在内核中调用ib_post_send函数时,会触发infiniBand模块的回调函数mlx5_ib_post_send_nodrain,最后会调用到函数

int mlx5_ib_post_send(struct ib_qp *ibqp, const struct ib_send_wr *wr,const struct ib_send_wr **bad_wr, bool drain)

这篇关于RDMA内核态函数ib_post_send()源码分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/746854

相关文章

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

快速修复一个Panic的Linux内核的技巧

《快速修复一个Panic的Linux内核的技巧》Linux系统中运行了不当的mkinitcpio操作导致内核文件不能正常工作,重启的时候,内核启动中止于Panic状态,该怎么解决这个问题呢?下面我们就... 感谢China编程(www.chinasem.cn)网友 鸢一雨音 的投稿写这篇文章是有原因的。为了配置完

Java程序进程起来了但是不打印日志的原因分析

《Java程序进程起来了但是不打印日志的原因分析》:本文主要介绍Java程序进程起来了但是不打印日志的原因分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java程序进程起来了但是不打印日志的原因1、日志配置问题2、日志文件权限问题3、日志文件路径问题4、程序

Java 正则表达式URL 匹配与源码全解析

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中... 目录1.正则表达式分解:2. 添加域名匹配 (2)3. 添加路径和查询参数匹配 (3) 4. 最终优化版本5.设计思

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序

Java调用C++动态库超详细步骤讲解(附源码)

《Java调用C++动态库超详细步骤讲解(附源码)》C语言因其高效和接近硬件的特性,时常会被用在性能要求较高或者需要直接操作硬件的场合,:本文主要介绍Java调用C++动态库的相关资料,文中通过代... 目录一、直接调用C++库第一步:动态库生成(vs2017+qt5.12.10)第二步:Java调用C++

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java