操作系统原理:实验验证 Linux 内核的 CFS 算法

2024-01-22 05:08

本文主要是介绍操作系统原理:实验验证 Linux 内核的 CFS 算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CFS——一个“公平”的“骗局”

全称为 Completely fair scheduler(完全公平调度算法)。顾名思义,这个算法就是为了实现进程之间调度的“完全公平”。但是这个“公平”仅仅只是Linux对进程的一个虚假的“骗局”,是虚拟运行时间(vruntime)的相同,然而真实运行时间(runtime)是根据优先级权重而分配的。

优先级 n 的权重计算公式如下:
w e i g h t n = 1024 × 1.2 5 − n weight_{n}=1024 \times 1.25^{-n} weightn=1024×1.25n

优先级从 -20 到 20 的权重见下表:
优先级权重
进程真实运行时间(runtime)和虚拟运行时间(vruntime)的计算公式:
r u n t i m e + = T × ( w e i g h t ∑ w e i g h t ) runtime+=T \times (\frac{weight}{\sum weight} ) runtime+=T×(weightweight)
v r u n t i m e + = T × ( w e i g h t 0 ∑ w e i g h t ) vruntime+=T \times (\frac{weight_{0}}{\sum weight} ) vruntime+=T×(weightweight0)
对于上面的两个公式,其中weight即为表中的-20~20的优先级对应的40个权重。至于runtimevruntime的比值,由上面的两个公式可以得出应该与优先级所对应权重比值相等。那么在下面的实验中,我们就来验证一下这个结论。


设置进程优先级

首先使用CPU_ZERO(&curr_set)语句将CPU中所有的核设定清空,之后使用CPU_SET(0, &curr_set)语句将进程绑定到0号核。函数sched_getaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask)会获得pid所指向的进程的CPU位掩码,并将该掩码返回到第三个参数mask所指向的结构中,即获得指定pid当前可以运行在哪些CPU上。如果pid的值为0,那么表示的是当前进程。

之后使用fork()语句创建子进程,因为子进程会继承父进程的处理器亲和性的绑定,所以在子进程中不需要再绑定处理器。此时子进程和父进程都绑定到了0号核上,去竞争CPU使用权。

在子进程和父进程中分别打印各自的进程编号,在子进程中打印从父进程中继承来的Nice值(进程优先级),之后使用setpriority(PRIO_PROCESS, getpid(), 10);语句将子进程的Nice值设置成10,并使用getpriority(PRIO_PROCESS, getpid())获取当前进程的优先级。最后让两个进程进入死循环,等待CPU运行时间的获取。

#include <stdio.h>
#ifndef __USE_GNU
#define __USE_GNU
#endif // !__USE_GNU
#include <unistd.h>
#include <sched.h>
#include <sys/resource.h>int main(int argc, char* argv[]) {cpu_set_t curr_set; CPU_ZERO(&curr_set);	//清空CPU设置CPU_SET(0, &curr_set);	//设置0号CPUsched_setaffinity(0, sizeof(curr_set), &curr_set);pid_t pid = fork();		//创建子进程if (pid == 0) {printf("The child pid: %d\n", getpid());	//显示子进程pid//sleep(3);//显示当前的进程优先级printf("\nParent and child's old priority: %d\n", getpriority(PRIO_PROCESS, getpid()));//将子进程的优先级改成10,并打印setpriority(PRIO_PROCESS, getpid(), 10);printf("Child's new priority: %d\n", getpriority(PRIO_PROCESS, getpid()));while (1);}else{printf("The parent pid: %d\n", getpid());	//显示父进程pidwhile (1);}
}

获取进程运行时间

首先使用命令行向Linux内核传参的方式获取两个进程号参数pid1pid2,使用module_param(pid1, int, S_IRUGO);语句将其注册为int类型的“只读”参数。

遍历进程列表,找到两个进程,并打印他们的真实运行时间(runtime)和虚拟运行时间(vruntime)。

#include <linux/init.h>
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/sched.h>
#include <linux/sched/signal.h>int pid1;
int pid2;
module_param(pid1, int, S_IRUGO);
module_param(pid2, int, S_IRUGO);int module_load(void){struct task_struct* p;for_each_process(p) {if (p->pid == pid1 || p->pid == pid2)//打印进程的pid,运行时间,虚拟运行时间printk("%d  runtime:%llu \t vruntime:%lld\n", p->pid, p->se.sum_exec_runtime, p->se.vruntime);}return 0;
}
void module_rm(void){printk(KERN_INFO "========= Module removed! =========\n ");
}
module_init(module_load);
module_exit(module_rm);
MODULE_LICENSE("GPL");
MODULE_DESCRIPTION("The runtime of progress.");
MODULE_AUTHOR("Song XJ");

运行结果

第一次的设置进程优先级
第一次获取进程运行时间

  • 进程运行时间比值:
    24573505223 ÷ 2321102474 = 10.587 24573505223 ÷ 2321102474=10.587 24573505223÷2321102474=10.587
  • 进程优先级权重比值:
    1024 ÷ 110 = 9.309 1024÷110=9.309 1024÷110=9.309

从上面的运行结果来看,这似乎误差有一点大啊。。。。【尴尬 ̄□ ̄||】
这逼装大了

我又检查了一下代码,整体上应该没有错误,但是运行了好几次都有比较大的误差,后来我想到在子进程中我加了一个sleep(3),本意是为了让子进程在等父进程打印完pid再进行之后的操作,但是恰恰是这三秒造成了实验结果的错误。

sleep(3)注释后重新进行实验,实验结果见下图,经过计算得出进程运行时间比为9.307,与优先级比值相似,在误差允许范围内。
27435976591 ÷ 2948160561 = 9.307 27435976591÷2948160561=9.307 27435976591÷2948160561=9.307

第二次进程优先级设置
第二次获取进程运行时间
同时又对第一次的实验结果进行修正分析,子进程减去sleep的3秒后进行比值计算,得出的结果也与优先级比值相似,证明确实是sleep造成的结果误差。
( 24573505223 - 3 × 1 0 9 ) ÷ 2321102474 = 9.295 (24573505223-3×10^9) ÷ 2321102474=9.295 (245735052233×109)÷2321102474=9.295

另外,从第二次的结果中vruntime的值和优先级为0时的值可以看出两个值在数量级上是相同的,比值约等于1,这也验证了 CFS 中虚拟运行时间的求法,即公式中的 w e i g h t 0 weight_0 weight0为优先级为0时的权重为1024。

这篇关于操作系统原理:实验验证 Linux 内核的 CFS 算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/631915

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇:Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

Linux创建服务使用systemctl管理详解

《Linux创建服务使用systemctl管理详解》文章指导在Linux中创建systemd服务,设置文件权限为所有者读写、其他只读,重新加载配置,启动服务并检查状态,确保服务正常运行,关键步骤包括权... 目录创建服务 /usr/lib/systemd/system/设置服务文件权限:所有者读写js,其他