干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)

2024-03-09 06:32

本文主要是介绍干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

今年春招的时候,那是一个春意盎然的下午,我正在进行一场没有硝烟的战争——面试。我特别清楚地记得,那天是我接种新冠疫苗后的第二天,脑子晕乎乎的,感觉自己没有开机,所以面试过程中回答得不尽人意。(但是面试官真的人很好哈哈哈)

img

鲁迅先生说过:“真正的勇士,敢于直面惨淡的人生”,而我需要敢于直面糟糕的面试

面试结束后,我就赶紧将面试过程中问到的问题记录了下来,并打算做一个复盘

img

其中,让我印象最深的便是“你跟我说说什么是平均负载以及什么是CPU使用率,它们之间有什么关系吗

平均负载

我们先来说说什么是平均负载

我们在终端输入 top 命令或者 uptime 命令,就能显示出系统过去1 分钟、5 分钟、15 分钟的平均负载(如图所示,红框部分)

img

  • 平均负载是指单位时间内,处在可执行状态和不可中断睡眠状态的进程的平均数。也就是说,它包括了处在执行态,阻塞态和就绪态的进程。

可能有小伙伴会问,什么是可执行状态的进程和不可中断睡眠状态的进程?

其中,**可执行状态的进程包括正在被CPU执行的进程以及在就绪队列上等待CPU执行的进程,**也就是我们常用 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程(也就是进程的三个基本状态中的执行态和就绪态)

而不可中断睡眠状态的进程即指处于内核关键流程中的进程,并且这些流程不可被打断。比如最常见的就是等待硬件设备的I/O响应。也就是我们在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进程(也就是进程的三个基本状态中的阻塞态)。

介绍完了什么是平均负载后,可能有小伙伴又会问:怎么判断系统的负载情况是否过大过小呢?

这里我举一个简单的例子

假设系统上有两个CPU:如果负载为1,那么意味着CPU有百分之50的空闲如果负载为2,那么意味着所有的CPU都刚好被完全占用如果负载为4,那么意味着有超过一半的进程竞争不到CPU

如何判断系统的平均负载是否合理?

  • 如果 1 分钟、5 分钟、15 分钟的三个值基本相同,或者相差不大,那就说明系统负载很平稳。
  • 但如果 1 分钟的值远小于 15 分钟的值,就说明系统最近 1 分钟的负载在减少,而过去 15 分钟内却有很大的负载,即系统的负载在逐渐减少。
  • 反过来,如果 1 分钟的值远大于 15 分钟的值,就说明最近 1 分钟的负载在增加,这种增加有可能只是临时性的,也有可能还会持续增加下去,所以就需要持续观察。一旦 1 分钟的平均负载接近或超过了 CPU 的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了。
  • 在实际生产环境中,当平均负载高于 CPU 数量 70% 的时候,我们就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能

这里我再举个简单的例子:

假设我们在一个只有一个CPU的系统上看到平均负载为:1.73,0.60,7.98。那么说明在过去1分钟内,系统有73%的超载,在过去15分钟内,系统更是达到了698%的超载,但就整体趋势来看,系统的负载是逐渐降低的。

CPU使用率

讲完平均负载,我们再来了解一下CPU使用率。

CPU使用率是指在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

比如说:比如说单核CPU一秒内处在非空闲态的时间为0.6秒,那么它的CPU使用率就是60%而双核CPU一秒内处在非空闲态的时间分别为0.6s和0.4s,那么它的CPU使用率为(0.4+0.6)/ 2 * 100% = 50%

看到这里,想必大家都对这两个概念有一个大体上的了解了吧

总的来说,系统负载或者说系统的平均负载,它的参考标准是进程数;而CPU使用率的参考标准是CPU的忙碌时

俗话说:“NO PICTURE NO BB ”,为了让大家更直观的感受这两个概念的区别,我将会配合着图再讲解一个例子:

有一家银行,他只有一个业务窗口,每次只能接待一个人(单核CPU)。有一天一共有五个人来了,那么就会出现一人在办理手续,其余四人在等待的情况(CPU负载为5)我们约定在业务窗口的那个人只有真正在办理业务才算是真正使用这个窗口,才算意味着窗口在忙碌(CPU使用率)

在这里插入图片描述

平均负载和CPU使用率的关系

在介绍完了这两个概念之后,真正的重点内容才刚刚开始

前面我们说到,面试官的最后一个问题就是:平均负载和CPU使用率的关系

也就是说CPU使用率的升高与下降跟平均负载的增大与减小有没有什么关系,我将通过下面这个案例来跟大家讲解一下。

CPU使用率高的情况

案例开始前,我先简单说明一下本次案例的虚拟机的配置

  • 内存1GB
  • 一个CPU
  • 版本:CentOS 7.6

首先下载相关工具包

其中 sysstat 工具是用来查看系统的整体性能情况的,例如CPU使用率和平均负载这些指标,而 stress 则是一个压力测试工具,用来模拟出各种性能压力

# 下载相关工具包yum install -y sysstat stress

之后我们使用 stress 工具来模拟CPU使用率为100%

#--timeout 600:持续时间为600s
stress --cpu 1 --timeout 600

接着等待一段时间,我们来看一下系统的平均负载情况

uptime... load average: 1.11, 0.59, 0.29

可以看到,在单核CPU系统里,过去的时间里的平均负载是在逐渐上升的,而过去1分钟内的平均负载甚至达到了1.11,这说明CPU已经被完全占满。

我们使用 sysstat 工具包中的 mpstat 查看 cpu 性能情况

mpstat -P ALL 5

在这里插入图片描述

这里我们可以看到,用户态CPU使用率已经达到了100%

总结:CPU使用率的升高会导致系统平均负载的上升

除此之外:

  • 系统内出现大量等待I/O的进程(系统I/O压力大)的时候也会导致平均负载升高,但是CPU使用率不一点升高
  • 系统内出现大量的进程,进程数远远超过了CPU数量的情况下也会导致平均负载的升高和CPU使用率的升高

总结

我们来回顾一下今天所学的内容:

  • 系统负载:指处在可执行状态和不可中断状态的进程的总数

    • 可执行状态的进程:表示正在被CPU执行的和在就绪队列中等待被CPU执行的进程
    • 不可中断状态进程:表示当前该进程正在等待某种事件的响应,并且这个状态是不可被打断的,比较常见的有跟硬件交互的时候、等待硬件I/O
  • 系统平均负载:单位时间内处在可执行状态和不可中断状态的进程的平均数

  • CPU使用率:表示在单位时间内CPU处在非空闲态的时间比,反映了CPU的繁忙程度

  • CPU使用率升高会导致系统平均负载的升高

在这里插入图片描述

这篇关于干货篇 | 平均负载和CPU使用率你还在傻傻分不清楚吗(含案例)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/789798

相关文章

Java进程CPU使用率过高排查步骤详细讲解

《Java进程CPU使用率过高排查步骤详细讲解》:本文主要介绍Java进程CPU使用率过高排查的相关资料,针对Java进程CPU使用率高的问题,我们可以遵循以下步骤进行排查和优化,文中通过代码介绍... 目录前言一、初步定位问题1.1 确认进程状态1.2 确定Java进程ID1.3 快速生成线程堆栈二、分析

MySQL 表的内外连接案例详解

《MySQL表的内外连接案例详解》本文给大家介绍MySQL表的内外连接,结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录表的内外连接(重点)内连接外连接表的内外连接(重点)内连接内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,我

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列!!!】三、发现的根本原因[独家]3.1 p

Linux CPU飙升排查五步法解读

《LinuxCPU飙升排查五步法解读》:本文主要介绍LinuxCPU飙升排查五步法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录排查思路-五步法1. top命令定位应用进程pid2.php top-Hp[pid]定位应用进程对应的线程tid3. printf"%

Java Stream.reduce()方法操作实际案例讲解

《JavaStream.reduce()方法操作实际案例讲解》reduce是JavaStreamAPI中的一个核心操作,用于将流中的元素组合起来产生单个结果,:本文主要介绍JavaStream.... 目录一、reduce的基本概念1. 什么是reduce操作2. reduce方法的三种形式二、reduce

Spring Boot 整合 Redis 实现数据缓存案例详解

《SpringBoot整合Redis实现数据缓存案例详解》Springboot缓存,默认使用的是ConcurrentMap的方式来实现的,然而我们在项目中并不会这么使用,本文介绍SpringB... 目录1.添加 Maven 依赖2.配置Redis属性3.创建 redisCacheManager4.使用Sp

springboot项目redis缓存异常实战案例详解(提供解决方案)

《springboot项目redis缓存异常实战案例详解(提供解决方案)》redis基本上是高并发场景上会用到的一个高性能的key-value数据库,属于nosql类型,一般用作于缓存,一般是结合数据... 目录缓存异常实践案例缓存穿透问题缓存击穿问题(其中也解决了穿透问题)完整代码缓存异常实践案例Red

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

MySQL 复合查询案例详解

《MySQL复合查询案例详解》:本文主要介绍MySQL复合查询案例详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录基本查询回顾多表笛卡尔积子查询与where子查询多行子查询多列子查询子查询与from总结合并查询(不太重要)union基本查询回顾查询

nginx负载均衡及详细配置方法

《nginx负载均衡及详细配置方法》Nginx作为一种高效的Web服务器和反向代理服务器,广泛应用于网站的负载均衡中,:本文主要介绍nginx负载均衡及详细配置,需要的朋友可以参考下... 目录一、 nginx负载均衡策略1.1 基本负载均衡策略1.2 第三方策略1.3 策略对比二、 nginx配置2.1