OpenShift 4 - 使用 VerticalPodAutoscaler 优化应用资源 Request 和 Limit

本文主要是介绍OpenShift 4 - 使用 VerticalPodAutoscaler 优化应用资源 Request 和 Limit,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《OpenShift 4.x HOL教程汇总》
说明:本文已经在OpenShift 4.10 环境中验证

文章目录

  • 了解 VPA 和 HPA
  • 安装配置 VPA
  • 当应用程序出现 OOMKilled 时,自动调整 requests 和 limits 配置
    • 应用运行在无 VPA 情况下
    • 应用运行在有 VPA 情况下
  • 参考

了解 VPA 和 HPA

HPA - Horizontal Pod Autoscaler 和 VPA - Vertical Pod Autoscaler 是两种扩展容器应用处理能力的方式,HPA 是通过扩展 Pod 的数量实现的,而 VPA 是通过增加单个 Pod 的可用资源实现的。

通常 HPA 可用于水平扩展较容易的情况,例如 Serverless、FaaS、无状态微服务等。而 VPA 适用于水平扩展较复杂的情况,例如消息顺序处理、文件读写、数据库操作等。一般不建议对同一个资源同时应用 HPA 和 VPA。

VPA 会自动检查 Pod 中容器的运行状况和当前的 CPU 和内存资源,并根据它所了解的用量值更新资源限值和请求。VPA 使用单独的自定义资源(CR)来更新与工作负载对象关联的所有 Pod。VPA 能够自动计算这些 Pod 中容器当前的 CPU 和内存使用情况,并使用这些数据来决定优化的资源限制和请求,以确保这些 Pod 始终高效操作。例如,VPA 会减少请求资源超过使用资源的 Pod 的资源,并为没有请求充足资源的 Pod 增加资源。例如一个 Pod 当前使用了 CPU 的 50%,但只请求了 10%。VPA 会认定该 Pod 消耗的 CPU 多于请求的 CPU,并删除 Pod。工作负载对象(如副本集)会重启 Pod,VPA 使用推荐的资源更新新 Pod。
在这里插入图片描述
VPA 可以自动删除不符合建议的 Pod(建议工作负载对象至少运行两个副本,这样才不会影响连续运行)。在运行新的 Pod 时候,VPA 使用一个变异准入 webhook 来确保在运行 Pod 前将其资源调整为优化后的限制和请求。除了自动更新 Pod 外,还可手动删除 Pod,VPA 会使用其建议创建新的 Pod。

可以使用 VPA 来更好地利用集群资源,例如防止 Pod 保留比所需的 CPU 资源更多的资源。VPA 监控实际使用的工作负载,并对资源进行调整,以确保可以满足其他工作负载的需要。

如果停止在集群中运行 VPA 或删除特定的 VPA CR,则已由 VPA 修改的 pod 的资源请求不会改变。任何新 pod 都会根据工作负载对象中的定义获得资源,而不是之前由 VPA 提供的的建议。

VPA 需要关联一个工作负载对象,VPA 支持一下策略更新工作负载:

  • Auto 和 Recreate 模式会在 Pod 生命周期内自动应用 VPA 对 CPU 和内存建议。VPA 会删除项目中任何与建议不兼容的 Pod。当由工作负载对象重新部署时,VPA 会在其建议中更新新 Pod。
  • Initial 模式仅在创建 Pod 时自动应用 VPA 建议。
  • Off 模式只提供推荐的资源限制和请求信息,用户可以手动应用其中的建议。off 模式不会更新 Pod。

安装配置 VPA

  1. 使用默认配置在 OpenShift 中安装 Vertical Pod Autoscaler Operator。
    在这里插入图片描述
  2. 安装后会在 openshift-vertical-pod-autoscaler 项目中部署以下资源:
    在这里插入图片描述

当应用程序出现 OOMKilled 时,自动调整 requests 和 limits 配置

应用运行在无 VPA 情况下

  1. 创建一个新项目。
$ oc new-project app-novpa
  1. 部署测试应用。注意:虽然为容器分配的内存上限为 200Mi,但是应用会申请 250M 的内存。
$ cat << EOF | oc -n app-novpa apply -f -
apiVersion: apps/v1
kind: Deployment
metadata:name: stress-novpa
spec:selector:matchLabels:app: stressreplicas: 1template:metadata:labels:app: stressspec:containers:- name: stressimage: polinux/stressresources:requests:memory: "100Mi"limits:memory: "200Mi"command: ["stress"]args: ["--vm", "1", "--vm-bytes", "250M"]
EOF
  1. 部署应用后查看 Pod 运行状态,确认 Pod 出现 OOMKilled 情况而无法正常运行。
$ oc get pod -n app-novpa -w
NAME                            READY   STATUS              RESTARTS      AGE
stress-novpa-5f8cf46f67-cscjh   0/1     Pending             0             0s
stress-novpa-5f8cf46f67-cscjh   0/1     Pending             0             0s
stress-novpa-5f8cf46f67-cscjh   0/1     ContainerCreating   0             0s
stress-novpa-5f8cf46f67-cscjh   0/1     ContainerCreating   0             2s
stress-novpa-5f8cf46f67-cscjh   0/1     OOMKilled           0             3s
stress-novpa-5f8cf46f67-cscjh   1/1     Running             1 (1s ago)    4s
stress-novpa-5f8cf46f67-cscjh   0/1     OOMKilled           1 (2s ago)    5s
stress-novpa-5f8cf46f67-cscjh   0/1     CrashLoopBackOff    1 (2s ago)    6s
stress-novpa-5f8cf46f67-cscjh   0/1     OOMKilled           2 (18s ago)   22s

应用运行在有 VPA 情况下

  1. 创建一个新项目。
$ oc new-project app-vpa
  1. 部署测试应用,其中为容器分配内存上限为 200Mi,而应用只申请 150M 内存。
$ cat << EOF | oc -n app-vpa apply -f -
apiVersion: apps/v1
kind: Deployment
metadata:name: stress
spec:selector:matchLabels:app: stressreplicas: 1template:metadata:labels:app: stressspec:containers:- name: stressimage: polinux/stressresources:requests:memory: "100Mi"limits:memory: "200Mi"command: ["stress"]args: ["--vm", "1", "--vm-bytes", "150M"]
EOF
  1. 确认此时应用可以正常运行,然后查看 Pod 的状态和当前对内存的 Request 和 Limit。
$ oc get deployment -n app-vpa
NAME     READY   UP-TO-DATE   AVAILABLE   AGE
stress   1/1     1            1           21m$ oc get pod -n app-vpa -w
NAME                    READY   STATUS    RESTARTS   AGE
stress-589cd958-7dlhc   1/1     Running   0          14s$ oc get pod -n app-vpa -l app=stress -o yaml | grep requests -A1requests:memory: 100Mi$ oc get pod -n app-vpa -l app=stress -o yaml | grep limits -A1limits:memory: 200Mi
  1. 创建 VerticalPodAutoscaler 对象,将其关联名为 stress 的 Deployment,并对其下所有容器 ( containerName: ‘*’ ) 有效。其中 minAllowed 和 maxAllowed 是针对 Request 的有效上限和下限。
$ cat << EOF | oc -n app-vpa apply -f -
apiVersion: "autoscaling.k8s.io/v1"
kind: VerticalPodAutoscaler
metadata:name: stress-vpa
spec:targetRef:apiVersion: "apps/v1"kind: Deploymentname: stressresourcePolicy:containerPolicies:- containerName: '*'minAllowed:cpu: 100mmemory: 50MimaxAllowed:cpu: 1000mmemory: 1024MicontrolledResources: ["cpu", "memory"]
EOF

说明:VPA 支持黑名单机制,即黑名单中的容器不会被应用 VPA 策略。

  1. 查看当期 VPA 对象。
$ oc get vpa -n app-vpa
NAME         MODE   CPU   MEM       PROVIDED   AGE
stress-vpa   Auto   1     262144k   True       90s
  1. 查看 VPA 建议分配的 CPU 和内存。其中 lowerBound 为建议分配的资源最低量,target 为建议分配的资源量,upperBound 为建议分配的资源最高量,uncappedTarget 为最新的建议分配资源量。VPA 使用 lessBoundupperBound 值来确定一个 Pod 是否需要更新。如果 Pod 的资源请求低于 lowerBound 值,或高于 upperBound 值,则 VPA 会终止 Pod ,并使用 target 值重新创建 Pod 。
$ oc get vpa stress-vpa -n app-vpa -oyaml
。。。recommendation:containerRecommendations:- containerName: stresslowerBound:cpu: "1"memory: 262144ktarget:cpu: "1"memory: 262144kuncappedTarget:cpu: 1643mmemory: 262144kupperBound:cpu: "1"memory: 1Gi
  1. 修改名为 stress 的 Deployment,将其使用内存改为 “250M"。注意:此时应用申请的 “250M" 内存已经超过了由 Deployment 中的 limits 规定分配给 Pod 的内存上限了。
$ oc patch deployment stress -n app-vpa --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/args/3", "value": "250M" }]'
  1. 修改后可查看 Pod 的变化情况,原有 Pod 会被删除,新的 Pod 会被创建。
$ oc get pod -n app-vpa -w
NAME                      READY   STATUS        RESTARTS   AGE
stress-7b9459559c-ntnrv   1/1     Running       0          5s
stress-7d48fdb6fb-7dlhc   1/1     Terminating   0          22m
  1. 确认新的 Pod 可用内存的上限被调整到 500Mi。
$ oc get pod -n app-vpa -l app=stress -o yaml | grep limits -A1limits:memory: 500Mi
  1. 再次修改名为 stress 的 Deployment,将其使用内存改为 “1500M"。由于 Pod 申请内存已经超过 VPA 中 upperBound 定义的 “1Gi" 上线,因此 Pod 再次出现 OOMKilled。
$ oc patch deployment stress -n app-vpa --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/args/3", "value": "1500M" }]'$ oc get pod -n app-vpa -w
NAME                      READY   STATUS             RESTARTS     AGE
stress-5f8cf46f67-ntnrv   1/1     Running            0            5m54s
stress-947fdb66f-rfq5t    0/1     CrashLoopBackOff   1 (8s ago)   14s
stress-947fdb66f-rfq5t    0/1     OOMKilled          2 (17s ago)   23s

参考

https://access.redhat.com/documentation/zh-cn/openshift_container_platform/4.10/html/nodes/nodes-pods-vertical-autoscaler-using-about_nodes-pods-vertical-autoscaler
https://rcarrata.com/kubernetes/predictive-autoscaling-patterns-with-vpa/
https://cloud.redhat.com/blog/how-full-is-my-cluster-part-4-right-sizing-pods-with-vertical-pod-autoscaler
https://medium.com/infrastructure-adventures/vertical-pod-autoscaler-deep-dive-limitations-and-real-world-examples-9195f8422724

这篇关于OpenShift 4 - 使用 VerticalPodAutoscaler 优化应用资源 Request 和 Limit的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/425807

相关文章

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

springboot中使用okhttp3的小结

《springboot中使用okhttp3的小结》OkHttp3是一个JavaHTTP客户端,可以处理各种请求类型,比如GET、POST、PUT等,并且支持高效的HTTP连接池、请求和响应缓存、以及异... 在 Spring Boot 项目中使用 OkHttp3 进行 HTTP 请求是一个高效且流行的方式。

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MyBatis ParameterHandler的具体使用

《MyBatisParameterHandler的具体使用》本文主要介绍了MyBatisParameterHandler的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、概述二、源码1 关键属性2.setParameters3.TypeHandler1.TypeHa