[译]Kubernetes 最佳实践:使用readiness和liveness探测器做HealthChecks

本文主要是介绍[译]Kubernetes 最佳实践:使用readiness和liveness探测器做HealthChecks,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:
分布式系统通常是难于管理的。主要是由于组件很多,且当其中一个损坏时,系统必须能探测到,绕过它,最后修复它,并且最重要的是,这一系列都需要是自动的。
如果一个实例不可用,那么系统就不应该向其分发请求,相反,应该将请求分发到其他可用的实例上,或者稍后再尝试。同时系统应该自动将失效的实例重新恢复到可用状态。

默认情况下,kubernetes(以后简称k8s)当pod中所有container一“启动”,就向其发送通信请求,并在pod崩溃后重启他们。通常来说这已经够好了。但是k8s提供了一种更直接明了的方式。
那就是readiness和liveness探测器。


HealthChecks的种类
k8s提供了两种HealthChecks的方法,理解他们的异同与用法是非常重要的。

Readiness
Readiness Probe 的设计的目的是让k8s明确知道pod何时已经完全就绪。在向POD发送请求通信之前,首先进行Readiness Probe测试。如果该测试没有通过,则k8s停止向其发送通信请求,直到测试通过。

 

Liveness
Liveness Probe 是为了让k8s知道pod是否存活(而不一定可用)。如果POD死掉,则k8s会将其remove并启动一个新的而取代。

 

 

HealthCheck是如何工作的?
Readiness
想象一下你的POD刚刚开始启动,但是相应的服务并不一定就会立刻就绪直到POD完全启动完成,即使相应的进程已经出现了。默认情况下k8s会立刻向POD发送请求一旦进程启动(但此时不一定可用)。
因此使用Readiness Probe,k8s会等待POD完全ready后才会向其发送请求。

Liveness
想象另一个场景,当你的POD因为某种原因一直处于挂起状态且不能响应任何请求,然而此时进程却是存在的,因此k8s会认为一切正常并持续向已经挂起的POD发送请求。
但若使用了Liveness Probe,k8s会发现该POD已经停止响应,进而重启这个有问题的POD。


Probe 的类型
有3种Probe: HTTP,Command 和 TCP。可以使用任意一个进行liveness and readiness checks.

HTTP Probe:
这是一种最常见的自定义liveness probe。 即使你POD内的应用程序不是HTTP server,你可以在应用中创建一个轻量级的HTTP server
来响应liveness probe。 k8s会ping一个指定路径,如果获得200~300之间的响应代码,则表明应用程序是健康的。
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/#define-a-liveness-http-request

Command Probe:
k8s 在你的container内运行一段命令。如果这段命令返回值是0,则说明该container是健康的;否则它会被标记为不健康。这种探针在你不能或者不愿意运行http server时很有用,
可以仅仅通过一个命令检查你的应用时否健康。
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/#define-a-liveness-command

TCP Probe:
这种Probe,k8s会尝试在一个特定的端口建立一个TCP连接。如果连接建立成功,则说明container健康,反之不健康。例如gPRC或者FTP服务是主要用于此类Probe。
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/#define-a-tcp-liveness-probe


配置初始的探测延迟
我们可以指定多久运行一次Probe,包括探测成功与失败的阈值,同时也包括需要等待响应的时长。以下文档非常清楚地阐述了各种不同的选项与用途:
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/#configure-probes
然而,有一个非常重要的设置你需要配置以决定何时使用liveness probes。 它就是initialDelaySeconds。
前面提到过,一个liveness probe如果检测失败会导致POD重启。你需要确定该Probe不会启动直到应用完全就绪。否则应用可能将一直持续重启并永远不会就绪!
我建议将Probe启动延迟设置为POD启动的平均时间并增加少许冗余。当你的应用启动的更快或者更慢是,请酌情更新这个数值。

结论:很多人告诉你HealthCheck是任何分布式系统需要的,k8s也不例外。 使用HealthCheck将让你的k8s有坚固的基础,更好的可靠性与更长的运行时间。幸好,k8s让其轻松实现了!

 

这篇关于[译]Kubernetes 最佳实践:使用readiness和liveness探测器做HealthChecks的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/161145

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地

Java Stream流使用案例深入详解

《JavaStream流使用案例深入详解》:本文主要介绍JavaStream流使用案例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录前言1. Lambda1.1 语法1.2 没参数只有一条语句或者多条语句1.3 一个参数只有一条语句或者多

Java Spring 中 @PostConstruct 注解使用原理及常见场景

《JavaSpring中@PostConstruct注解使用原理及常见场景》在JavaSpring中,@PostConstruct注解是一个非常实用的功能,它允许开发者在Spring容器完全初... 目录一、@PostConstruct 注解概述二、@PostConstruct 注解的基本使用2.1 基本代

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删