监控系统的评分标准

2024-02-02 12:52
文章标签 系统 监控 评分标准

本文主要是介绍监控系统的评分标准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、监控概念

监控是有效管理基础设施和业务的关键工具。正确的监控应当与应用程序一同构建和部署,因为缺乏监控会导致对系统运行环境的不了解,阻碍故障诊断,以及无法及时获取关键的性能、成本和状态等信息。 然而,我们需要注意一些监控中的误区:

● 机械式监控:避免过于机械和生硬的监控方法,应当采用更灵活、智能的监控方式。 ● 不够准确的监控:监控系统应当具备高准确性,以确保获得真实、可信的监控数据,避免误导性信息的干扰。 ● 静态和监控:监控系统需要具备动态适应性,能够随着系统和业务的变化而调整监控策略,避免过于静态化的监控设置。 ● 不频繁的监控:监控应当是持续、频繁的活动,而非间歇性的检查。只有通过频繁监控,才能及时捕捉系统的变化和潜在问题。 ● 缺少自动化或自服务:引入自动化和自服务的监控工具是必要的,这有助于提高效率、减少人工干预,并能够更好地应对系统变化。 正确的监控方法是在保证准确性和实时性的基础上,采用灵活、动态、频繁、自动化的监控策略,从而更好地了解和管理系统的运行状态。

二、黑盒监控与白盒监控

1. 黑盒监控

在黑盒监控中,应用程序或主机的观察是从外部进行的,因此该方法可能受到一定的限制。其检查旨在评估被观察系统是否按照已知的方式响应探测。 例子: ● 主机是否响应 PING 请求。 ● 特定 TCP 端口是否处于打开状态。 ● 应用程序是否在接收特定 HTTP 请求时使用正确的数据和状态代码进行响应。 ● 特定应用程序的进程是否在其主机中运行。

2. 白盒监控

白盒监控使系统能够展示其内部状态和关键性能数据。这种自我观察可能非常强大,因为它揭示了内部操作,展示了不同内部组件的健康状况,这在没有此类监控的情况下可能难以确定。 数据处理方式: ● 日志导出: 通常通过日志记录来实现,例如处理 HTTP 服务器的访问日志以监视请求率、延迟和错误百分比。 ● 结构化事件输出: 类似于日志记录,但不将数据写入磁盘,而是直接发送到处理系统进行分析和聚合。 ● 聚合保存在内存中: 这种格式的数据可以驻留在端点中,也可以直接从命令行工具中读取。例如,使用 Prometheus metrics的 /metrics、HAProxy 的 stats 页面或 varnishstats 命令行工具。

三、度量指标

在监控系统执行过程中,度量指标通常可以分为两种方式:push(监控系统主动拉取服务数据)和 pull (被监控的服务自动推送数据到监控系统)【站在客户的角度】。

Push VS Pull

测量什么

谷歌提出应该监控的四个指标: ● 延迟: 服务请求所需的时间。 ● 流量: 正在发出的请求的数量。 ● 错误: 请求失败的比率。 ● 饱和: 未处理的工作量,通常在队列中。

Brendan 的方法更关注于对于每个资源( CPU、磁盘、网络接口等)的监视,包括以下指标: ● 利用率: 以资源繁忙的百分比来衡量。 ● 饱和: 资源无法处理的工作量,通常会排队。 ● 错误: 发生的错误数量。

汤姆威尔基的红色方法更侧重于服务级别方法,而不是底层系统本身。这种方法对于了解服务很有用,对于预测外部客户的体验也很有价值。如果服务的错误率增加,就可以合理地假设这些错误将直接或间接地影响客户的体验。 ● 速率: 转换成每秒请求数。 ● 错误: 每秒失败请求的数量。 ● 持久性: 这些请求所花费的时间。

四、健康好用的监控应用

1. 百川云网站监测

长亭百川云网站监测是一款专为有站点监测需求的用户打造的 SaaS 应用,致力于解决用户互联网风险监测难题的 SaaS 化订阅服务产品。可实现对网络质量、页面性能、入侵篡改、内容违规、挂马暗链、SSL 证书等场景进行周期性监控,支持多维度分析性能指标。利用可视化性能数据和告警通知,帮助用户及时对业务质量作出反应,保证业务稳定正常运行。 监控类型包括: ● 可用性监控 ● 稳定性监控 ● 内容合规监控:敏感内容+内容篡改 ● 安全监控:暗链监控、挂马监控、dns解析监控 ● 漏洞扫描

2. Prometheus

● 成熟的社区支撑,是CNCF的毕业项目,得到大厂支持。 ● 易于部署和运维,核心只有一个二进制文件,无其他依赖。 ● 采用Pull模型,通过HTTP的Pull方式从各监控目标拉取数据,避免了Push模型的运维难度和压力。 ● 强大的数据模型,支持自定义标签,有助于进行数据聚合和计算。 ● 强大的查询语言PromQL,支持数据查询、聚合、可视化和告警。 ● 完善的生态,提供丰富的接入方案和客户端SDK。 ● 高性能,单一实例可处理数以百计的监控指标。

当然还有更多其他好用的监控应用,也可以选择自己二开。你觉得有哪些好用的监控应用呢?在评论区推荐吧~~

这篇关于监控系统的评分标准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670771

相关文章

linux重启命令有哪些? 7个实用的Linux系统重启命令汇总

《linux重启命令有哪些?7个实用的Linux系统重启命令汇总》Linux系统提供了多种重启命令,常用的包括shutdown-r、reboot、init6等,不同命令适用于不同场景,本文将详细... 在管理和维护 linux 服务器时,完成系统更新、故障排查或日常维护后,重启系统往往是必不可少的步骤。本文

Mac系统下卸载JAVA和JDK的步骤

《Mac系统下卸载JAVA和JDK的步骤》JDK是Java语言的软件开发工具包,它提供了开发和运行Java应用程序所需的工具、库和资源,:本文主要介绍Mac系统下卸载JAVA和JDK的相关资料,需... 目录1. 卸载系统自带的 Java 版本检查当前 Java 版本通过命令卸载系统 Java2. 卸载自定

基于Python实现一个简单的题库与在线考试系统

《基于Python实现一个简单的题库与在线考试系统》在当今信息化教育时代,在线学习与考试系统已成为教育技术领域的重要组成部分,本文就来介绍一下如何使用Python和PyQt5框架开发一个名为白泽题库系... 目录概述功能特点界面展示系统架构设计类结构图Excel题库填写格式模板题库题目填写格式表核心数据结构

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Windows 系统下 Nginx 的配置步骤详解

《Windows系统下Nginx的配置步骤详解》Nginx是一款功能强大的软件,在互联网领域有广泛应用,简单来说,它就像一个聪明的交通指挥员,能让网站运行得更高效、更稳定,:本文主要介绍W... 目录一、为什么要用 Nginx二、Windows 系统下 Nginx 的配置步骤1. 下载 Nginx2. 解压

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹

windows系统上如何进行maven安装和配置方式

《windows系统上如何进行maven安装和配置方式》:本文主要介绍windows系统上如何进行maven安装和配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. Maven 简介2. maven的下载与安装2.1 下载 Maven2.2 Maven安装2.

JVisualVM之Java性能监控与调优利器详解

《JVisualVM之Java性能监控与调优利器详解》本文将详细介绍JVisualVM的使用方法,并结合实际案例展示如何利用它进行性能调优,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1. JVisualVM简介2. JVisualVM的安装与启动2.1 启动JVisualVM2

使用Python实现Windows系统垃圾清理

《使用Python实现Windows系统垃圾清理》Windows自带的磁盘清理工具功能有限,无法深度清理各类垃圾文件,所以本文为大家介绍了如何使用Python+PyQt5开发一个Windows系统垃圾... 目录一、开发背景与工具概述1.1 为什么需要专业清理工具1.2 工具设计理念二、工具核心功能解析2.

Linux系统之stress-ng测压工具的使用

《Linux系统之stress-ng测压工具的使用》:本文主要介绍Linux系统之stress-ng测压工具的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、理论1.stress工具简介与安装2.语法及参数3.具体安装二、实验1.运行8 cpu, 4 fo