云原生时代的监控明星 – 夜莺

2024-08-27 03:36

本文主要是介绍云原生时代的监控明星 – 夜莺,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

云原生时代的监控明星 – 夜莺

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

引言

在云原生时代,随着业务的不断扩展和技术栈的日益复杂,对于监控系统的需求也日益增长。传统的监控方案往往难以满足现代企业的高可用、高性能要求。而夜莺监控(Nightingale),作为一款先进的开源云原生监控分析系统,以其All-In-One的设计理念,为企业带来了全新的解决方案。今天,我们就来一起探索夜莺监控的魅力所在。他到底为我解决了哪些问题?

夜莺监控简介

夜莺监控是一款由国内团队开发的开源云原生监控系统,它采用了All-In-One的设计模式,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,为用户提供了一站式的监控解决方案。无论是在私有云、公有云还是混合云环境中,夜莺都能提供开箱即用的企业级监控分析和告警能力。

帮我解决了哪些问题?

1. 实现统一告警管理

夜莺天生支持多种时序库的对接,如:Prometheus、VictoriaMetrics、Thanos、Mimir、M3DB、TDengine 等多种时序库,

在我的场景中,存在大量混部,私有云的Prometheus集群,这让我的监控告警带来一定的挑战。使用夜莺让我释放了双手。提高了效率,

具体感受如下:

  • 不在需要管理Prometheus里面的Rules
  • 不在需要维护Prometheus系的Alertmanager
  • 不在需要维护那么多集群的告警渠道及组件
  • 不在需要为每一个用户配置不一样的告警规则
  • 有了分组分级告警能力
  • 有了统一的监控告警Oncall能力
  • 中心化接管全集群Prometheus服务管理
  • 告警聚合,清晰知道哪个Prometheus集群再哇哇叫
2. 统一日志查看聚合能力

想必大佬们也有类似的场景,各集群有一套自己的日志系统,如ELK,Loki等,分别接入各项目用户使用,那么每套日志系统切换着看,是不是很麻烦?
So,他来了!!!

开源版本目前支持接入 Prometheus Like(Prometheus、VictoriaMetrics、Thanos、M3 等兼容 Prometheus 查询接口的数据源)、ElasticSearch、Loki、TDEngine 等数据源类型,但是这只是我目前接入较少的一部分。

针对这部分功能给我的感jio

  • 下回再问我要日志系统链接–> 出门左拐
3. 告警管理订阅能力

如果你有100+Prometheus 集群,有100+用户关注告警信息,兄台如何应对?


上夜莺:

内置支持多种告警规则,可以扩展支持常见通知媒介,支持告警屏蔽/抑制/聚合/自愈、告警事件管理。

  • 我给你写好规则,你爱咋收咋收 => 告警订阅
  • 我不会写PromQL,我给你大量内置,还手摸手教你OK?=> 新手模式
  • 我不想写PromQL,想点一下就能看,OK,OK,=> 指标视图
  • 告警太多了,烦死人了,点一下自动屏蔽,或者控制一下通知间隔很累吗? => 告警屏蔽
4. 统一登录

要是你维护的系统,固定一个秘密。来一个人问你一下密码,你能受得了么?

夜莺支持了 OAuth、LDAP、CAS、OIDC 这四种单点登录服务的对接,想要对接某个单点登录服务,直接在页面上配置即可

产品架构:

核心功能亮点

1. 数据采集与整合
  • 广泛的数据源支持:夜莺监控支持多种数据源接入,包括Prometheus、VictoriaMetrics等多种时序数据库,以及日志文件、网络流量等。
2. 可视化与分析
  • 灵活的仪表盘定制:用户可以根据自身需求,自定义创建多样化的仪表板,实现对监控数据的实时展示。
  • 强大的数据分析工具:内置丰富的数据分析功能,支持SQL查询、数据挖掘等功能,帮助用户深入理解业务趋势。
3. 监控告警
  • 智能告警机制:支持基于阈值、异常检测等多种告警规则,可根据不同场景设置告警策略。
  • 多渠道通知:支持邮件、短信、企业微信等多种通知方式,确保问题及时被发现并处理。
  • 运维OnCall灵活机制: 无缝搭配 Flashduty:实现告警聚合收敛、认领、升级、排班、IM集成,确保告警处理不遗漏,减少打扰,高效协同。
4. 权限管理与便捷性
  • 细粒度的权限控制:提供用户管理和权限分配功能,确保每个用户只能访问被授权的数据。
  • 统一登录对接:统一的 SSO 认证、鉴权、用户、团队、业务组管理体系,提供了一个平台底座

最近的新功能

夜莺监控团队持续更新和完善产品,最近推出的版本中新增了一些实用的功能,例如:

  • 全站暗黑主题
  • 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
  • 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
  • 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
  • 通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
  • 全局回调地址页面展示优化,增加详尽的文档提示信息
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 内置集成故障自愈能力,不需要再单独部署 ibex 模块
  • 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
  • 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
  • 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中

部署方式:

准备好MySQL、Redis、K8s集群直接apply就行了,动动手,很快的!!!

https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/intro/


希望这篇文章能为你提供有关夜莺监控的一些有用信息。如果你有任何疑问或想要了解更多细节,请随时留言讨论。

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

这篇关于云原生时代的监控明星 – 夜莺的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1110518

相关文章

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.

k8s admin用户生成token方式

《k8sadmin用户生成token方式》用户使用Kubernetes1.28创建admin命名空间并部署,通过ClusterRoleBinding为jenkins用户授权集群级权限,生成并获取其t... 目录k8s admin用户生成token创建一个admin的命名空间查看k8s namespace 的

k8s搭建nfs共享存储实践

《k8s搭建nfs共享存储实践》本文介绍NFS服务端搭建与客户端配置,涵盖安装工具、目录设置及服务启动,随后讲解K8S中NFS动态存储部署,包括创建命名空间、ServiceAccount、RBAC权限... 目录1. NFS搭建1.1 部署NFS服务端1.1.1 下载nfs-utils和rpcbind1.1

k8s容器放开锁内存限制问题

《k8s容器放开锁内存限制问题》nccl-test容器运行mpirun时因NCCL_BUFFSIZE过大导致OOM,需通过修改docker服务配置文件,将LimitMEMLOCK设为infinity并... 目录问题问题确认放开容器max locked memory限制总结参考:https://Access

springboot2.1.3 hystrix集成及hystrix-dashboard监控详解

《springboot2.1.3hystrix集成及hystrix-dashboard监控详解》Hystrix是Netflix开源的微服务容错工具,通过线程池隔离和熔断机制防止服务崩溃,支持降级、监... 目录Hystrix是Netflix开源技术www.chinasem.cn栈中的又一员猛将Hystrix熔

SpringBoot监控API请求耗时的6中解决解决方案

《SpringBoot监控API请求耗时的6中解决解决方案》本文介绍SpringBoot中记录API请求耗时的6种方案,包括手动埋点、AOP切面、拦截器、Filter、事件监听、Micrometer+... 目录1. 简介2.实战案例2.1 手动记录2.2 自定义AOP记录2.3 拦截器技术2.4 使用Fi

Spring Boot Actuator应用监控与管理的详细步骤

《SpringBootActuator应用监控与管理的详细步骤》SpringBootActuator是SpringBoot的监控工具,提供健康检查、性能指标、日志管理等核心功能,支持自定义和扩展端... 目录一、 Spring Boot Actuator 概述二、 集成 Spring Boot Actuat

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤