prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件

本文主要是介绍prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 基本信息
在这里插入图片描述
2. 安装
2.1 blackbox_exporter 安装

$ pwd
/alidata1/admin/tools/exporter/blackbox$ ls  ## 配置文件blackbox.yml  使用默认即可
blackbox_exporter  blackbox.yml  LICENSE  NOTICE## 配置开机自启文件
$ sudo cat /etc/systemd/system/blackbox_exporter.service
[Unit]
Description=BlackBox Exporter[Service]
User=admin
Group=admin
ExecStart=/alidata1/admin/tools/exporter/blackbox/blackbox_exporter --config.file=/alidata1/admin/tools/exporter/blackbox/blackbox.yml --web.listen-address=192.168.242.205:20011 --log.level=warn 
Restart=on-failure[Install]
WantedBy=multi-user.target## 启动并配置开机自启
$ sudo systemctl enable --now blackbox_exporter 

2.2 prometheus安装
安装过程见 Prometheus安装 , 此处不再安装, 只是配置需要做些改动

## 目录结构
$ pwd
/alidata1/admin/tools/prometheus-2.37.5
$ $ ll
总用量 206448
drwxr-xr-x 2 admin admin        22 6月   6 17:02 auth
drwxrwxr-x 2 admin admin        90 6月   7 14:44 conf
drwxr-xr-x 2 admin admin        38 12月  9 21:06 console_libraries
drwxr-xr-x 2 admin admin       173 12月  9 21:06 consoles
-rw-r--r-- 1 admin admin     11357 12月  9 21:06 LICENSE
-rw-r--r-- 1 admin admin      3773 12月  9 21:06 NOTICE
-rwxr-xr-x 1 admin admin 109779661 12月  9 20:49 prometheus
-rw-r--r-- 1 admin admin      2173 6月   7 11:44 prometheus.yml
-rwxr-xr-x 1 admin admin 101601052 12月  9 20:52 promtool
drwxrwxr-x 2 admin admin        30 6月   7 14:33 rules## 1. 在配置文件prometheus.yml 中追加关于blackbox的配置
......
## 应用状态- job_name: services_statusmetrics_path: /probefile_sd_configs:- files: ['./conf/blackbox_service_status.yml']params:module: [tcp_connect]relabel_configs:- source_labels: [__address__]target_label: __param_target- source_labels: [__param_target]target_label: instance- replacement: "192.168.242.205:20011"target_label: __address__## 2. 在配置文件prometheus.yml中新增告警配置
# Alertmanager configuration     ## 将告警打开
alerting:alertmanagers:- static_configs:- targets:- 192.168.242.205:9093   rule_files:    ## 告警配置文件- "rules/*.yml"## 3. 新增配置文件 ./conf/blackbox_service_status.yml 里面是关于应用的配置
$ cat ./conf/blackbox_service_status.yml
- targets: ['192.168.242.205:9090']labels: {appName: frontend, env: prd }
- targets: ['192.168.84.56:8635', '192.168.242.205:9091']labels: {appName: backend, env: prd }## 4. 新增告警规则配置文件 rules/blackbox_service.yml
groups:
- name: appstatusrules:- alert: 服务已停止expr: probe_success{job=~"services_status"} == 0 for: 1mlabels:severity: critical annotations:summery: "当前应用 {{ $labels.appName }} : {{ $labels.instance }} 服务已停止, 请尽快处理"## 5. 重新加载prometheus配置
$ curl -XPUT http://192.168.242.205:9090/-/reload

2.3 alertmanager安装

$ pwd
/alidata1/admin/tools/alertmanager-0.25.0
$ ls
alertmanager  alertmanager.yml  amtool  LICENSE  NOTICE  template## 1. 查看配置文件alertmanager.yml
global:resolve_timeout: 5msmtp_smarthost: "smtp.qq.com:465"smtp_from: "939545179@qq.com"smtp_auth_username: "939545179@qq.com"smtp_auth_password: "xxxxxxx"    ## qq邮箱授权码smtp_require_tls: falsetemplates:- './template/*.tmpl'route:group_by: ['Alert']group_wait: 10sgroup_interval: 10srepeat_interval: 5mreceiver: 'mail'routes:- receiver: 'mail'match_re:severity: critical|warning receivers:
- name: "mail"email_configs:- to: '123456789@163.com'html: '{{ template "email.html" . }}'headers: { Subject: '{{ .CommonLabels.appName }}: {{ .CommonLabels.alertname }} ' }## 2. 邮件内容配置
$ cat template/mail.tmpl 
{{ define "email.html" }}
{{ range .Alerts }}<pre>
<strong>应用名:</strong> {{ .Labels.appName }}
<strong>环境  :</strong> {{ .Labels.env }}
<strong>实例  :</strong> {{ if gt (len .Labels.instance) 0 -}} {{ .Labels.instance }} {{ else }}  grafana {{ end }}
<strong>信息  :</strong> {{ .Annotations.summery }}
<strong>时间  :</strong> {{ (.StartsAt.Add 28800e9).Format "2006-01-02 15:04:05" }}</pre>
{{ end }}
{{ end }}## 3.配置开机自启
$ cat /etc/systemd/system/alertmanager.service
[Unit]
Description=AlertManager Service
After=network.target[Service]
User=admin
Group=admin
ExecStart=/alidata1/admin/tools/alertmanager-0.25.0/alertmanager --config.file=/alidata1/admin/tools/alertmanager-0.25.0/alertmanager.yml --storage.path=/alidata1/admin/data/alertmanager --web.listen-address=192.168.242.205:9093 --log.level=warn
Restart=on-failure
RestartSec=10[Install]
WantedBy=multi-user.target$ sudo systemctl enable alertmanager --now

3. 验证
在这里插入图片描述

这篇关于prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/228817

相关文章

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We