prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件

本文主要是介绍prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 基本信息
在这里插入图片描述
2. 安装
2.1 blackbox_exporter 安装

$ pwd
/alidata1/admin/tools/exporter/blackbox$ ls  ## 配置文件blackbox.yml  使用默认即可
blackbox_exporter  blackbox.yml  LICENSE  NOTICE## 配置开机自启文件
$ sudo cat /etc/systemd/system/blackbox_exporter.service
[Unit]
Description=BlackBox Exporter[Service]
User=admin
Group=admin
ExecStart=/alidata1/admin/tools/exporter/blackbox/blackbox_exporter --config.file=/alidata1/admin/tools/exporter/blackbox/blackbox.yml --web.listen-address=192.168.242.205:20011 --log.level=warn 
Restart=on-failure[Install]
WantedBy=multi-user.target## 启动并配置开机自启
$ sudo systemctl enable --now blackbox_exporter 

2.2 prometheus安装
安装过程见 Prometheus安装 , 此处不再安装, 只是配置需要做些改动

## 目录结构
$ pwd
/alidata1/admin/tools/prometheus-2.37.5
$ $ ll
总用量 206448
drwxr-xr-x 2 admin admin        22 6月   6 17:02 auth
drwxrwxr-x 2 admin admin        90 6月   7 14:44 conf
drwxr-xr-x 2 admin admin        38 12月  9 21:06 console_libraries
drwxr-xr-x 2 admin admin       173 12月  9 21:06 consoles
-rw-r--r-- 1 admin admin     11357 12月  9 21:06 LICENSE
-rw-r--r-- 1 admin admin      3773 12月  9 21:06 NOTICE
-rwxr-xr-x 1 admin admin 109779661 12月  9 20:49 prometheus
-rw-r--r-- 1 admin admin      2173 6月   7 11:44 prometheus.yml
-rwxr-xr-x 1 admin admin 101601052 12月  9 20:52 promtool
drwxrwxr-x 2 admin admin        30 6月   7 14:33 rules## 1. 在配置文件prometheus.yml 中追加关于blackbox的配置
......
## 应用状态- job_name: services_statusmetrics_path: /probefile_sd_configs:- files: ['./conf/blackbox_service_status.yml']params:module: [tcp_connect]relabel_configs:- source_labels: [__address__]target_label: __param_target- source_labels: [__param_target]target_label: instance- replacement: "192.168.242.205:20011"target_label: __address__## 2. 在配置文件prometheus.yml中新增告警配置
# Alertmanager configuration     ## 将告警打开
alerting:alertmanagers:- static_configs:- targets:- 192.168.242.205:9093   rule_files:    ## 告警配置文件- "rules/*.yml"## 3. 新增配置文件 ./conf/blackbox_service_status.yml 里面是关于应用的配置
$ cat ./conf/blackbox_service_status.yml
- targets: ['192.168.242.205:9090']labels: {appName: frontend, env: prd }
- targets: ['192.168.84.56:8635', '192.168.242.205:9091']labels: {appName: backend, env: prd }## 4. 新增告警规则配置文件 rules/blackbox_service.yml
groups:
- name: appstatusrules:- alert: 服务已停止expr: probe_success{job=~"services_status"} == 0 for: 1mlabels:severity: critical annotations:summery: "当前应用 {{ $labels.appName }} : {{ $labels.instance }} 服务已停止, 请尽快处理"## 5. 重新加载prometheus配置
$ curl -XPUT http://192.168.242.205:9090/-/reload

2.3 alertmanager安装

$ pwd
/alidata1/admin/tools/alertmanager-0.25.0
$ ls
alertmanager  alertmanager.yml  amtool  LICENSE  NOTICE  template## 1. 查看配置文件alertmanager.yml
global:resolve_timeout: 5msmtp_smarthost: "smtp.qq.com:465"smtp_from: "939545179@qq.com"smtp_auth_username: "939545179@qq.com"smtp_auth_password: "xxxxxxx"    ## qq邮箱授权码smtp_require_tls: falsetemplates:- './template/*.tmpl'route:group_by: ['Alert']group_wait: 10sgroup_interval: 10srepeat_interval: 5mreceiver: 'mail'routes:- receiver: 'mail'match_re:severity: critical|warning receivers:
- name: "mail"email_configs:- to: '123456789@163.com'html: '{{ template "email.html" . }}'headers: { Subject: '{{ .CommonLabels.appName }}: {{ .CommonLabels.alertname }} ' }## 2. 邮件内容配置
$ cat template/mail.tmpl 
{{ define "email.html" }}
{{ range .Alerts }}<pre>
<strong>应用名:</strong> {{ .Labels.appName }}
<strong>环境  :</strong> {{ .Labels.env }}
<strong>实例  :</strong> {{ if gt (len .Labels.instance) 0 -}} {{ .Labels.instance }} {{ else }}  grafana {{ end }}
<strong>信息  :</strong> {{ .Annotations.summery }}
<strong>时间  :</strong> {{ (.StartsAt.Add 28800e9).Format "2006-01-02 15:04:05" }}</pre>
{{ end }}
{{ end }}## 3.配置开机自启
$ cat /etc/systemd/system/alertmanager.service
[Unit]
Description=AlertManager Service
After=network.target[Service]
User=admin
Group=admin
ExecStart=/alidata1/admin/tools/alertmanager-0.25.0/alertmanager --config.file=/alidata1/admin/tools/alertmanager-0.25.0/alertmanager.yml --storage.path=/alidata1/admin/data/alertmanager --web.listen-address=192.168.242.205:9093 --log.level=warn
Restart=on-failure
RestartSec=10[Install]
WantedBy=multi-user.target$ sudo systemctl enable alertmanager --now

3. 验证
在这里插入图片描述

这篇关于prometheus + alertmanager + blackbox_exporter 实现应用监控并发送告警邮件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/228817

相关文章

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

SpringBoot中使用Flux实现流式返回的方法小结

《SpringBoot中使用Flux实现流式返回的方法小结》文章介绍流式返回(StreamingResponse)在SpringBoot中通过Flux实现,优势包括提升用户体验、降低内存消耗、支持长连... 目录背景流式返回的核心概念与优势1. 提升用户体验2. 降低内存消耗3. 支持长连接与实时通信在Sp

Conda虚拟环境的复制和迁移的四种方法实现

《Conda虚拟环境的复制和迁移的四种方法实现》本文主要介绍了Conda虚拟环境的复制和迁移的四种方法实现,包括requirements.txt,environment.yml,conda-pack,... 目录在本机复制Conda虚拟环境相同操作系统之间复制环境方法一:requirements.txt方法

Spring Boot 实现 IP 限流的原理、实践与利弊解析

《SpringBoot实现IP限流的原理、实践与利弊解析》在SpringBoot中实现IP限流是一种简单而有效的方式来保障系统的稳定性和可用性,本文给大家介绍SpringBoot实现IP限... 目录一、引言二、IP 限流原理2.1 令牌桶算法2.2 漏桶算法三、使用场景3.1 防止恶意攻击3.2 控制资源

springboot下载接口限速功能实现

《springboot下载接口限速功能实现》通过Redis统计并发数动态调整每个用户带宽,核心逻辑为每秒读取并发送限定数据量,防止单用户占用过多资源,确保整体下载均衡且高效,本文给大家介绍spring... 目录 一、整体目标 二、涉及的主要类/方法✅ 三、核心流程图解(简化) 四、关键代码详解1️⃣ 设置

Nginx 配置跨域的实现及常见问题解决

《Nginx配置跨域的实现及常见问题解决》本文主要介绍了Nginx配置跨域的实现及常见问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来... 目录1. 跨域1.1 同源策略1.2 跨域资源共享(CORS)2. Nginx 配置跨域的场景2.1

Python中提取文件名扩展名的多种方法实现

《Python中提取文件名扩展名的多种方法实现》在Python编程中,经常会遇到需要从文件名中提取扩展名的场景,Python提供了多种方法来实现这一功能,不同方法适用于不同的场景和需求,包括os.pa... 目录技术背景实现步骤方法一:使用os.path.splitext方法二:使用pathlib模块方法三

CSS实现元素撑满剩余空间的五种方法

《CSS实现元素撑满剩余空间的五种方法》在日常开发中,我们经常需要让某个元素占据容器的剩余空间,本文将介绍5种不同的方法来实现这个需求,并分析各种方法的优缺点,感兴趣的朋友一起看看吧... css实现元素撑满剩余空间的5种方法 在日常开发中,我们经常需要让某个元素占据容器的剩余空间。这是一个常见的布局需求

CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比

《CSS中的Static、Relative、Absolute、Fixed、Sticky的应用与详细对比》CSS中的position属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布... css 中的 position 属性用于控制元素的定位方式,不同的定位方式会影响元素在页面中的布局和层叠关

HTML5 getUserMedia API网页录音实现指南示例小结

《HTML5getUserMediaAPI网页录音实现指南示例小结》本教程将指导你如何利用这一API,结合WebAudioAPI,实现网页录音功能,从获取音频流到处理和保存录音,整个过程将逐步... 目录1. html5 getUserMedia API简介1.1 API概念与历史1.2 功能与优势1.3