07--Zabbix监控告警

2024-06-17 01:36
文章标签 监控 07 zabbix 告警

本文主要是介绍07--Zabbix监控告警,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:和普米一样运维必会的技能,这里总结一下,适用范围非常广泛,有图形化界面,能帮助运维极快确定问题所在,这里记录下概念和基础操作。

1、zabbix简介

Zabbix是一个基于 Web 界面的企业级开源解决方案,提供分布式系统监控和网络监控功能。它能够监视各种网络参数,确保服务器系统的安全运行,并通过灵活的通知机制让系统管理员快速定位和解决问题。Zabbix由两部分组成:Zabbix Server 和可选组件 Zabbix Agent。Zabbix Server 可以通过 SNMP、Zabbix Agent、Ping、端口监视等方法,对远程服务器和网络状态进行监控和数据收集。它支持多平台运行,为系统管理员提供强大而灵活的监控工具。

监控信息的收集方式分为主动模式和被动模式(实际工作中通常两种模式都启用)。被动模式主要依赖监控对象上报故障,其优点是占用资源少,但缺点是及时性差,无法应对通信中断等情况。而主动模式则是定时检查业务状态,其缺点是占用资源较高,但优点在于可以从业务角度测试服务,确保了监测数据的及时性。

2、zabbix服务器部署

两个节点都有部署行为,阅读此篇文章需注意主机名区别!!!

2.1、实验环境

防火墙和selinux根据需要放行或直接关闭

IP主机名角色
192.168.189.150zabbix_serverzabbix服务器/监控服务器
192.168.189.151web1业务服务器/被监控服务器

2.2、准备zabbix源

官网地址:Zabbix:企业级开源监控解决方案

操作如下

 本次使用国内镜像源完成部署

这里建议搞个centos7和epel的国内源,阿里清华都可以

[root@zabbix_server ~]# vim /etc/yum.repos.d/zabbix.repo
[root@zabbix_server ~]# cat /etc/yum.repos.d/zabbix.repo
[zabbix]
name=tsinghua_zabbix
baseurl=https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/5.0/rhel/7/x86_64/
gpgcheck=0
enabled=1[zabbix2]
name=tsinghua_zabbix_frontend
baseurl=https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/5.0/rhel/7/x86_64/frontend/
gpgcheck=0
enabled=1
[root@zabbix_server ~]# yum clean all[root@zabbix_server ~]# yum makecache

2.3、安装zabbix服务器

[root@zabbix_server ~]# yum install -y zabbix-server-mysql zabbix-agent# zabbix-server-mysql:数据库# zabbi-agent:代理程序(上报信息的程序)[root@zabbix_server ~]# yum install -y centos-release-scl#centos插件[root@zabbix_server ~]# yum install -y zabbix-web-mysql-scl zabbix-apache-conf-scl#数据库插件和前台界面

2.4、数据库部署

[root@zabbix_server ~]# yum -y install mariadb mariadb-server
[root@zabbix_server ~]# systemctl enable mariadb
Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service.
[root@zabbix_server ~]#  systemctl start mariadb

2.5、授权zabbix账号

[root@zabbix_server ~]# mysql
Welcome to the MariaDB monitor.  Commands end with ; or \g.
Your MariaDB connection id is 2
Server version: 5.5.68-MariaDB MariaDB ServerCopyright (c) 2000, 2018, Oracle, MariaDB Corporation Ab and others.Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.MariaDB [(none)]> create database zabbix character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec)MariaDB [(none)]> create user zabbix@localhost identified by 'Liumuquan@123';
Query OK, 0 rows affected (0.00 sec)MariaDB [(none)]> grant all privileges on zabbix.* to zabbix@localhost;
Query OK, 0 rows affected (0.00 sec)#授予 zabbix 用户对 zabbix 数据库的全部权限MariaDB [(none)]> flush privileges;
Query OK, 0 rows affected (0.00 sec)MariaDB [(none)]> quit;

2.6、初始化zabbix

[root@zabbix_server ~]# zcat /usr/share/doc/zabbix-server-mysql-5.0.42/create.sql.gz | mysql -uzabbix -p'Liumuquan@123' zabbix使用 zcat 解压并读取 Zabbix 提供的数据库创建脚本 create.sql.gz。
通过管道,将解压缩后的SQL内容传递给 mysql 客户端。
使用 zabbix 用户和其密码 Liumuquan@123 连接到 zabbix 数据库。
在 zabbix 数据库中执行 create.sql.gz 中包含的所有SQL语句,以创建或初始化 Zabbix 所需的数据库结构和表

2.7、配置mysql账号密码

[root@zabbix_server ~]# vim /etc/zabbix/zabbix_server.conf 
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=Liumuquan@123

2.8、启动zabbix

[root@zabbix_server ~]# systemctl enable zabbix-server.service
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-server.service to /usr/lib/systemd/system/zabbix-server.service.[root@zabbix_server ~]# systemctl start zabbix-server.service

2.9、php配置

[root@zabbix_server ~]# vim /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf 
[root@zabbix_server ~]# tail -1  /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf 
php_value[date.timezone] = Asia/Shanghai#修改时区配置[root@zabbix_server ~]# systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm
[root@zabbix_server ~]# systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-agent.service to /usr/lib/systemd/system/zabbix-agent.service.
Created symlink from /etc/systemd/system/multi-user.target.wants/httpd.service to /usr/lib/systemd/system/httpd.service.
Created symlink from /etc/systemd/system/multi-user.target.wants/rh-php72-php-fpm.service to /usr/lib/systemd/system/rh-php72-php-fpm.service.

2.10、web访问

环境检查

 数据库信息配置

zabbix服务器命名

 信息汇总

 登录zabbix(默认用户名/密码)

初始状态为全英文页面,修改语言方式如下

更改后效果如下

3、业务服务器部署

3.1、基础环境配置

将zabbix服务器的源通过scp拷贝至本机

[root@zabbix_server ~]# scp /etc/yum.repos.d/* root@192.168.189.151:/etc/yum.repos.d/

开始安装并配置

[root@web1 ~]# yum -y install zabbix-agent
[root@web1 ~]# vim /etc/zabbix/zabbix_agentd.conf 
Server=192.168.189.150
ServerActive=192.168.189.150
Hostname=web1#    语法#    Server=zabbix_ip1,zabbix_ip2#    ServerActive=zabbix_ip1,zabbix_ip2#    Hostname=web1 这里可以写变量 $HOSTNAME

启动zabbix

[root@web1 ~]# systemctl start zabbix-agent
[root@web1 ~]# systemctl enable zabbix-agent

此时双方zabbix已部署完成

4、命令行测试

在zabbix服务器上通过zabbix_get 命令行监控,zabbix5默认没有安装zabbix_get(5以前的版本自带)需要单独安装

[root@zabbix_server ~]# yum install -y zabbix-get

命令测试

[root@zabbix_server ~]# zabbix_get -s 192.168.189.151 -k system.uname
Linux web1 3.10.0-957.el7.x86_64 #1 SMP Thu Nov 8 23:39:32 UTC 2018 x86_64#-s <agent_ip>:指定 Zabbix Agent 的 IP 地址或主机名。#-k <key>:指定要获取的监控项键(key)。[root@zabbix_server ~]# zabbix_get -s 192.168.189.151 -k system.cpu.load[all,avg15]
0.050000#    过去 15 分钟所有 CPU 的平均负载

5、图形监控

创建主机组

 

 添加主机

此时主机并未有指明的监控项,为主机添加监控模板

 这里选择基础网站模板

 选择完成后zabbix已经产生告警(web1为全新环境未安装网站)

给web1装个网站程序模拟排除告警

[root@web1 ~]# yum install -y nginx
[root@web1 ~]# systemctl start nginx
[root@web1 ~]# systemctl enable nginx

等待数秒后,显示已解决

创建图形

配置——主机——web1_liumuquan——图形——创建图形

 

此处乱码为修改语言环境所致,尽量不要尝试修复!!!

6、模板(Template)

在 Zabbix 中,模板是一个非常重要的概念,用于统一和简化监控配置。模板包含一组预定义的监控项、触发器、图形、屏幕、发现规则和其他相关元素,可以应用到多个主机上,从而避免重复配置和管理。

  • 主机:监控对象
  • 应用集(Applications):应用集用于对监控项进行分组,以便更好地组织和管理。例如,可以将所有与数据库相关的监控项放在一个应用集中
  • 监控项(Items):监控项是模板中的基础元素,用于定义从主机收集的数据类型和方法。例如,CPU 使用率、内存使用情况、磁盘 I/O 等。
  • 触发器(Triggers):触发器是基于监控项的逻辑条件,用于定义何时生成告警。例如,当 CPU 使用率超过90%时触发告警。
  • 图形(Graphs):图形用于将监控数据可视化。模板可以包含预定义的图形,以便在应用模板后自动提供数据的图形化展示。
  • 聚合图形(Screens):屏幕是由多个图形和其他元素组成的仪表板,用于提供更全面的监控视图。
  • 自动发现:通过使用模板,可以确保不同主机上的监控配置一致性,并且可以轻松地将监控配置应用到新添加的主机上。这样不仅减少了工作量,还降低了人为错误的风险。如添加一整个网段的服务器。
  • web监测:独立监测几乎没用过

下面会对模板元素进行详细的解析

7、监控项(Zabbix Items)

7.1、监控项详解

监控项的定义配置可以细分为以下几个维度

配置名称详细解释
获取监控项数据方式

1)zabbix-agent

2)SNMP-简单的网际管理协议(一般用在路由器或交换机上)

取值的类型和基础单位磁盘容量单位一般为B,网卡bps,mysql的查询统计qps,cpu的ips或%等
监控key(键值)组合命令,由zabbix集成,大部分只需选择即可
获取数据的间隔工作中一般为5-30分钟,本次实验间隔越短越好
历史数据保存的时间/
趋势数据保存的时间/

如下所示

 

7.2、增加监控项(1)

增加监控项:监控服务器启动分区剩余空间

常规查询方式

zabbix监控方式

7.2.1、创建模板

7.2.2、新增监控项

 查看新增的监控项

7.2.3、新增图形

7.2.4、关联主机与模板

模板关联完成

7.2.5、观察最新数据

查看图形

通过写入文件改变剩余分区大小,观察监控结果

[root@web1 ~]# dd if=/dev/zero of=/boot/1.txt bs=1M count=300
记录了300+0 的读入
记录了300+0 的写出
314572800字节(315 MB)已复制,0.788679 秒,399 MB/秒

7.3、增加监控项(2)

增加监控项:服务器网络接口进出流量

 

添加图形

7.4、自定义监控项

自定义监控项即自定义键值key,zabbix自带key有限,有些值需要通过自定义才能完成收集。

操作如下:

添加监控项:mysql被查询次数

[root@web1 ~]# yum -y install mariadb-server mariadb
[root@web1 ~]# systemctl start mariadb
[root@web1 ~]# systemctl enable mariadb
Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service.[root@web1 ~]# mysqladmin -uroot status
Uptime: 128  Threads: 1  Questions: 2  Slow queries: 0  Opens: 0  Flush tables: 2  Open tables: 26  Queries per second avg: 0.015#    此处Questions为数据库启动后被查询次数,该值位于“第六项”[root@web1 ~]# mysqladmin -uroot status | awk '{print $6}'
3
[root@web1 ~]# mysqladmin -uroot status | awk '{print $6}'
4
[root@web1 ~]# mysqladmin -uroot status | awk '{print $6}'
5#    此处每执行一次也视为一次查询#    将此条命令保存

 配置zabbix客户端(被监控端)配置文件

[root@web1 ~]# vim /etc/zabbix/zabbix_agentd.d/customkey_mysql.conf#    customkey_mysql.conf中conf为固定格式不可更改[root@web1 ~]# cat /etc/zabbix/zabbix_agentd.d/customkey_mysql.conf
UserParameter=mysql.questions,mysqladmin -uroot status | awk '{print $6}'#    UserParameter固定值不可能更改#    mysql.questions是key名字,可自定义

初步测试配置是否正确

[root@web1 ~]# zabbix_agentd -t mysql.questions
mysql.questions                               [t|7]

测试成功后重启客户端程序,加载新增的key,按照增加监控项的操作添加

添加图形

 在被监控端执行一万次

for i in {1..10000}; do mysqladmin -uroot status; done

查看效果

8、触发器(Triggers)

触发器用于定义item的报警阈值

操作如下:

先添加一个方便设置触发器的监控项如cpu负载,并添加图形

 在被监控端创造较大文件,观察图形

[root@web1 ~]# dd if=/dev/zero of=/1.txt bs=1M count=3000
记录了3000+0 的读入
记录了3000+0 的写出
3145728000字节(3.1 GB)已复制,37.0871 秒,84.8 MB/秒

监控项正常,设置触发器

 

添加完成后回到对应的图形界面,在图中可以看到设定的触发器阈值的标记

 尝试触发告警,观察告警

9、动作(Zabbix Action)

Zabbix Action是指当某个触发器状态发生改变(如Problem、OK),可以采取相应的动作,大多为告警或执行预设命令。现在在公司常用的告警多为邮箱告警或微信告警,具体部署过程将在下方演示。

9.1、邮件告警部署

9.1.1、邮箱配置

注册一个126邮箱,并开启用于给程序登录使用的pop3授权码

按照操作提示开启pop3授权码,找个记事本将授权码保存下来稍后会使用。

9.1.2、设置zabbix邮箱

首先测试zabbix服务端和邮箱服务器的连通性

[root@zabbix_server ~]# nc smtp.126.com -t 25
220 126.com Anti-spam GT for Coremail System (126com[20140526])421 closing transmission channel

进入zabbix的web界面,创建媒体类型

 

 9.1.3、创建用户组

 9.1.4、创建用户

创建用户同时完成用户与用户组,与自定义告警类型的关联

先不要点击添加,先配置报警媒介

9.1.5、告警设置

此时未配置触发告警后zabbix需要做什么,此时点击添加会报错

常用内置变量(宏)

{TRIGGER.DESCRIPTION}        触发器描述

{TRIGGER.NAME}        触发器名称

{TRIGGER.EVENTS.ACK}        事件是否确认

宏可以自定义或引用

9.1.6、查看告警

尝试触发告警后,观察邮箱内容,这里设置的是cpu负载大于0.6

我们回到zabbix控制台可以观察,异常发生后zabbix的动作

9.2、远程执行

当问题发生,可以通过远程执行命令的方式对目标主机进行控制。

操作步骤如下

9.2.1、创建动作

9.2.2、开启zabbix远程执行

客户端操作

[root@web1 ~]# vim /etc/zabbix/zabbix_agentd.conf 
[root@web1 ~]# cat /etc/zabbix/zabbix_agentd.conf | grep EnableRemoteCommands=1#    添加如下内容
EnableRemoteCommands=1
[root@web1 ~]# systemctl restart zabbix-agent.service

9.2.3、权限设置

客户端操作

[root@web1 ~]# visudo #    在下面添加如下内容
[root@web1 ~]# tail -1  /etc/sudoers
zabbix ALL=NOPASSWD: /usr/bin/systemctl restart nginx

9.2.4、测试动作

关闭客户端nginx,查看状态却为启动或启动中

 查看zabbix状态

 小节实验完成,在公司内部可以通过构建不同的动作达成不同效果,如电话告警,短信告警,微信告警(这三项目前需要收费),也可以通过远程执行不同的脚本完成各种需求。

10、自动发现及自动注册

为了满足监控企业成千上万台服务器,因此我们需要使用Zabbix批量监控来实现。自动发现和自动注册。

清理前面注册的主机

主机列表状态

10.1、自动发现

10.1.1、创建自动发现规则

10.1.2、创建自动发现动作

添加时可以完成的操作配置

 观察自动发现

10.2、自动注册

由客户端主动发起,客户端必须安装并启动Agent,否则无法被自动注册添加至主机列表。

10.2.1、创建自动注册动作

10.2.2、根据主机名称注册

10.3、 查看新增的主机

总结:至此zabbix的概念和基础操作就结束了,下一章会将近些年工作中对于不同项目的实际监控步骤总结一下

这篇关于07--Zabbix监控告警的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1068128

相关文章

SpringBoot监控API请求耗时的6中解决解决方案

《SpringBoot监控API请求耗时的6中解决解决方案》本文介绍SpringBoot中记录API请求耗时的6种方案,包括手动埋点、AOP切面、拦截器、Filter、事件监听、Micrometer+... 目录1. 简介2.实战案例2.1 手动记录2.2 自定义AOP记录2.3 拦截器技术2.4 使用Fi

Spring Boot Actuator应用监控与管理的详细步骤

《SpringBootActuator应用监控与管理的详细步骤》SpringBootActuator是SpringBoot的监控工具,提供健康检查、性能指标、日志管理等核心功能,支持自定义和扩展端... 目录一、 Spring Boot Actuator 概述二、 集成 Spring Boot Actuat

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

prometheus如何使用pushgateway监控网路丢包

《prometheus如何使用pushgateway监控网路丢包》:本文主要介绍prometheus如何使用pushgateway监控网路丢包问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录监控网路丢包脚本数据图表总结监控网路丢包脚本[root@gtcq-gt-monitor-prome

Spring Boot集成Druid实现数据源管理与监控的详细步骤

《SpringBoot集成Druid实现数据源管理与监控的详细步骤》本文介绍如何在SpringBoot项目中集成Druid数据库连接池,包括环境搭建、Maven依赖配置、SpringBoot配置文件... 目录1. 引言1.1 环境准备1.2 Druid介绍2. 配置Druid连接池3. 查看Druid监控

如何在Ubuntu 24.04上部署Zabbix 7.0对服务器进行监控

《如何在Ubuntu24.04上部署Zabbix7.0对服务器进行监控》在Ubuntu24.04上部署Zabbix7.0监控阿里云ECS服务器,需配置MariaDB数据库、开放10050/1005... 目录软硬件信息部署步骤步骤 1:安装并配置mariadb步骤 2:安装Zabbix 7.0 Server

JVisualVM之Java性能监控与调优利器详解

《JVisualVM之Java性能监控与调优利器详解》本文将详细介绍JVisualVM的使用方法,并结合实际案例展示如何利用它进行性能调优,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1. JVisualVM简介2. JVisualVM的安装与启动2.1 启动JVisualVM2

使用Python实现实时金价监控并自动提醒功能

《使用Python实现实时金价监控并自动提醒功能》在日常投资中,很多朋友喜欢在一些平台买点黄金,低买高卖赚点小差价,但黄金价格实时波动频繁,总是盯着手机太累了,于是我用Python写了一个实时金价监控... 目录工具能干啥?手把手教你用1、先装好这些"食材"2、代码实现讲解1. 用户输入参数2. 设置无头浏

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展