案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?

本文主要是介绍案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文转载自高鹏. 基于Zabbix的铁路动车组WiFi运营服务监控系统应用研究[J]. 铁路计算机应用, 2019, 028(004):22-27.

高鹏,中国铁道科学研究院集团有限公司,电子计算技术研究所助理研究员。

摘要

为了掌握铁路动车组WiFi运营服务系统实时运行状态,提高系统运维效率,缩短售后响应时间,节约应急资源,使运营管理和服务智能化,提出一种基于Zabbix的综合性监控系统。在阐述Zabbix开源框架与数据可视化基础之上,结合铁路动车组WiFi运营服务系统部署环境及应用场景,围绕系统运维及管理的实际需求,研究Zabbix监控系统关键技术。

利用Zabbix优秀的性能和可扩展性,将车载WiFi设备系统参数信息、列车开行信息、平台运营等数据高度集中、可视化展示,同时通过使用推送媒介建立实时性、高效性的推送机制,构建多层次、立体化的综合监控管理平台,实现了对铁路动车组WiFi运营服务系统资源数据的高度共享。充分利用现有技术条件,可以提高铁路动车组WiFi运营服务系统运维的高效化、统一化、智能化水平

为什么选择Zabbix

尽管目前市场上有较多的开源监控系统产品,如Nagios、Cacti、Zenoss 等,一定程度上提高了运维效率,节约了运维成本,但其服务对象相对单一,可定制性差, 无法满足日益增长的企业级服务发展需求,而开源监控方案 Zabbix 依据其强大的展现功能和可扩展性, 加上独特的开源性和简单易用等特点 , 更适用于铁路动车组 WiFi 运营服务综合监控系统。

一 监控系统概述

1.1 监控系统场景分析

铁路动车组 WiFi 运营服务系统主要由运营管理中心、地面网络和车载局域网 3 部分组成,其网络结构主要包括互联网接入和车载局域网两部分,系统结构示意图如图所示。

互联网接入作为整个动车组 WiFi 运营服务系统 的互联网出口, 通过车顶 3G/4G 天线与铁路沿线运营商公网基站建立无线连接通道;车载局域网为车厢内用户终端和单车设备之间提供车内通信网络,车内用户终端可共享车载无线局域网系统的内容服务,车厢单车之间通过车载局域网实现互联互通。

1.2 监控系统需求分析

2017 年 6 月,首列“复兴号”标动列车正式上线运营,铁路动车组 WiFi 运营服务系统作为“复兴号” 标动列车的配套设施也随之面世,旅客乘车期间可以享受铁路动车组 WiFi 这一增值服务。随着大批量标 动“复兴号”列车投入运营,铁路动车组 WiFi 运营 服务体系规模不断扩大, 其运营管理上亟需实现实时掌控系统运行状态、监控系统突发事件, 以动态调整运营策略,进而实现铁路动车组 WiFi 运营服务 价值最大化。为满足动车组 WiFi 运营服务需求,根据铁路动车组 WiFi 运营服务系统业务架构, 构建基 于 Zabbix 的车 - 车、车 - 地、地 - 地一体化综合监控 系统平台 [5] , 分别从铁路动车组 WiFi 运营服务系统 硬件层面、系统层面、业务层面进行需求分析,以实现对不同层次粒度数据的采集与融合。

二 监控系统部署方案


在这里插入图片描述

三 监控系统应用

3.1 监控系统关键技术

高性能网络数据包缓存与转发

基于铁路动车组具有配 属局分散、不集中等特性,为避免铁路动车组 WiFi 运营服务监控系统的 Zabbix_ Server 端 无 法 承 受 来 自 终 端 Zabbix_Agentdd 频 繁 请 求压力,Zabbix 监控系统以 列为单位,将列车采集数据 集中到同一数据缓存节点,Zabbix_AAgentd 在该缓存节点拿取数据,以主动上报方式传到 Zabbix_ Serve 端。该监控系统设定车载中心服务器作为每列车的数据缓存节点,在其部署Zabbix_ Agentd,并配置对应列车的 Host_name。各车厢单车服务器及 AP 产生的数据集中到车 载 WiFi 接入控制器(AC)上,车载 AC 将接收到的数据集中于车载中心服务器基于分 布式文件储存的数据库(mongoDB)中存 储 , 数据以设备 ID 分类罗列。如图 4 MongoDB 中展示了 ID 为“ZTC-01-000BABDF3355 (设备生产商编号 - 设备类型编号 - 设备 MAC)”中 心路由器上报的参数。Zabbix_AAgentd可直接从 MongoDB 中调集参数上报给 Zabbix_Server 端,这种上报方式减少了 Zabbix _Agentd 部署节点数量,缓解了 Zabbix _Server 端的处理压力,对动车组 WiFi 运营服务监控系统后续性能的扩展有着重要意义,提升了监控系统平台的实时性和稳定性。

通信协议转换

铁路动车组 WiFi 运营服务系统涉及诸多旅客 私密信息,为保障 Zabbix 监控系统服务端数据的安全性,将 Zabbix_Server 从原有的公网阿里云端迁移到客票系统内网部署。

日志集中检索与全链路追踪技术

日志集 中分析平台从日志产生到提供检索延时不超过5 s,平均检索耗时在 3 s 以内,为研发与运维人员提供了 强有力的故障定位工具,同时也是平台运行状况 监控的重要数据源。

四 监控系统应用

4.1 监控系统应用

车载 WiFi 设备是铁路动车组 WiFi 运营服务系 统重要组成部分,其状态好坏会直接影响铁路动车组 WiFi 运营服务质量,因此,实时掌握车载 WiFi 设备运行状态,是提高系统稳定,增强用户体验感的必然前提。Zabbix 监控系统通过实时监测终端设备的心跳包 ( 客户端与服务器间的响应数据包 ),根据其呼应频率特性分析,判断设备在线状态。车载接入器(AP)作为 WiFi 运营服务系统中数量多,易被攻击的设备,其状态的好坏对整个系统稳定显得至关重要,本监控系统设置 30 s 为一上报周期,对其状态进行实时性监控。预设 AP 在线状态值为 1,不在 线状态值为 0,车载控制器(AC)设定 15 min 为一 周期, 对 AP 上报状态结果进行分析判定,以单车厢分组(每单车厢固定配置 2 个 AP),展示出周期内上报数据的最新值、最小值、平均值、最大值,根据图形化状态图趋势,直观获取终端 AP 在线状态,进而评估系统的稳定性。其状态分析展示如图 5 所示。

4.2 系统应用监控

通过对终端设备系统应用参数的采集, 将实时数据进行图形化展示,图 6 展示了应用系统 1 min 内 的平均负载、内存占用的历史记录。随着列车开行时间的推移,铁路动车组 WiFi 运营服务系统接入用户数累计增加,中间件(MYSQL)事务每秒查询和回滚率随之上升,通过对多系统参数指标的参考,用以整体性分析、评估系统运行的平稳性和健壮性。

4.3 运营商网卡数据监控

通过使用脚本程序添加自定义监控参数, 形成监控网卡数据的可视化界面。从图 7 可以看出列车在不同行驶时间、行驶区段各运营商网卡信号强度的变化趋势,图 8 展示了旅客用户在 WiFi 使用过程中带宽的实时变化趋势, 图 7、图 8 中都有出现数据 急剧变化的区段,这与列车穿过隧道或车站, 隧道或车站对运营商的信号有很大的屏蔽效应有直接关系,同时信号强度以及带宽上下的波动会受铁路 沿线运营商信号覆盖率的影响。

五 利用Zabbix强大的API扩展能力

基于 Zabbix 监控技术与数据可视化研究的基础上,针对 Zabbix 分布式、可扩展性等特点,结合铁路动车组 WiFi 运营服务系统运营数据建立监控环境,进行Zabbix 监控系统的搭建和优化,利用其强大的应用程序接口(API)扩展能力,实现了动车组 WiFi 运营服务系统相关资源的整合。通过用户定制,添加自定义监控项,完成了对动车组 WiFi 运营服务系 统数据的可视化监控与管理,这些改进突破了传统系统平台的运维管理方式,整合了监控管理工具和通用集中监控系统的优势,对保障铁路动车组 WiFi 运营服务系统平稳运行具有重要意义。本监控系统全面应用以来,以监控代替检查,实现了系统运维的数字化、信息化及自动化,不但节约了运维人力的投入,而且精准度高,预警性强,切实为铁路动车组 WiFi 运营服务系统起到了保驾护航的作用,同时该系统监控系统的建设及改进对类似大型企业级应用具有借鉴价值。

你还想了解Zabbix在哪个行业的应用,欢迎留言告诉我们。

这篇关于案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/218145

相关文章

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

RabbitMQ消费端单线程与多线程案例讲解

《RabbitMQ消费端单线程与多线程案例讲解》文章解析RabbitMQ消费端单线程与多线程处理机制,说明concurrency控制消费者数量,max-concurrency控制最大线程数,prefe... 目录 一、基础概念详细解释:举个例子:✅ 单消费者 + 单线程消费❌ 单消费者 + 多线程消费❌ 多

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

Spring Boot 与微服务入门实战详细总结

《SpringBoot与微服务入门实战详细总结》本文讲解SpringBoot框架的核心特性如快速构建、自动配置、零XML与微服务架构的定义、演进及优缺点,涵盖开发环境准备和HelloWorld实战... 目录一、Spring Boot 核心概述二、微服务架构详解1. 微服务的定义与演进2. 微服务的优缺点三

RabbitMQ消息总线方式刷新配置服务全过程

《RabbitMQ消息总线方式刷新配置服务全过程》SpringCloudBus通过消息总线与MQ实现微服务配置统一刷新,结合GitWebhooks自动触发更新,避免手动重启,提升效率与可靠性,适用于配... 目录前言介绍环境准备代码示例测试验证总结前言介绍在微服务架构中,为了更方便的向微服务实例广播消息,

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

MySql基本查询之表的增删查改+聚合函数案例详解

《MySql基本查询之表的增删查改+聚合函数案例详解》本文详解SQL的CURD操作INSERT用于数据插入(单行/多行及冲突处理),SELECT实现数据检索(列选择、条件过滤、排序分页),UPDATE... 目录一、Create1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更

golang程序打包成脚本部署到Linux系统方式

《golang程序打包成脚本部署到Linux系统方式》Golang程序通过本地编译(设置GOOS为linux生成无后缀二进制文件),上传至Linux服务器后赋权执行,使用nohup命令实现后台运行,完... 目录本地编译golang程序上传Golang二进制文件到linux服务器总结本地编译Golang程序

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数