全流量分析某企业系统历史疑难问题秒级定位

2023-11-06 18:20

本文主要是介绍全流量分析某企业系统历史疑难问题秒级定位,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景

我们收到医院网络管理员的反馈,医生们经常抱怨其主要业务系统的访问变得缓慢。经过排查发现,网络没有异常,开发商也未发现问题,但是这个问题一直没有解决。

因此我们将NetInside流量分析系统部署到医院的机房内,使用流量分析系统提供实时和历史原始流量。本次分析重点针对业务系统性能进行分析,以供安全取证、性能分析、网络质量监测以及深层网络分析。

部署架构

与技术人员沟通了解到,医院的整体流量不是很大,因此在医院大楼的核心交换机进行流量采集,系统采用旁路方式镜像流量,对全院的内部及外网流量进行监控。

详细分析

关键业务整体健康得分

通过业务健康大屏,我们可以快速了解各关键业务在基于用户体验的性能健康状况得分,如下图:

神外临床试验数据研究(研究所)业务分析

通过健康度,我们发现神外临床试验数据研究(研究所)这业务得分较最低(5 分的业务确认为数据不全,排除分析队列),此系统即是医生反馈出现访问慢的系统,鼠标放上去,显示存在大量慢页面:

那么慢页面的原因是什么呢?我们知道影响用户体验延时的因数,包含网络、服务器及业务逻辑等多个因素,所以这么多的慢页面具体原因是我们接下来需要分析确定的。我们直接右击选择“性能问题根本原因定位”:

打开分析页面:

我们可以看到 http://172.16.230.219/IM/onlineRegisterp这个服务的所在请求都是慢的,那么是网络原因导致的吗?接着看展开的数据:

可以看到,网络时间没有问题,但服务器响应时间超过 60 多秒,那看是去是服务器的问题?我们接着看,同一台服务器其他服务:

可以看到,同一台服务器的其他服务,基本没有问题,这说明服务器本身是没有问题的,如此可以确认,该项服务延迟较大,应该是应用本身逻辑所存在的问题,我们需要在应用上去做进一步的分析。

另外,我们可以直接右击,点“应用数据包分析”:

可以直接下载此请求的数据包,以便进一步确认问题:

上图中,1.169 的 IP 发送了一个 post 的请,但 230.219 在 30秒后再回复,然后下一个请求又很快,所以显然,这个服务在响应请求时卡了一个 30 秒,如此可以进一步确认,应用本身存在问题,需要进一步的排查。

人事管理系统分析

人事管理系统影响得分的因素,则只是存在错请求,我们点看查看:

由上图可以看到,在第一个特定请求时,存在 7 次 500,而访问次数是 75 次,这种情况通常需要对中间件或逻辑进行分析,因为本上讲,几十次的访问不太会出现 500 的错误。

快速了解客户访问体验

基于业务分析的模块,我们不仅关注业务本身,还关注客户对业务的访问的体验情况。一般而言,只要业务可用,存在性能问题客户通常不会报告,但大概率会心有抱怨。所以提供主动积极有客户体验关怀,我们的特色功能,如下:

通过上述功能,我们可以知道特定业务,每个客户的的访问体验,并快事了解体验差的来访问者,并主动进行关怀,快速解决用户体验问题。

分析结论

经信息科的全面协助,我们对导入的流量中,测试的关键要素进行了分析,初步得出了以下结果:

1、神外临床试验数据研究(研究所)onlineRegisterp 服务模块出现存在严重性能问题,从发现问题到定位边界不到 5 秒;

2、人事管理系统存在 500 错误信息,这种情况通常需要对中间件或逻辑进行分析;

3、一眼可以看到特定业务客户访问的体验情况,可针对体验较差客户,快速分析具体原因。

用户收益

经过对现场流量的仔细分析,我们对业务系统慢和报错进行提交厂商排查,厂商通过具体的地址,很快处理了慢访问和报错的问题,给医院医生带来更高效的办公环境。

NetInside全流量行为分析技术,能够快速发现业务系统的慢访问和报错原因,帮助用户轻松解决系统体验差的问题,提高用户网络的整体性能,提高业务上的办公效率。

这篇关于全流量分析某企业系统历史疑难问题秒级定位的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/358265

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

Java中最全最基础的IO流概述和简介案例分析

《Java中最全最基础的IO流概述和简介案例分析》JavaIO流用于程序与外部设备的数据交互,分为字节流(InputStream/OutputStream)和字符流(Reader/Writer),处理... 目录IO流简介IO是什么应用场景IO流的分类流的超类类型字节文件流应用简介核心API文件输出流应用文

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具