2个区域网络互联后,客户业务中断——排障

2023-12-27 14:52

本文主要是介绍2个区域网络互联后,客户业务中断——排障,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

免责声明
本文旨在提供信息和解决问题的建议,观点和建议可能不适用于个人情况,仅供参考!!!
文章中所有敏感信息已经修改,对于因本文中提供的信息而导致的任何直接或间接损失或损害不承担责任。
使用本文中的信息和建议,即表示您已阅读、理解并接受本免责声明的条款和条件。

场景说明

故障承接上回ACL实现固定时间访问资源——项目,客户2个区域的网络,本来是分开的,现在需要区域1的PC可以访问区域2的server。上篇文章已经说明了,根据客户需求PC在指定时间段可以访问server,在真机环境下测试,可以实现这个功能。现将配置导入现网环境,接上互联线路。

故障情况

将SW1和SW2互联后,客户立刻反馈,区域2下vlan200的PC无法上网;区域1下用户也有用户反馈,内网网站登不上。

网络拓扑

请添加图片描述

排查过程

客户反馈无法上网后,立刻中断SW1和SW2的互联线路,保证用户业务恢复。中断后,1分钟内,业务恢复正常
在这里插入图片描述
初步猜想是否为STP收敛,产生的网络中断。
现网环境
区域1 在G0/0/1上开启了STP disable。
区域2 接入交换机变动频繁,为了防止变动新交换机,产生STP收敛(影响业务),SW2核心以及汇聚交换机上,均将STP关闭了(这样有接入变动,只影响该接入交换机的用户),仅接入和次级接入交换机开启了STP。
该情况导致,每台接入交换机都是根桥,端口状态为指定状态
在这里插入图片描述
在这里插入图片描述
由于有大量vlan200下的用户上不了网, 且无法通过查看STP信息,查看各接入STP的具体情况。所以,这边我想通过查看日志,看看有没有端口状态迁移,有的话就说明,sw1和sw2互联了,引起了stp收敛。(这边迁移的端口是连PC的端口,当时没注意,认为就是stp引起的网络重新收敛
在这里插入图片描述从这开始,方向错了,不过还可以接着看,学下思路
因为区域2的核心与汇聚stp全局和接口下都是关闭的,所以当时以为是SW1发送的BPDU透传到接入上,引起的收敛。
在这里插入图片描述
后来发现SW1的G0/0/1接口的stp是关闭的,接口STP关闭,交换机不会往外发送BPDU报文,理论上互联也不会接入交换机重新收敛。
所以我在SW2的G0/0/1上抓包查看收到对端传来的STP报文,并在SW1的g0/0/1上开启关闭stp去观察报文接收情况。
在这里插入图片描述
在这里插入图片描述
抓包发现,不是互联后STP重新收敛了。BPDU都没过去,所以上不了网和STP没关系
在这里插入图片描述
那之前,那个端口状态迁移是啥情况)
重新回去看了一下日志,他确实是MSTP set 端口状态迁移,不过是由于终端的开机关机导致的,是终端的端口状态迁移。
在这里插入图片描述
这边查了一下,发现开启了边缘端口,终端的开机关机会报端口状态迁移这个日志。
没开边缘端口,终端的开机关机的日志是up down。(涨知识了
在这里插入图片描述
至此,毫无头绪,断网是啥情况,于是等到晚上,业务系统不再使用的时候,去现网复现这个问题


分割线


复现前准备工作
我们在各网段找了台主机,长ping 网关和baidu.com
部分网络禁ping ,ping不了百度,这里我们采用telnet baidu.com 443 端口看是否能通

这里仅贴出区域2下的PC状态截图)
区域1 区域2 互联前,VLAN200下PC ping 网关可通,ping baidu.com 可解析出域名
在这里插入图片描述
在这里插入图片描述
互联后,VLAN200下主机断网,ping 网关可通 , ping 百度找不主机
在这里插入图片描述
找不主机,即域名解析失败,是dns的问题。
更换114.114.114.114通用的DNS后,发现可以正常上网。(这里已经确定是某条与DNS有关的策略的问题
在这里插入图片描述
后来,排查发现,SW2有一条策略路由,针对区域2 PC使用的DNS,将下一跳重定向到SW1上去了,PC的流量无法从自己SW2的出口正常出去;从SW1走,也没有路由能从SW1的出口出去,故上不了网。
删除这条策略,网络恢复正常。
原区域1内,有用户反馈,内网网站登不上,后经过排查发现,是巧合情况,实际并不是本次互联导致的。特殊情况,加大了排障范围
在这里插入图片描述

这篇关于2个区域网络互联后,客户业务中断——排障的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/543492

相关文章

Linux网络配置之网桥和虚拟网络的配置指南

《Linux网络配置之网桥和虚拟网络的配置指南》这篇文章主要为大家详细介绍了Linux中配置网桥和虚拟网络的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、网桥的配置在linux系统中配置一个新的网桥主要涉及以下几个步骤:1.为yum仓库做准备,安装组件epel-re

Java内存区域与内存溢出异常的详细探讨

《Java内存区域与内存溢出异常的详细探讨》:本文主要介绍Java内存区域与内存溢出异常的相关资料,分析异常原因并提供解决策略,如参数调整、代码优化等,帮助开发者排查内存问题,需要的朋友可以参考下... 目录一、引言二、Java 运行时数据区域(一)程序计数器(二)Java 虚拟机栈(三)本地方法栈(四)J

python如何下载网络文件到本地指定文件夹

《python如何下载网络文件到本地指定文件夹》这篇文章主要为大家详细介绍了python如何实现下载网络文件到本地指定文件夹,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...  在python中下载文件到本地指定文件夹可以通过以下步骤实现,使用requests库处理HTTP请求,并结合o

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解