《在主备线路场景下—Track结合SLA的使用实践》—那些你应该知道的知识(八)

2023-12-18 13:38

本文主要是介绍《在主备线路场景下—Track结合SLA的使用实践》—那些你应该知道的知识(八),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

写在前面:

在之前的一篇文章中,我们已经讲过Eigrp是如何计算重分布路由的metric值的过程。在实际生产环境中,我们常常会针对重要的外联单位,部署两条运营商线路以保障业务的连续性。由于对端外联单位的特殊情况,常常不允许我们配置动态路由协议,以实现线路的自动切换,我们可能只能通过配置静态路由实现与对方网络的路由可达。在这样的情况下,我们往往需要使用静态路由结合Track,在通过track结合SLA,以实现线路的自动切换。

下面我们来看具体的例子。


实验环境:

VPC:10.1.2.2

在7206VXR上面起环回口 loopback 100:10.1.1.1

7206VXR1、7206VXR2、7206VXR3、7206VXR4配置EIGRP动态路由协议。

在7206VXR1上,重分布直连路由。

在7206VXR3和7206VXR4上,将10.1.1.0的路由指向7206VXR,并重分布静态路由。

通过重分布静态路由Metric的设置,实现在7206VXR1上看,到达10.1.1.0的路由,优先走R4,其次走R2。

在VXR1上看,路由如下图:

也就是主线路在7206VXR4,备线路在7206VXR3。

经验证,VPC可以ping同VXR上的环回口loopback 100.


初步使用:

首先讲一下上述环境中静态路由结合Track和SLA的初步使用方法

实现思路:在主线路的设备上,静态路由上配置Track,实现当Track Down的时候,静态路由失效,从而去往10.1.1.0的路由,不会在VXR4上重分布成功,使得在VXR1上看到去往10.1.1.0的路由指向R2,使得路由走备线。同样,最好在VXR上,针对10.1.2.0的也配置Track,实现数据包的来回路径一致。如果数据包来回路径不一致,可能导致穿越防火墙时无法正常转发的情况存在。

下面开始进行配置:

ip route 10.1.1.0 255.255.255.0 172.16.1.2 track 10track 10 ip sla 10 reachabilityip sla 10icmp-echo 172.16.1.2ip sla schedule 10 life forever start-time now!

我们可以查看当前Track的状态

我们在VXR上,也进行相似的配置,如下:

ip route 10.1.1.0 255.255.255.0 172.16.1.2 track 10track 10 ip sla 10 reachabilityip sla 10icmp-echo 172.16.1.2ip sla schedule 10 life forever start-time now!

这里,我们配置两条静态路由,通过配置不同的管理距离,实现去往10.1.2.0的路由主走主线路,当主线路失效时,走备线路。

首先,我们在VPC上ping测试,在R4上抓包确认去包与回包,都走主线路。

可以看到,去包与回包路由,都走的主线路。

下面,我们在VXR上,将主线路接口down掉,测试是否能够主备线路切换成功。

(这里由于是模拟器环境,对端接口down,本段接口并不会down,这于通过运营商mstp线路连接两端的现象刚好一致)

在等待了一段时间后,重新ping通,线路切换成功。


优化使用:

然而,这里我们看到,在丢了26个包后,才ping通。这个切换速度,在生产环境中显然是不可忍受的

查看抓包情况

在71秒后,去往VPC去往10.1.1.1的ping包依然从VXR4的接口上发出,但由于对端接口down了(这里由于模拟器的原因,本端接口没有down)。对端根本不会收到该ping包,自然也不会回应。

直到122秒后,由于线路切换完成,在VXR4上抓包再看不到VPC的ping包,从该路由器发出。

这说明,业务大约中断了51秒,这显然是生产环境中不可接受的。那么是什么导致了线路切换花费了这么长的时间呢。

通过仔细查看抓包可以看到,在第55秒,VXR4刚发送了SLA的探测包,得到了对端的响应。

之后,直到115秒,VXR4才发出第二个SLA探测包。

也就是说,直到这时,VXR4才知道,对端不可达,将Track的状态置为Down.

之后,在VXR4上的静态路由才会失效,经过约7秒时间,去往10.1.1.1的ping包,不再从VXR4发出。

这个时间为路由收敛的时间,是由于在VXR1中并没有可行后继,我们在VXR3上,设置了静态路由管理距离为200,这大于Eigrp外部路由170,静态路由并没有被提交路由表。也就是说此时,在VXR3上静态路由根本没有被重分布进来。所以当VXR4告知,本地静态路由失效,重分布失效时。要等到VXR3收到这一消息,路由表中Eigrp重分布路由失效,静态路由生效时,VXR3上静态路由才重分布成功。之后再将此路有消息进行更新。所以这一过程,同样消耗了较长的时间。

通过上述的分析,我们可以看到这是由于VXR4上SLA的探测包发送的间隔为60秒,这导致当线路发生中断时,VXR4上最长可能需要60秒,等到下一次探测包发出时,才知道对端不可达。

这里我们可以通过优化SLA发送探测包的间隔时间,加快收敛速度。

加快收敛速度:

配制方法如下,在VXR4上

ip sla 10icmp-echo 172.16.1.2frequency 10

同样,在VXR上,也需要进行相似的配置,否则仍然会导致切换时间较长。在这里不再重复了

配置之后,我们进行切换测试

我们可以看到,切换速度明显加快了。

通过抓包我们也可以看到,此时SLA探测的时间为10秒

这里,我们知道,通过修改sla的探测间隔时间,可以有效提高线路切换的速度,进而提高业务连续性。


特殊情况的处理:

在一些特殊情况下,可能出现线路质量不稳定的情况。具体表现为时通时不通,在这样的情况下,可能导致线路的频繁切换,严重影响业务。

面对这样的情况,我们可以延迟Track Down和 UP的时间,减少线路质量较差频繁的对业务连续性造成影响。

延迟Track Down可以用来避免,一旦检测到主线路丢包,就立即切换的情况发生。因为一次sla icmp检测只ping一个包,这存在一定的偶然性

配制方法如下:

ip sla 10icmp-echo 172.16.1.2frequency 10

延迟Track UP可以用来避免,主线路其实还未恢复至稳定,就导致回切,影响业务的情况。

配制方法如下:

!track 10 ip sla 10 reachabilitydelay up 30!

经实际验证,该配置会在SLA检测后,延迟对Track状态的改变。以减缓线路质量抖动,造成线路频繁切换,而对业务造成影响。


其他

查看Track与SLA状态的方法

show trackshow ip sla summaryshow ip sla history

其中需要注意的是,要想查看SLA历史信息,需要在配置SLA时,开启记录历史信息和设置过滤器,设置方法如下:

R4(config)#ip sla 10R4(config-ip-sla-echo)#history lives-kept 2R4(config-ip-sla-echo)#history filter all

这样便可以看到SLA的历史信息了

其中,CompT代表测试包来回所花费的时间,Sense代表返回码,1为正常,4为故障。

我们可以通过查看历史信息的方式,查看线路故障时的具体情况。

这篇关于《在主备线路场景下—Track结合SLA的使用实践》—那些你应该知道的知识(八)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/508595

相关文章

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

springboot中使用okhttp3的小结

《springboot中使用okhttp3的小结》OkHttp3是一个JavaHTTP客户端,可以处理各种请求类型,比如GET、POST、PUT等,并且支持高效的HTTP连接池、请求和响应缓存、以及异... 在 Spring Boot 项目中使用 OkHttp3 进行 HTTP 请求是一个高效且流行的方式。

防止Linux rm命令误操作的多场景防护方案与实践

《防止Linuxrm命令误操作的多场景防护方案与实践》在Linux系统中,rm命令是删除文件和目录的高效工具,但一旦误操作,如执行rm-rf/或rm-rf/*,极易导致系统数据灾难,本文针对不同场景... 目录引言理解 rm 命令及误操作风险rm 命令基础常见误操作案例防护方案使用 rm编程 别名及安全删除

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动