达梦8 网络中断对系统的影响

2024-06-07 18:28

本文主要是介绍达梦8 网络中断对系统的影响,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

测试环境:三节点实时主从

版本:--03134283938-20221019-172201-20018

测试1

系统没有启动确认监视器

关闭节点3网卡

登录节点1检查主库状态

显示向节点2发送归档成功,但无法收到节点3的消息,节点1挂起

日志报错如下:

2024-06-06 00:47:38.481 [INFO] database P0000002319 T0000000000000002373  Send archive log to remote instance failed, switch all ep to SUSPEND status success!
2024-06-06 00:47:48.482 [ERROR] database P0000002319 T0000000000000002356  Can't connect to DM server on '192.168.100.102' port(5800) errno(115)

恢复节点3网卡

主库日志信息如下:

2024-06-06 00:58:00.760 [INFO] database P0000002319 T0000000000000002356  mal_site_ctl_link_create startup from mal_site(0) to mal_site(2)!
2024-06-06 00:58:00.760 [INFO] database P0000002319 T0000000000000002356  mal_site_magic_gen site_magic[46500], src_site:0, dst_site:2
2024-06-06 00:58:00.761 [INFO] database P0000002319 T0000000000000002356  site[0] mal_site_ctl_port_set to site[2, IP: 192.168.100.102, port_num: 5800], socket handle = 12, site_magic = 46500
2024-06-06 00:58:00.761 [INFO] database P0000002319 T0000000000000002350  mal_site_port_get site_magic:46500, src_site:0, dst_site:2
2024-06-06 00:58:00.761 [INFO] database P0000002319 T0000000000000002349  mal_site_port_get site_magic:46500, src_site:0, dst_site:2
2024-06-06 00:58:00.768 [INFO] database P0000002319 T0000000000000002355  site[0] mal_site_data_port_set from site[2, IP: 192.168.100.102, port_num: 5800], socket handle = 14, site_magic = 46500
2024-06-06 00:58:00.769 [INFO] database P0000002319 T0000000000000002348  mal_site_port_get site_magic:46500, src_site:0, dst_site:2
2024-06-06 00:58:00.769 [INFO] database P0000002319 T0000000000000002351  mal_site_port_get site_magic:46500, src_site:0, dst_site:2

但检查主库状态依旧是suspend

重启(SHUTDOWN后被watcher自动拉起)数据库后再检查状态恢复正常

测试2

启动节点2上的确认监视器

中断节点3的网络

登录主库检查状态

虽然到TEST3发送归档失败,但主库状态正常

主库日志信息如下:

2024-06-06 01:07:44.807 [ERROR] database P0000002774 T0000000000000002819  [mal recv for arch] mal receive from site(TEST3) failed, begin lsn:622386010, end lsn:622386010, code:-6021
2024-06-06 01:07:44.807 [ERROR] database P0000002774 T0000000000000002819  send realtime archive to instance[TEST3] failed, code = -6021, begin_lsn = 622386010, end_lsn = 622386010!
2024-06-06 01:07:44.811 [INFO] database P0000002774 T0000000000000002819  Send archive log to remote instance failed, switch all ep to SUSPEND status success!
2024-06-06 01:07:46.268 [INFO] database P0000002774 T0000000000000002872  utsk_cmd_add, cmd info: cmd=217, dseq=1717631069, name_in=, begin_lsn=-1!
2024-06-06 01:07:46.268 [INFO] database P0000002774 T0000000000000002872  utsk_set_global_dw_stat, begin, msg_dseq:1717631069
2024-06-06 01:07:46.268 [INFO] database P0000002774 T0000000000000002872  set g_dw_stat from NONE to DW_FAILOVER success, g_dw_recover_stop is 0
2024-06-06 01:07:46.268 [INFO] database P0000002774 T0000000000000002872  utsk_set_global_dw_stat, finished, msg_dseq:1717631069, set code:0
2024-06-06 01:07:47.269 [INFO] database P0000002774 T0000000000000002872  utsk_cmd_add, cmd info: cmd=214, dseq=1717631070, name_in=, begin_lsn=-1!
2024-06-06 01:07:47.269 [INFO] database P0000002774 T0000000000000002832  utsk_cmd_exec, cmd:214, sys_status:SUSPEND, dseq:1717631070
2024-06-06 01:07:47.270 [INFO] database P0000002774 T0000000000000002832  Change TEST3 arch status from VALID to INVALID
2024-06-06 01:07:47.270 [INFO] database P0000002774 T0000000000000002872  utsk_cmd_add, received sql exec cmd:1, dseq:1717631071, sql:ALTER DATABASE OPEN FORCE

日志显示主库被挂起后立刻状态恢复为open

测试3

启动节点2上的确认监视器

中断节点2的网络

登录主库检查状态

网络恢复后节点2也变成了主,集群分裂

登录监视器显示如下:

集群分裂后只能重建

这篇关于达梦8 网络中断对系统的影响的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1039949

相关文章

Debian 13升级后网络转发等功能异常怎么办? 并非错误而是管理机制变更

《Debian13升级后网络转发等功能异常怎么办?并非错误而是管理机制变更》很多朋友反馈,更新到Debian13后网络转发等功能异常,这并非BUG而是Debian13Trixie调整... 日前 Debian 13 Trixie 发布后已经有众多网友升级到新版本,只不过升级后发现某些功能存在异常,例如网络转

sysmain服务可以禁用吗? 电脑sysmain服务关闭后的影响与操作指南

《sysmain服务可以禁用吗?电脑sysmain服务关闭后的影响与操作指南》在Windows系统中,SysMain服务(原名Superfetch)作为一个旨在提升系统性能的关键组件,一直备受用户关... 在使用 Windows 系统时,有时候真有点像在「开盲盒」。全新安装系统后的「默认设置」,往往并不尽编

Python开发简易网络服务器的示例详解(新手入门)

《Python开发简易网络服务器的示例详解(新手入门)》网络服务器是互联网基础设施的核心组件,它本质上是一个持续运行的程序,负责监听特定端口,本文将使用Python开发一个简单的网络服务器,感兴趣的小... 目录网络服务器基础概念python内置服务器模块1. HTTP服务器模块2. Socket服务器模块

Go语言网络故障诊断与调试技巧

《Go语言网络故障诊断与调试技巧》在分布式系统和微服务架构的浪潮中,网络编程成为系统性能和可靠性的核心支柱,从高并发的API服务到实时通信应用,网络的稳定性直接影响用户体验,本文面向熟悉Go基本语法和... 目录1. 引言2. Go 语言网络编程的优势与特色2.1 简洁高效的标准库2.2 强大的并发模型2.

Nginx进行平滑升级的实战指南(不中断服务版本更新)

《Nginx进行平滑升级的实战指南(不中断服务版本更新)》Nginx的平滑升级(也称为热升级)是一种在不停止服务的情况下更新Nginx版本或添加模块的方法,这种升级方式确保了服务的高可用性,避免了因升... 目录一.下载并编译新版Nginx1.下载解压2.编译二.替换可执行文件,并平滑升级1.替换可执行文件

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

Linux网络配置之网桥和虚拟网络的配置指南

《Linux网络配置之网桥和虚拟网络的配置指南》这篇文章主要为大家详细介绍了Linux中配置网桥和虚拟网络的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、网桥的配置在linux系统中配置一个新的网桥主要涉及以下几个步骤:1.为yum仓库做准备,安装组件epel-re

python如何下载网络文件到本地指定文件夹

《python如何下载网络文件到本地指定文件夹》这篇文章主要为大家详细介绍了python如何实现下载网络文件到本地指定文件夹,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...  在python中下载文件到本地指定文件夹可以通过以下步骤实现,使用requests库处理HTTP请求,并结合o

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

Java的"伪泛型"变"真泛型"后对性能的影响

《Java的伪泛型变真泛型后对性能的影响》泛型擦除本质上就是擦除与泛型相关的一切信息,例如参数化类型、类型变量等,Javac还将在需要时进行类型检查及强制类型转换,甚至在必要时会合成桥方法,这篇文章主... 目录1、真假泛型2、性能影响泛型存在于Java源代码中,在编译为字节码文件之前都会进行泛型擦除(ty