crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000

2024-02-02 13:30

本文主要是介绍crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

知识点:

RAC是real application clusters的缩写,译为“实时应用集群”,是高可用性的一种,也是Oracle数据库支持网格计算环境的核心技术。

主要作用:

(1)多节点负载均衡;

(2)提供高可用:故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化;

带来好处的同时,RAC管理复杂,维护难度大。

本文涉及到几个组件和进程介绍

OCR:用于存储所有与集群,RAC数据库相关的配置信息。

OHAS:集群高可用服务,并负责生成agent进程。

背景

操作系统:Red Hat 6.5

数据库:  RAC集群双节点(11.2.0.1)

由于受台风“山竹“影响,服务器异常关机,集群服务无法启动,业务中断,棘手的问题是客户没有任何备份。

精简后的操作过程:

节点1,集群状态报错

54f59719ab442983992ec56ca5365669.png

节点2

d0ddde205957174f1e7eab1b8c02405f.png

asm无法启动

d87bc2199dca35bbf1a0f92bc0edddbb.png

检查crsd.log

1e4ac998bc1af01e4534dd9f3e77af89.png

发现ocr.loc和olr.loc全部丢失,这两个文件非常重要,分别记录了ocr和olr的位置

acca576a7c11238e20b04340c44667e3.png

查看ocr没有备份,正常情况下OCR每4小时自动备份一次

3683035f73044d6a69969516b0bca9c5.png

Ocr的备份也没有,已经基本上无解了,只剩最后一招重建集群(风险操作)

重建集群过程:

rootcrs.pl  -verbose -deconfig -force

a8ee8df4907ff1a3a0b5b9bdcc351b5b.png

52994a0d676dd430291c09504acd8a2a.png

执行root.sh脚本

404c85a0419991e29a221d8fa15185af.png

重建脚本的时候继续报错,这个报错说明OHAS没有起来

f0f69d6f20fe38693cb1cab2469510a7.png

解决方法:

在执行root.sh脚本时出现Adding daemon to inittab的时候,在另一个窗口使用root执行以下命令:

bb36a8a64f0593c64ac786a12af26a80.png

之后创建文件输入以下命令,oracle-ohasd.conf必须创建,否则重启系统后无法自动启动OHAS

3f2ab8a6517f1482077dacf6a2d4db01.png

说明OHAS已经启动

bc904a9889c0798d24eb9ef467f69998.png

集群重建之后,集群已经无法管理数据库资源,报下面错误

2190c5c0883ad445069e8dcba63c1307.png

需要把数据库注册到到集群,发现已经存在

6693b92a075d1f4d23c3d5b0c85faeb9.png

需要执行如下命令删掉serverpool再添加

25f6cb8f09639c29104258ce45aac754.png

已经成功把数据库注册到集群管理

6e0b2bc3c64a0acdcbe79ba40399c8e8.png

查看集群状态,已经正常。

d20353e19772d4dfb5194a8e01a76f5b.png

至此恢复结束。能恢复成功是一种幸运,所幸硬件和存储没出问题。

这篇关于crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670846

相关文章

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

Redis中哨兵机制和集群的区别及说明

《Redis中哨兵机制和集群的区别及说明》Redis哨兵通过主从复制实现高可用,适用于中小规模数据;集群采用分布式分片,支持动态扩展,适合大规模数据,哨兵管理简单但扩展性弱,集群性能更强但架构复杂,根... 目录一、架构设计与节点角色1. 哨兵机制(Sentinel)2. 集群(Cluster)二、数据分片

Linux之platform平台设备驱动详解

《Linux之platform平台设备驱动详解》Linux设备驱动模型中,Platform总线作为虚拟总线统一管理无物理总线依赖的嵌入式设备,通过platform_driver和platform_de... 目录platform驱动注册platform设备注册设备树Platform驱动和设备的关系总结在 l

Jenkins分布式集群配置方式

《Jenkins分布式集群配置方式》:本文主要介绍Jenkins分布式集群配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装jenkins2.配置集群总结Jenkins是一个开源项目,它提供了一个容易使用的持续集成系统,并且提供了大量的plugin满

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

Java进程异常故障定位及排查过程

《Java进程异常故障定位及排查过程》:本文主要介绍Java进程异常故障定位及排查过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、故障发现与初步判断1. 监控系统告警2. 日志初步分析二、核心排查工具与步骤1. 进程状态检查2. CPU 飙升问题3. 内存

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

SpringBoot连接Redis集群教程

《SpringBoot连接Redis集群教程》:本文主要介绍SpringBoot连接Redis集群教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 依赖2. 修改配置文件3. 创建RedisClusterConfig4. 测试总结1. 依赖 <de

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx