【Oracle篇】Oracle数据库坏块处理:rman修复坏块实践与案例分析(第七篇,总共八篇)

本文主要是介绍【Oracle篇】Oracle数据库坏块处理:rman修复坏块实践与案例分析(第七篇,总共八篇),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

💫《博主介绍》:✨又是一天没白过,我是奈斯,DBA一名✨

💫《擅长领域》:✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️

💖💖💖大佬们都喜欢静静的看文章,并且也会默默的点赞收藏加关注💖💖💖

    今天这篇文章作为Oracle rman系列的倒数第二篇,那么如标题所示给大家介绍一下怎么通过rman备份修复坏块的问题,那么大家都知道 rman是物理备份工具,可以通过备份的文件对存在的坏块进行修复。那么带着修复坏块的问题,进入今天的内容吧!!!

    然而,RMAN所涉及的内容之广、之深,使得难以在单篇文章中全面涵盖。所以我将理论、命令、备份策略、异机恢复、坏块处理等分成八篇文章去讲,即使分为八篇也有不少内容没有涵盖到,所以这八篇文章都是精华,看完这八篇就可以解决95%以上的RMAN相关工作内容了。八篇文章的内容分别如下:

  • 第一篇:rman物理备份工具的基础理论概述
  • 第二篇:rman工具实用指南:常用命令详解与实践
  • 第三篇:rman标准化全库备份策略:完整备份or增量备份
  • 第四篇:rman全库异机恢复:从RAC环境到单机测试环境的转移
  • 第五篇:rman全库异机恢复:从单机环境到RAC测试环境的转移
  • 第六篇:rman时间点异机恢复:从RAC环境到单机测试环境的转移
  • 第七篇:Oracle数据库坏块处理:rman修复坏块实践与案例分析(当前篇)
  • 第八篇:逻辑备份工具expdp(exp)/impdp(imp)和物理备份工具rman的区别和各自的使用场景总汇

       

坏块分为两种:

  • 物理坏块:指的是由于介质损坏或存储层面的问题导致的块损坏,例如磁盘故障或数据损坏。BLOCKRECOVER命令可以用来修复这种类型的损坏,它会尝试从备份中恢复受损的数据块,或者使用磁盘上的镜像数据进行修复。
  • 逻辑坏块:则是由数据库逻辑结构的问题引起的块损坏,例如数据完整性约束问题或逻辑错误导致的块损坏。对于逻辑坏块,通常需要通过其他手段来修复,比如恢复到一个之前的时间点或者执行逻辑数据修复操作。

            

验证是否有坏块的办法:

工具列表

坏块检查类型

能否修复坏块

描述

dbverify

物理

用于验证数据文件dbf、表、索引等,能够校验open阶段的数据文件以及shutdown状态下的数据文件,检查块的一致性错误。

exp/expdp

物理

exp:对于包含坏块的表执行导出操作,会收到相关的错误信息。

expdp:不会给出坏块的提示,只会将对象正确的数据导出。

analyze

逻辑

analyze命令的主要目的是通过分析数据库对象,为优化器收集数据库对象的统计量信息,以便优化器生成准确的执行计划。同时,它也能检查某个表或索引是否存在损坏的情况。

dbms_repair

逻辑

rman

物理and逻辑

RMAN是一块备份工具,就像一个过滤器,RMAN需要通过缓存过滤每一个块,其中一个特点就是检查块是否被损坏。如果备份的数据库中包含有坏块,将会收到错误

                

查询坏块的视图:

SQL> select * from v$database_block_corruption;      

###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。

FILE#:包含损坏块的数据文件的绝对文件号(坏块所在的文件)

BLOCK#:损坏块范围内第一个损坏块的块号(坏块的坏块号)

BLOCKS:从开始找到的损坏块数BLOCK#

CORRUPTION_CHANGE#:检测到逻辑损坏的更改号。设置为0表示介质损坏。

CORRUPTION_TYPE:数据文件中的块损坏类型:

ALL ZERO:磁盘上的块头只包含零。如果该块从未被填充并且位于Oracle7文件中,则它可能是有效的。对于空块,缓冲区将被重新格式化为Oracle8标准。

FRACTURED:块头看起来很合理,但是块的前后是不同的版本。

CHECKSUM:可选检查值显示该块不是自洽的。无法确定校验值失败的确切原因,但它可能会失败,因为块中间的扇区来自不同的版本。

CORRUPT:块被错误识别或不是数据块(例如,数据块地址丢失)

LOGICAL:块逻辑损坏

          

相关参数:

db_block_checksumDB_BLOCK_CHECKSUM确定是否DBWn直接加载程序将计算校验和(从存储在数据块中的所有字节计算出的数字),并在将数据块写入磁盘时将其存储在每个数据块的缓存头中。

    如果此参数为,则块为只读时校验与TYPICAL或者FULL并且该块的最后一次写入存储了校验和。在…里FULL模式下,Oracle还会在应用update/delete语句的更改之前验证校验和,并在应用更改后重新计算校验和。此外,Oracle会在将每个日志块写入当前日志之前为其提供一个校验和。

    大多数日志块校验和由生成前台进程完成,而LGWR或LGWR从进程(LG神经网络进程)执行其余的工作,以获得更好的CPU和缓存效率。

    如果此参数设置为OFF, DBWn仅为计算校验和SYSTEM表空间,但不适用于用户表空间。此外,当此参数设置为时,不执行日志校验和OFF.

    校验和允许Oracle检测由底层磁盘、存储系统或I/O系统导致的损坏。如果设置为FULL, DB_BLOCK_CHECKSUM还捕获内存中的损坏,并阻止它们进入磁盘。在中打开此功能TYPICAL模式只会导致1%到2%的额外开销。在……里FULL模式会导致4%到5%的开销。Oracle建议您设置DB_BLOCK_CHECKSUM到TYPICAL.

       

db_block_checkingDB_BLOCK_CHECKING指定Oracle数据库是否对数据库块执行块检查。Oracle通过遍历块中的数据来检查块,确保它在逻辑上是一致的。块检查通常可以防止内存和数据损坏。在大多数应用程序中,数据块检查通常会导致1%到10%的开销,具体取决于工作负载和参数值。特定的DML开销可能会更高。工作负载中的更新或插入越多,启用块检查的代价就越大。你应该设置DB_BLOCK_CHECKING到FULL如果性能开销是可接受的。参数有如下几个值: OFF or FALSE不对用户表空间中的块执行块检查。但是,语义块检查SYSTEM表空间块总是打开的。

                                 LOW在内存中的块内容改变后(例如UPDATE, INSERT或者DELETE语句,或者在Oracle RAC中的实例间块传输之后)。

                                 MEDIUM全部LOW对除索引之外的所有对象执行检查和完整的语义检查(遇到损坏时,可以通过drop+rebuild来重建索引的内容)。

                                FULL or TRUE全部LOW和MEDIUM对所有对象执行检查和完整的语义检查。

                      

那么开始今天的案例吧!!!

案例开始

一、模拟表数据

[oracle@11g full]$ sqlplus test/123456
SQL>
create table tb1 (id number(10),name varchar2(10));
insert into tb1 values (1,'itpux01');
insert into tb1 values (2,'itpux02');
insert into tb1 values (3,'itpux03');
insert into tb1 values (4,'itpux04');
insert into tb1 values (5,'itpux05');
commit;

二、对库进行全备(坏块从rman备份中恢复)

这里我就不写全备的脚本了,小伙伴可以跳转到👉【Oracle篇】rman标准化全库备份策略:完整备份or增量备份(第三篇,总共八篇)_rman增量备份-CSDN博客👈进行参考哦

三、查看对象的块信息

[oracle@11g full]$ sqlplus / as sysdba
SQL> select * from dba_segments where owner='TEST' and segment_name='TB1';    ###通过dba_segments视图查看表对象开始的头块ID

  

SQL> select * from dba_extents where owner='TEST' and segment_name='TB1';     ###dba_extents查看每个区开始的块

四、破坏user表空间的8404、8405块

[oracle@11g orcl]$
dd of=/oracle/app/oracle/oradata/orcl/users.264.1140874093 bs=9182 conv=notrunc seek=8404 <<EOF
New corrupted block!
EOF
###将users表空间的8404块输入New corrupted block!内容

[oracle@11g orcl]$
dd of=/oracle/app/oracle/oradata/orcl/users.264.1140874093 bs=9182 conv=notrunc seek=8405 <<EOF
New corrupted block!
EOF
###将users表空间的8405块输入New corrupted block!内容

五、验证是否存在坏块

方式一:通过rman的验证备份

RMAN> backup validate database;  
###扫描数据库的物理/逻辑错误,并不执行实际备份,如果有坏块会报出来。验证每个数据文件,status为FAILED,Blocks Failing(坏块)有内容需要先dbv验证坏块编号,然后rman修复坏块。
File   Status   Marked Corrupt   Empty Blocks   Blocks Examined   High SCN
-----  ----------  -----------------------   ------------------   -----------------------   ------------
5     FAILED          0         124840          131072        8866322   
File Name: /oracle/app/oracle/oradata/orcl/users.264.1140874093
Block Type   Blocks Failing   Blocks Processed
--------------   -------------------  ------------------------Data           0            5552            Index          0             391             Other          2             289 

  

方式二:通过视图

SQL> select * from v$database_block_corruption;    ###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。

方式三:通过dbv验证数据文件是否有坏块

[oracle@11g ~]$ dbv  file=/oracle/app/oracle/oradata/orcl/users.264.1140874093

解析一:文件5的8404、8495是坏块

解析二:Total Pages Marked Corrupt  : 2        已标记为损坏的页面总数。文件中有2个坏块

五、通过rman备份片恢复坏块。关于blockrecover命令可以参考之前的文章哦👉【Oracle篇】rman工具实用指南:常用命令详解与实践(第二篇,总共八篇)-CSDN博客👈

[oracle@11g ~]$ rman target /
RMAN> blockrecover datafile 5 block 8404;  
RMAN> blockrecover datafile 5 block 8405;    ###从备份中恢复这个数据文件坏掉的块,支持多个坏块同时修复(blockrecover datafile 4 block 23657,23658)

六、验证是否还存在坏块

方式一:通过rman的验证备份

RMAN> backup validate database;      ###所有的文件status为OK,Blocks Failing为0

  

方式二:通过视图

SQL> select * from v$database_block_corruption;    ###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。没有输出就表示不存在坏块

     

方式三:通过dbv验证数据文件是否有坏块

[oracle@11g ~]$ dbv  file=/oracle/app/oracle/oradata/orcl/users.264.1140874093
解析:
Total Pages Examined         : 131072        总共处理了131072个块(页),一个数据块大小(show parameter block),此数据文件大小为1G
Total Pages Processed (Data) : 5552          数据文件中已用数据的块数(页数),此数据文件只用了43M
Total Pages Failing   (Data) : 0             文件中有问题的块数(页数),此数据文件正常
Total Pages Processed (Index): 391           文件中索引占用的块数(页数),索引用3M
Total Pages Failing   (Index): 0             文件中有问题索引的块数(页数),索引正常
Total Pages Processed (Other): 289           文件中其他对象占用的块数(页数),其他对象占用了2M
Total Pages Processed (Seg)  : 0             文件中数据段占用的块数(页数)
Total Pages Failing   (Seg)  : 0             文件中有问题数据段的块数(页数)
Total Pages Empty            : 124840        数据文件没有用的数据块(页数)
Total Pages Marked Corrupt   : 0             文件坏块的块数(页数)
Total Pages Influx           : 0             如果值大于零,且未存在坏块的情况下,是由于处于open的文件,运行dbv程序遇到了一个当前正在被dbwn进程写入的数据块
Total Pages Encrypted        : 0             文件加密占用的块数(页数)
Highest block SCN            : 8866322 (0.8866322)        数据文件scn号

    呼,今天的内容不算多,但是整理起来还是很麻烦的,所以希望小伙伴们不吝自己的小手点赞、收藏、加关注。不过我也希望大家永远不要用到这篇文章,因为生产环境出现坏块是个非常严重的问题,而且有时候rman也发现不了坏块,所以这篇文章以备不时之需,有些技术可能在自己的职业生涯用不上,但是一定是必须要会的,万一那天出现了关于这个问题,自己可以快速借助文档去处理掉🙌

这篇关于【Oracle篇】Oracle数据库坏块处理:rman修复坏块实践与案例分析(第七篇,总共八篇)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080953

相关文章

SQLite3命令行工具最佳实践指南

《SQLite3命令行工具最佳实践指南》SQLite3是轻量级嵌入式数据库,无需服务器支持,具备ACID事务与跨平台特性,适用于小型项目和学习,sqlite3.exe作为命令行工具,支持SQL执行、数... 目录1. SQLite3简介和特点2. sqlite3.exe使用概述2.1 sqlite3.exe

qt5cored.dll报错怎么解决? 电脑qt5cored.dll文件丢失修复技巧

《qt5cored.dll报错怎么解决?电脑qt5cored.dll文件丢失修复技巧》在进行软件安装或运行程序时,有时会遇到由于找不到qt5core.dll,无法继续执行代码,这个问题可能是由于该文... 遇到qt5cored.dll文件错误时,可能会导致基于 Qt 开发的应用程序无法正常运行或启动。这种错

电脑提示xlstat4.dll丢失怎么修复? xlstat4.dll文件丢失处理办法

《电脑提示xlstat4.dll丢失怎么修复?xlstat4.dll文件丢失处理办法》长时间使用电脑,大家多少都会遇到类似dll文件丢失的情况,不过,解决这一问题其实并不复杂,下面我们就来看看xls... 在Windows操作系统中,xlstat4.dll是一个重要的动态链接库文件,通常用于支持各种应用程序

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

Java对异常的认识与异常的处理小结

《Java对异常的认识与异常的处理小结》Java程序在运行时可能出现的错误或非正常情况称为异常,下面给大家介绍Java对异常的认识与异常的处理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参... 目录一、认识异常与异常类型。二、异常的处理三、总结 一、认识异常与异常类型。(1)简单定义-什么是

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

Springboot整合Redis主从实践

《Springboot整合Redis主从实践》:本文主要介绍Springboot整合Redis主从的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言原配置现配置测试LettuceConnectionFactory.setShareNativeConnect

MyBatis Plus 中 update_time 字段自动填充失效的原因分析及解决方案(最新整理)

《MyBatisPlus中update_time字段自动填充失效的原因分析及解决方案(最新整理)》在使用MyBatisPlus时,通常我们会在数据库表中设置create_time和update... 目录前言一、问题现象二、原因分析三、总结:常见原因与解决方法对照表四、推荐写法前言在使用 MyBATis

六个案例搞懂mysql间隙锁

《六个案例搞懂mysql间隙锁》MySQL中的间隙是指索引中两个索引键之间的空间,间隙锁用于防止范围查询期间的幻读,本文主要介绍了六个案例搞懂mysql间隙锁,具有一定的参考价值,感兴趣的可以了解一下... 目录概念解释间隙锁详解间隙锁触发条件间隙锁加锁规则案例演示案例一:唯一索引等值锁定存在的数据案例二: