Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用详解

2024-09-06 20:48

文章标签 作用数据详解持久 namenode hadoop 化机制 secondarynamenode

本文主要是介绍Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用详解，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

点击上方蓝色字体，选择“设为星标”

回复”资源“获取更多资源

大数据技术与架构

点击右侧关注，大数据开发领域最强公众号！

暴走大数据

点击右侧关注，暴走大数据！

我们都知道namenode是用来存储元数据的，他并不是用来存储真正的数据。

那么他的元数据怎么进行持久化呢！

FsImage

文件系统的镜像文件叫fsImage，它包括了文件和块信息的映射，还有文件系统的属性信息。

datanode启动的过程中首先会向namenode注册块信息，这些块信息就是存储在namenode的FsImage中的。

EditLog

对于文件系统的每一次更改，例如，增加文件，删除文件等操作都会被写入Edit Log 这个问题件中。

同样的，修改文件系统的副本因子配置，也会被写入Edit Log文件。

EditLog 文件和fsImage文件都存储在文件系统的本地路径中。

namenode在内存中存储了，整个文件系统的镜像和文件块映射信息。

元数据是可以被合并的，因此namenode有4GB的内存，就足以存储巨量的文件和目录。

namenode启动过程中发生了什么呢？

1、从硬盘读取FsImage 和EditLog文件。

2、将EditLog文件中的所有操作信息写入FsImage中。产生一个新的FsImage文件- - - -这一操作被称为checkpoint

3、产生一个新的空的EditLog文件

namenode启动的时候checkponit

namenode运行过程中和fsImage 与 EditLog的交互操作

SecondaryNamenode

很多人理解的SecondaryNamenode的作用就是对namenode的备份，当namenode宕机了，可以快速用secondarynamenode 恢复回来。

其实 SecondaryNamenode的重要作用，是定期合并FsImage和EditLog文件。

考虑一个场景。当我们的namenode宕机了。我们需要读取EditLog文件合并fsImage文件做恢复。如果这个EditLog文件，非常非常大，那么可能仅仅是读EditLog文件，就需要很长很长时间，以至于我们的故障恢复效果很差。

所以SecondaryNameNode，定期合并FsImage和EditLog文件，并替换namenode上的旧的FsImage文件，生成新的EditLog文件，替换原来的旧的EditLog文件。这样可以保证SecondaryNameNode上的文件为最近的信息。当发生宕机时候，可以快速恢复。

欢迎点赞+收藏+转发朋友圈素质三连

文章不错？点个【在看】吧！ ????

这篇关于Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用详解的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1143086。 23002807@qq.com

相关文章

MySQL数据库双机热备的配置方法详解

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备（M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

阅读更多...

Linux kill正在执行的后台任务 kill进程组使用详解

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本，并kill2.1 进程查看2.2 遇到的

阅读更多...

MyBatis常用XML语法详解

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

阅读更多...

详解SpringBoot+Ehcache使用示例

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储：配置灵活性：编码示例引入依赖：配置ehcache.XML文件：配置

阅读更多...

从基础到高级详解Go语言中错误处理的实践指南

从基础到高级详解Go语言中错误处理的实践指南

《从基础到高级详解Go语言中错误处理的实践指南》Go语言采用了一种独特而明确的错误处理哲学,与其他主流编程语言形成鲜明对比,本文将为大家详细介绍Go语言中错误处理详细方法,希望对大家有所帮助... 目录1 Go 错误处理哲学与核心机制1.1 错误接口设计1.2 错误与异常的区别2 错误创建与检查2.1 基础

阅读更多...

k8s按需创建PV和使用PVC详解

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV（使用 StorageClass）创建 StorageClass2.创建 PV

阅读更多...

Python版本信息获取方法详解与实战

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

阅读更多...

一文详解Python如何开发游戏

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,：本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

阅读更多...

Redis 基本数据类型和使用详解

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

阅读更多...

Java中的.close()举例详解

Java中的.close()举例详解

《Java中的.close()举例详解》.close()方法只适用于通过window.open()打开的弹出窗口,对于浏览器的主窗口,如果没有得到用户允许是不能关闭的,：本文主要介绍Java中的.... 目录当你遇到以下三种情况时，一定要记得使用 .close()：用法作用举例如何判断代码中的 input

阅读更多...