F2FS源码分析-6.2 [其他重要数据结构以及函数] f2fs_journal的作用

2024-06-14 10:08

本文主要是介绍F2FS源码分析-6.2 [其他重要数据结构以及函数] f2fs_journal的作用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

F2FS源码分析系列文章
主目录
一、文件系统布局以及元数据结构
二、文件数据的存储以及读写
三、文件与目录的创建以及删除(未完成)
四、垃圾回收机制
五、数据恢复机制
六、重要数据结构或者函数的分析
  1. f2fs_summary的作用
  2. f2fs_journal的作用
  3. f2fs_map_block的作用
  4. get_dnode_of_data的作用
  5. get_node_page的作用(未完成)

F2FS Journal机制

Journal机制的介绍

当F2FS进行文件读写的时候,根据 f2fs_node 的设计以及闪存设备异地更新的特性,每修改一个数据块,都需要改动 f2fs_node 的地址映射,以及NAT,SIT等信息。但是如果仅仅因为一个小改动,例如修改一个块,就需要改动这么多数据,然后再写入磁盘,这样既会导致性能下降,也会导致闪存寿命的下降。

因此F2FS设计了journal机制,用于将这些对SIT和NAT区域的数据的修改暂存在Checkpoint区域的 f2fs_journal 中,这种设计可以减少NAT和SIT的更新产生的大量的I/O

产生大量I/O的原因是,sit和nat的值会随机更新,由于flash的机制,即使更新SIT/NAT其中的一个entry,都要将这个entry所在的整个NAT/SIT的block进行重写。如用户更新了多个node(segment),每一个node/segment的更改都要更新了其中一个entry,即f2fs_nat_entry(f2fs_sit_entry)。假设这些需要更新的entry都不在通过一个f2fs_nat_block(f2fs_sit_block),那么系统就要将所有的block更新,从而产生大量的4KB的I/O,即使只改动其中一个entry。

F2FS则是通过journal机制,将这些随机更新的f2fs_nat_entry(f2fs_sit_entry)都会尝试集中写到checkpoint区域的f2fs_journal当中,即把随机更新的NAT/SIT的block需要更新的entry都集中写到同一个block,从而减少I/O的写入。如果f2fs_journal的空间还没用尽,系统就会将更新的NAT/SIT entry写入journal中,如果这些journal用尽了,才回写到NAT/SIT区域当中。

Journal涉及到的数据结构

struct f2fs_journal {union {__le16 n_nats; /* 这个journal里面包含多少个nat_journal对象 */__le16 n_sits; /* 这个journal里面包含多少个sit_journal对象 */};/* spare area is used by NAT or SIT journals or extra info */union {struct nat_journal nat_j;struct sit_journal sit_j;struct f2fs_extra_info info;};
} __packed;

f2fs_journal 可以保存NAT的journal也可以保存SIT的journal,以下分别分析:

NAT Journal
每一个nat_journal都对应了一个node,记录了这个node是属于哪一个inode,以及这个node的在flash设备的物理地址。

struct nat_journal {struct nat_journal_entry entries[NAT_JOURNAL_ENTRIES];__u8 reserved[NAT_JOURNAL_RESERVED];
} __packed;struct nat_journal_entry {__le32 nid; /* 当前node的nid信息 */struct f2fs_nat_entry ne;
} __packed;struct f2fs_nat_entry {__u8 version;		/* latest version of cached nat entry */__le32 ino;		/* 属于哪一个inode */__le32 block_addr;	/* flash设备的物理地址 */
} __packed;

SIT Journal
每一个sit_journal都对应了一个segment,记录了该segment的有效block的数目 vblocks 以及 它的分配状态bitmap valid_map

struct sit_journal {struct sit_journal_entry entries[SIT_JOURNAL_ENTRIES];__u8 reserved[SIT_JOURNAL_RESERVED];
} __packed;struct sit_journal_entry {__le32 segno; /* 当前的segment number */struct f2fs_sit_entry se;
} __packed;struct f2fs_sit_entry {__le16 vblocks;				/* 有效block的数目 */__u8 valid_map[SIT_VBLOCK_MAP_SIZE]; /* SIT_VBLOCK_MAP_SIZE=64,64*8=512可以表示每一个块的valid状态 */__le64 mtime;				/* 用于GC的victim segment selection */
} __packed;

Journal机制的实现

前面提及Journal机制主要用于将频繁的NAT和SIT的更新集中写到checkpoint区域的f2fs_journal中,从而提高性能,延长闪存颗粒的寿命。去分析Journal机制如何实现时,首先我们需要分析,系统什么时候会读写NAT、SIT区域的数据:

NAT: 更新一个node的物理地址,获取一个node的物理地址
SIT: 分配segment中的block,回收segment中的block

对于node的物理地址的更新,以及segment中的block分配状态的更新,可以参考Checkpoint机制这一节的f2fs_flush_nat_entries函数以及f2fs_flush_sit_entries函数。

因此这里关注如何获取一个node的物理地址,以及一个segment的block分配状态。

通过Journal获取一个node的物理地址

F2FS一般是通过f2fs_get_node_info函数,根据传入的nid值,找到对应的物理地址。首先从内存中找一下nid有没有cache,如果没有则使用journal寻址,如果还是没有采取NAT找,最后找到之后将这个entry的信息,加入到cache中。

void f2fs_get_node_info(struct f2fs_sb_info *sbi, nid_t nid,struct node_info *ni)
{struct f2fs_nm_info *nm_i = NM_I(sbi);struct curseg_info *curseg = CURSEG_I(sbi, CURSEG_HOT_DATA);struct f2fs_journal *journal = curseg->journal;nid_t start_nid = START_NID(nid); // 计算这个nid所在的f2fs_nat_block的第一个nidstruct f2fs_nat_block *nat_blk;struct page *page = NULL;struct f2fs_nat_entry ne;struct nat_entry *e;pgoff_t index;int i;ni->nid = nid;/* 根据nid从cache寻找物理地址信息 */down_read(&nm_i->nat_tree_lock);e = __lookup_nat_cache(nm_i, nid);if (e) { // 如果有就返回ni->ino = nat_get_ino(e);ni->blk_addr = nat_get_blkaddr(e);ni->version = nat_get_version(e);up_read(&nm_i->nat_tree_lock);return;}memset(&ne, 0, sizeof(struct f2fs_nat_entry));/* 再去journal找 */down_read(&curseg->journal_rwsem);/* * 根据nid从journal找nat_entry的信息,如果 i>=0 ,* 则表示journal有这个信息,否则表示journal不存在这个nid的信息 * */i = f2fs_lookup_journal_in_cursum(journal, NAT_JOURNAL, nid, 0);if (i >= 0) {ne = nat_in_journal(journal, i); // 将journal中的nat_entry返回出来node_info_from_raw_nat(ni, &ne); // 读到node_info中}up_read(&curseg->journal_rwsem);if (i >= 0) {up_read(&nm_i->nat_tree_lock);goto cache; // 在journal找到了,直接就返回}/** 如果journal都没有,就要从NAT读取* * 先根据这个nid计算一下所属的f2fs_nat_block的偏移,即物理地址* */index = current_nat_addr(sbi, nid);up_read(&nm_i->nat_tree_lock);/* 根据f2fs_nat_block偏移,将从磁盘读取出来 */page = f2fs_get_meta_page(sbi, index); /* 将数据转换为f2fs_nat_block的形式 */nat_blk = (struct f2fs_nat_block *)page_address(page);/* start_nid是这个nat_block的第一个nid,* 减去它就可以找出当前nid在nat_block内的偏移,然后都取出来 * */ne = nat_blk->entries[nid - start_nid];/* 根据读取出来的entry转为为ne的值,返回给调用函数 */node_info_from_raw_nat(ni, &ne);f2fs_put_page(page, 1);
cache:/* 如果cache不存在自然要缓存一下到内存中 */cache_nat_entry(sbi, nid, &ne); // 缓存这个node_entry
}

通过Journal获取一个segment的block分配状态

F2FS一般是通过get_seg_entry函数根据segment number(segno)获取对应的entry。由于segment的entry的数目比node entry少很多,所以F2FS将所有的segment的entry都读入了内存,参考Segment结构这一节。因此系统中读取segmeng entry的状态是简单的数组访问:

/* seg_entry是f2fs_sit_entry的内存结构,同样记录了vblock valid_bitmap等信息 */
static inline struct seg_entry *get_seg_entry(struct f2fs_sb_info *sbi,unsigned int segno)
{struct sit_info *sit_i = SIT_I(sbi); // 获取segment的内存管理结构return &sit_i->sentries[segno]; // 根据segno返回entry
}

这篇关于F2FS源码分析-6.2 [其他重要数据结构以及函数] f2fs_journal的作用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1060104

相关文章

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

MyBatis Plus 中 update_time 字段自动填充失效的原因分析及解决方案(最新整理)

《MyBatisPlus中update_time字段自动填充失效的原因分析及解决方案(最新整理)》在使用MyBatisPlus时,通常我们会在数据库表中设置create_time和update... 目录前言一、问题现象二、原因分析三、总结:常见原因与解决方法对照表四、推荐写法前言在使用 MyBATis

Python主动抛出异常的各种用法和场景分析

《Python主动抛出异常的各种用法和场景分析》在Python中,我们不仅可以捕获和处理异常,还可以主动抛出异常,也就是以类的方式自定义错误的类型和提示信息,这在编程中非常有用,下面我将详细解释主动抛... 目录一、为什么要主动抛出异常?二、基本语法:raise关键字基本示例三、raise的多种用法1. 抛

SpringBoot 中 CommandLineRunner的作用示例详解

《SpringBoot中CommandLineRunner的作用示例详解》SpringBoot提供的一种简单的实现方案就是添加一个model并实现CommandLineRunner接口,实现功能的... 目录1、CommandLineRunnerSpringBoot中CommandLineRunner的作用

github打不开的问题分析及解决

《github打不开的问题分析及解决》:本文主要介绍github打不开的问题分析及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、找到github.com域名解析的ip地址二、找到github.global.ssl.fastly.net网址解析的ip地址三

Mysql的主从同步/复制的原理分析

《Mysql的主从同步/复制的原理分析》:本文主要介绍Mysql的主从同步/复制的原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录为什么要主从同步?mysql主从同步架构有哪些?Mysql主从复制的原理/整体流程级联复制架构为什么好?Mysql主从复制注意

Python中bisect_left 函数实现高效插入与有序列表管理

《Python中bisect_left函数实现高效插入与有序列表管理》Python的bisect_left函数通过二分查找高效定位有序列表插入位置,与bisect_right的区别在于处理重复元素时... 目录一、bisect_left 基本介绍1.1 函数定义1.2 核心功能二、bisect_left 与

java -jar命令运行 jar包时运行外部依赖jar包的场景分析

《java-jar命令运行jar包时运行外部依赖jar包的场景分析》:本文主要介绍java-jar命令运行jar包时运行外部依赖jar包的场景分析,本文给大家介绍的非常详细,对大家的学习或工作... 目录Java -jar命令运行 jar包时如何运行外部依赖jar包场景:解决:方法一、启动参数添加: -Xb

java中BigDecimal里面的subtract函数介绍及实现方法

《java中BigDecimal里面的subtract函数介绍及实现方法》在Java中实现减法操作需要根据数据类型选择不同方法,主要分为数值型减法和字符串减法两种场景,本文给大家介绍java中BigD... 目录Java中BigDecimal里面的subtract函数的意思?一、数值型减法(高精度计算)1.

C++/类与对象/默认成员函数@构造函数的用法

《C++/类与对象/默认成员函数@构造函数的用法》:本文主要介绍C++/类与对象/默认成员函数@构造函数的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录名词概念默认成员函数构造函数概念函数特征显示构造函数隐式构造函数总结名词概念默认构造函数:不用传参就可以