页表缓存TLB原理

2024-04-12 16:52
文章标签 原理 缓存 tlb 页表

本文主要是介绍页表缓存TLB原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

处理器的内存管理单元(Memory Management Uint,MMU)负责把虚拟地址转换成物理地址,为了加快虚拟地址到物理地址的转换速度,避免每次转换都需要查询内存中的页表,处理器厂商在MMU中增加了一个高速缓存TLB(Translation Lookaside Buffer),TLB直译为转换后背缓冲区,也叫页表缓存;
页表缓存用来缓存最近使用过的页表项,有些处理器使用两级页表缓存:第一级TLB分为指令TLB和数据TLB,取指令和取数据可以并行执行;第二级TLB是统一TLB(Unified TLB),即指指令和数据共用TLB;

TLB表项格式

不同处理器架构的TLB表项的格式不同;ARM64处理器的每条TLB表项不仅包含虚拟地址和物理地址,也包含属性:内存类型、缓存策略、访问权限、地址空间标识符(Address Space Identifier,ASID)和虚拟机标识符(Virtual Machine Identifier,VMID);ASID区分不同进程的页表项,VMID区分不同虚拟机的页表项;

TLB管理

flush_tlb相关函数

如果内核修改了可能缓存在TLB里面的页表项,那么内核必须负责使旧的TLB表项失效;内核定义了每种处理器架构必须实现的函数,主要是flush tlb,即冲刷tlb,使tlb失效;如下表所示:
arm64架构实现在arch/arm64/include/asm/tlbflush.h

函数说明
void flush_tlb_all(void);使所有tlb表项失效;
void flush_tlb_mm(struct mm_struct *mm);使指定用户地址空间的所有tlb表项失效;参数mm是进程的内存描述符;
flush_tlb_range(struct vm_area_struct *vma,
unsigned long start, unsigned long end);使指定用户地址空间的某个范围的TLB表项失效;参数vma是虚拟内存区域,start是起始地址,end是结束地址;

arm64架构中关于tlb管理的说明如下:

/**	TLB Management*	==============**	The TLB specific code is expected to perform whatever tests it needs*	to determine if it should invalidate the TLB for each call.  Start*	addresses are inclusive and end addresses are exclusive; it is safe to*	round these addresses down.**	flush_tlb_all()**		Invalidate the entire TLB.**	flush_tlb_mm(mm)**		Invalidate all TLB entries in a particular address space.*		- mm	- mm_struct describing address space**	flush_tlb_range(mm,start,end)**		Invalidate a range of TLB entries in the specified address*		space.*		- mm	- mm_struct describing address space*		- start - start address (may not be aligned)*		- end	- end address (exclusive, may not be aligned)**	flush_tlb_page(vaddr,vma)**		Invalidate the specified page in the specified address range.*		- vaddr - virtual address (may not be aligned)*		- vma	- vma_struct describing address range**	flush_kern_tlb_page(kaddr)**		Invalidate the TLB entry for the specified page.  The address*		will be in the kernels virtual memory space.  Current uses*		only require the D-TLB to be invalidated.*		- kaddr - Kernel virtual memory address*/

arm64 tlb失效指令

当tlb没有命中的时候,arm64处理器的MMU自动遍历内存中的页表,把页表项复制到tlb,不需要软件把页表写道tlb,所有arm64架构没有提供写tlb的指令;

arm64架构提供了一条tlb失效指令:


TLBI <type><level>{IS} {, <Xt>}


1)字段type的常见选项如下:

  • ALL:所有表项;
  • VMALL:当前虚拟机的阶段1的所有表项,即表项的VMID是当前虚拟机的VMID;虚拟机里面运行的客户操作系统的虚拟地址转换成物理地址分为两个阶段:第1阶段把虚拟地址转换成中间物理地址;第2阶段把中间物理地址转换成物理地址;
  • VMALLS12:当前虚拟机的阶段1和阶段2的所有表项;

2)字段level指定异常级别;

  • E1:异常级别1;
  • E2:异常级别2;
  • E3:异常级别3;

3)字段IS表示内部共享(Inner Shareable),即多核共享;如果不使用IS字段,表示非共享,只被一个核使用;在SMP系统中,如果指令TLBI不携带字段IS,仅使当前核的TLB表项失效;如果指令TLBI携带字段IS,表示使所有核的TLB表项失效;
4)字段Xt是X0~X31中的任一寄存器;

arm64 flush tlb函数分析

函数flush_tlb_all,用来使所有核的所有TLB表项失效;

/**	flush_tlb_all()**		Invalidate the entire TLB.
*/static inline void flush_tlb_all(void)
{dsb(ishst);__tlbi(vmalle1is);dsb(ish);isb();
}

是一些汇编代码,将宏展开后代码如下:

static inline void flush_tlb_all(void)
{asm volatile("dsb ishst": : : "memory");asm ("tlbi vmalle1is" : :);asm volatile("dsb ish" : : : "memory");asm volatile("isb" : : : "memory");
}

最主要的是tlbi vmalle1is,根据前面介绍的arm64架构tlb失效指令:使所有核上匹配当前VMID、阶段1和异常级别1的所有TLB表项失效;

对比一下ARM64架构的函数local_flush_tlb_all,作用是使当前核的所有TLB表项失效,代码如下:

static inline void local_flush_tlb_all(void)
{dsb(nshst);__tlbi(vmalle1);dsb(nsh);isb();
}

vmalle1,根据前面介绍的arm64架构tlb失效指令:使当前核上匹配当前VMID、阶段1和异常级别1的所有TLB表项失效;

地址空间标识符(Address Space Identifier,ASID)

为了减少进程切换时清空TLB的需要,ARM64处理器的TLB使用非全局(not global,nG)位区分内核和进程的页表项(nG位为0表示内核的页表项),使用ASID区分不同进程的页表项;
ARM64处理器的ASID的长度时可以设置的,支持8bit或者16bit;
SMP系统中,ARM64架构要求ASID在处理器的所有核上是唯一的;
假设ASID长度是8bit,ASID只可以有256个值,其中0是保留值;有效的ASID范围是1~255;进程的数量可能超过255,那么两个进程的ASID值可能冲突,这个问题怎么解决呢?内核引入了ASID版本号,方法如下:

  1. 每个进程有一个64位的软件ASID,低8位存放硬件ASID,高56位存放ASID版本号;
  2. 64位全局变量asid_generation的高56位保存全局ASID版本号;
  3. 当进程被调度时,比较进程的ASID版本号和全局ASID版本号;如果版本号相同,那么直接使用上次分配的硬件ASID,否则需要给进程重新分配硬件ASID;

1)如果存在空闲的硬件ASID,那么选择一个分配给进程;
2)如果没有空闲的硬件ASID,那么把全局的ASID版本号加1,重新从1开始分配硬件ASID,即硬件ASID从255回绕到1;因为刚分配得硬件ASID可能和某个进程的硬件ASID相同,只是ASID版本号不同;TLB中的ASID是硬件ASID,8bit;TLB中可能包含了这个进程的页表项,所以必须把所有处理器的TLB清空;
引入ASID版本号的好处是:避免每次进程切换都需要清空TLB,只需要在硬件ASID回绕的时候把处理器的TLB清空;

虚拟机标识符(Virtual Machine Identifier,VMID)

每个虚拟机有独立的ASID空间,TLB使用VMID区分不同虚拟机的转换表项,可以避免每次虚拟机切换都要清空TLB,只需要在VMID回绕时把处理器的TLB清空;

这篇关于页表缓存TLB原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/897705

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

MyBatis延迟加载与多级缓存全解析

《MyBatis延迟加载与多级缓存全解析》文章介绍MyBatis的延迟加载与多级缓存机制,延迟加载按需加载关联数据提升性能,一级缓存会话级默认开启,二级缓存工厂级支持跨会话共享,增删改操作会清空对应缓... 目录MyBATis延迟加载策略一对多示例一对多示例MyBatis框架的缓存一级缓存二级缓存MyBat

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇:Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

Redis中Set结构使用过程与原理说明

《Redis中Set结构使用过程与原理说明》本文解析了RedisSet数据结构,涵盖其基本操作(如添加、查找)、集合运算(交并差)、底层实现(intset与hashtable自动切换机制)、典型应用场... 目录开篇:从购物车到Redis Set一、Redis Set的基本操作1.1 编程常用命令1.2 集

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

前端缓存策略的自解方案全解析

《前端缓存策略的自解方案全解析》缓存从来都是前端的一个痛点,很多前端搞不清楚缓存到底是何物,:本文主要介绍前端缓存的自解方案,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、为什么“清缓存”成了技术圈的梗二、先给缓存“把个脉”:浏览器到底缓存了谁?三、设计思路:把“发版”做成“自愈”四、代码

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu