笔记:linux内核内存布局以及/dev/mem

2024-05-03 22:08

本文主要是介绍笔记:linux内核内存布局以及/dev/mem,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考一下两篇文章:

linux内核内存管理(zone_dma zone_normal zone_highmem)(linux memory layout)

/dev/mem可没那么简单

学习笔记(以x86为例)

linux的虚拟地址空间:

32位的CPU,最大寻址范围为2^32 - 1也就是4G的线性地址空间。Linux简化了分段机制,使得虚拟地址与线性地址总是一致的。linux一般把这个4G的地址空间划分为两个部分:其中0~3G为用户程序地址空间,虚地址0x00000000到0xBFFFFFFF,供各个进程使用;3G~4G为内核的地址空间,虚拟地址0xC0000000到0xFFFFFFFF, 供内核使用。(注意,ARM架构不是3G/1G划分的,而是2G/2G划分。这里以3G/1G划分作讲解)。

  1. 物理内存(以4G内存为例)依次由DMA_ZONE(0~16M),NORMAL_ZONE(16~896M)和HIGH_ZONE(896~4G)组成。
  2. 内核虚拟地址空间又可以分为lowmemory和highmemory两个部分或者对应物理内存的DMA_ZONE,NORMAL_ZONE(DMA_ZONE和NORMAL_ZONE线性映射到内核虚拟地址空间(即物理地址加一个offset))和HIGH_ZONE(需要通过kmap动态映射)三个部分:
  • 其中lowmemory(共896M, 位置vm_kernel_base ~ vm_kernel_base + 896M)对应物理内存DMA_ZONE,NORMAL_ZONE。NORMAL_ZONE主要存放内核会频繁使用的数据如kernel代码、GDT、IDT、PGD、mem_map数组等。
  • highmemory(共128M,位置vm_kernel_base + 896M ~1G)对应物理内存HIGH_ZONE部分,主要存放用户数据、页表(PT)等不常用数据,只有要访问这些数据时才建立映射关系(通过kmap()),这样即使内核的虚拟地址空间最大只有1G也可以通过higmemory的128M空间采用动态建立映射的方式访问HIGH_ZONE的全部内容,结合lowmemory访问DMA_ZONE,NROMAL_ZONE,可以实现对整个4G内存的访问。highmemory的使用场景:譬如可以通过ioremap使用位于HIGH_ZONE部分的IO内存,又或者在内核虚拟空间(3~4G)访问用户虚拟空间(0~3G)的数据(通过将用户空间内存数据映射到内核空间实现)。

 

/dev/mem内存映射:

如果不做CONFIG_STRICT_DEVMEM限定,那么可以映射所有的地址空间;

如果添加了CONFIG_STRICT_DEVMEM限定,在做映射前会执行一下检测:

  • 地址范围不能超过4G;
  • 该物理地址所在的iomem不能是exclusive(独占)的;
  • 该物理地址不能在内核的lowmem部分。

简单解析一下"/driver/char/mem.c"中mmap的实现:

static int mmap_mem(struct file *file, struct vm_area_struct *vma)
{size_t size = vma->vm_end - vma->vm_start;if (!valid_mmap_phys_addr_range(vma->vm_pgoff, size))return -EINVAL;if (!private_mapping_ok(vma))return -ENOSYS;if (!range_is_allowed(vma->vm_pgoff, size))return -EPERM;if (!phys_mem_access_prot_allowed(file, vma->vm_pgoff, size,&vma->vm_page_prot))return -EINVAL;vma->vm_page_prot = phys_mem_access_prot(file, vma->vm_pgoff,size,vma->vm_page_prot);vma->vm_ops = &mmap_mem_ops;/* Remap-pfn-range will mark the range VM_IO */if (remap_pfn_range(vma,vma->vm_start,vma->vm_pgoff,size,vma->vm_page_prot)) {return -EAGAIN;}return 0;
}
  • "valid_mmap_phys_addr_range"函数检查要mmap的物理地址范围是否超过4G空间,超过则无效;
  • "private_mapping_ok"函数对于支持MMU的平台来说总是返回"1";
  • "range_is_allowed"在没有配置CONFIG_STRICT_DEVMEM的情况下总是返回"1",配置了的话需要该物理地址所在的iomem不能使exclusive独占的,并且不能处在lowmem空间中;
  • "phys_mem_access_prot_allowed"总是返回"1"表示可以设置该段需要被映射内存的protection标志;

 

以上4段在/dev/mem可没那么简单 都有分析,查看源码很容易理解,下面单独介绍一下"phys_mem_access_prot"。该函数是用来给vma的protection属性添加noncached属性(或者叫做noncached & nonbuffered,即对内存的访问是不经过硬件cache和buffer的,处理器一般具有4种cache属性:non-cached&non-buffered/non-cached&buffered/cached&write-through/cached&write-back(参考关于cache和write buffer和ARM的cache和写缓冲器(write buffer)))。

#ifdef pgprot_noncached
static int uncached_access(struct file *file, phys_addr_t addr)
{
#if defined(CONFIG_IA64)/** On ia64, we ignore O_DSYNC because we cannot tolerate memory* attribute aliases.*/return !(efi_mem_attributes(addr) & EFI_MEMORY_WB);
#elif defined(CONFIG_MIPS){extern int __uncached_access(struct file *file,unsigned long addr);return __uncached_access(file, addr);}
#else/** Accessing memory above the top the kernel knows about or through a* file pointer* that was marked O_DSYNC will be done non-cached.*/if (file->f_flags & O_DSYNC)return 1;return addr >= __pa(high_memory);
#endif
}
#endifstatic pgprot_t phys_mem_access_prot(struct file *file, unsigned long pfn,unsigned long size, pgprot_t vma_prot)
{
#ifdef pgprot_noncachedphys_addr_t offset = pfn << PAGE_SHIFT;if (uncached_access(file, offset))return pgprot_noncached(vma_prot);
#endifreturn vma_prot;
}

"#ifdef pgprot_noncached"如果不支持noncahed的page访问属性那么直接采用用户空间mmap设定的属性,否则执行"uncached_access(file, offset)"检查是否应为该段内存设置noncached访问属性。"uncached_access(file, offset)"针对三种平台IA64/MIPS/OTHERS提供了三种不同的检测方式(实际是两种:MIPS和OTHERS平台的实现方式是一样的,体现在"__uncached_access(file, offset)"函数中),对于非IA64平台如果设置了文件的O_DSYNC位那么对于文件内存的访问就应该是noncached的,或者要映射的物理内存位于highmem地址空间,那么对其的访问也应该是noncached的。

最后如果支持noncached属性,那么就通过"pgprot_noncached(vma_prot)"向vma的protection属性中添加noncached属性。

最终调用"remap_pfn_range(vma, vma->vm_start, vma->vm_pgoff, size, vm->vm_page_prot)"实现物理地址到虚拟地址的映射。

这篇关于笔记:linux内核内存布局以及/dev/mem的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/957753

相关文章

CSS3 布局样式及其应用举例

《CSS3布局样式及其应用举例》CSS3的布局特性为前端开发者提供了无限可能,无论是Flexbox的一维布局还是Grid的二维布局,它们都能够帮助开发者以更清晰、简洁的方式实现复杂的网页布局,本文给... 目录深入探讨 css3 布局样式及其应用引言一、CSS布局的历史与发展1.1 早期布局的局限性1.2

java变量内存中存储的使用方式

《java变量内存中存储的使用方式》:本文主要介绍java变量内存中存储的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、变量的定义3、 变量的类型4、 变量的作用域5、 内存中的存储方式总结1、介绍在 Java 中,变量是用于存储程序中数据

ubuntu16.04如何部署dify? 在Linux上安装部署Dify的技巧

《ubuntu16.04如何部署dify?在Linux上安装部署Dify的技巧》随着云计算和容器技术的快速发展,Docker已经成为现代软件开发和部署的重要工具之一,Dify作为一款优秀的云原生应用... Dify 是一个基于 docker 的工作流管理工具,旨在简化机器学习和数据科学领域的多步骤工作流。它

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

Linux系统调试之ltrace工具使用与调试过程

《Linux系统调试之ltrace工具使用与调试过程》:本文主要介绍Linux系统调试之ltrace工具使用与调试过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、ltrace 定义与作用二、ltrace 工作原理1. 劫持进程的 PLT/GOT 表2. 重定

Linux区分SSD和机械硬盘的方法总结

《Linux区分SSD和机械硬盘的方法总结》在Linux系统管理中,了解存储设备的类型和特性是至关重要的,不同的存储介质(如固态硬盘SSD和机械硬盘HDD)在性能、可靠性和适用场景上有着显著差异,本文... 目录一、lsblk 命令简介基本用法二、识别磁盘类型的关键参数:ROTA查询 ROTA 参数ROTA

嵌入式Linux之使用设备树驱动GPIO的实现方式

《嵌入式Linux之使用设备树驱动GPIO的实现方式》:本文主要介绍嵌入式Linux之使用设备树驱动GPIO的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、设备树配置1.1 添加 pinctrl 节点1.2 添加 LED 设备节点二、编写驱动程序2.1

嵌入式Linux驱动中的异步通知机制详解

《嵌入式Linux驱动中的异步通知机制详解》:本文主要介绍嵌入式Linux驱动中的异步通知机制,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、异步通知的核心概念1. 什么是异步通知2. 异步通知的关键组件二、异步通知的实现原理三、代码示例分析1. 设备结构

Linux搭建单机MySQL8.0.26版本的操作方法

《Linux搭建单机MySQL8.0.26版本的操作方法》:本文主要介绍Linux搭建单机MySQL8.0.26版本的操作方法,本文通过图文并茂的形式给大家讲解的非常详细,感兴趣的朋友一起看看吧... 目录概述环境信息数据库服务安装步骤下载前置依赖服务下载方式一:进入官网下载,并上传到宿主机中,适合离线环境

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti