【Linux基础系列之】内存管理(1)-buddy和slub算法

2024-03-15 17:38

本文主要是介绍【Linux基础系列之】内存管理(1)-buddy和slub算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Linux内存管理是一个很复杂的系统,也是linux的精髓之一,网络上讲解这方面的文档也很多,我把这段时间学习内存管理方面的知识记录在这里,涉及的代码太多,也没有太多仔细的去看代码,深入解算法,这篇文章就当做内存方面学习的一个入门文档,方便以后在深入学习内存管理源码的一个指导作用;


(一)NUMA架构

  NUMA通过提供分离的存储器给各个处理器,避免当多个处理器访问同一个存储器产生的性能损失来试图解决这个问题。对于涉及到分散的数据的应用(在服务器和类似于服务器的应用中很常见),NUMA可以通过一个共享的存储器提高性能至n倍,而n大约是处理器(或者分离的存储器)的个数。

这里写图片描述

  当然,不是所有数据都局限于一个任务,所以多个处理器可能需要同一个数据。为了处理这种情况,NUMA系统包含了附加的软件或者硬件来移动不同存储器的数据。这个操作降低了对应于这些存储器的处理器的性能,所以总体的速度提升受制于运行任务的特点。

  Linux把物理内存划分为三个层次来管理:

  1. 存储节点(Node): CPU被划分为多个节点(node), 内存则被分簇, 每个CPU对应一个本地物理内存, 即一个CPU-node对应一个内存簇bank,即每个内存簇被认为是一个节点;

  2. 管理区(Zone):每个物理内存节点node被划分为多个内存管理区域, 用于表示不同范围的内存,内核可以使用不同的映射方式映射物理内存,通常管理区的类型可以分为:ZONE_NORMAL,ZONE_DMA,ZONE_HIGHMEM三种;内核(32位为例内核空间为1G)空间如下:

这里写图片描述

  如果物理内存超过896 MiB就为highmem,则内核无法直接映射全部物理内存,最后的128 MiB用于其他目的,比如vmalloc就可以从这里分配不连续的内存,最珍贵的是3GB起始的16MB DMA区域直接用于外设和系统之间的数据传输;

  3. 页面(Page):内存被细分为多个页面帧, 页面是最基本的页面分配的单位;


  NUMA模式下,处理器被划分成多个”节点”(node), 每个节点被分配有的本地存储器空间。 所有节点中的处理器都可以访问全部的系统物理存储器,但是访问本节点内的存储器所需要的时间,比访问某些远程节点内的存储器所花的时间要少得多。Linux通过struct pglist_data这个结构体来描述节点;

 722 typedef struct pglist_data {723     struct zone node_zones[MAX_NR_ZONES];//是一个数组,包含了结点中各内存域的数据结构;724     struct zonelist node_zonelists[MAX_ZONELISTS];//指定备用结点及其内存域的列表,以便在当前结点没有可用空间时,在备用结点分配内存;725     int nr_zones;//保存结点中不同内存域的数目;726 #ifdef CONFIG_FLAT_NODE_MEM_MAP /* means !SPARSEMEM */727     struct page *node_mem_map;//指向page实例数组的指针,用于描述结点的所有物理内存页,它包含了结点中所有内存域的页。 728 #ifdef CONFIG_MEMCG729     struct page_cgroup *node_page_cgroup;730 #endif731 #ifdef CONFIG_PAGE_EXTENSION732     struct page_ext *node_page_ext;733 #endif734 #endif735 #ifndef CONFIG_NO_BOOTMEM736     struct bootmem_data *bdata;//在系统启动期间,内存管理
//子系统初始化之前,内核页需要使用内存(另外,还需要保留部分内存用于初始
//化内存管理子系统)。bootmem分配器(bootmem allocator)的机制,这种
//机制仅仅用在系统引导时,它为整个物理内存建立起一个页面位图;737 #endif738 #ifdef CONFIG_MEMORY_HOTPLUG...750 #endif751     unsigned long node_start_pfn;////该NUMA结点第一个页帧的逻辑编号。系统中所有的页帧是依次编号的,每个页帧的号码都是全局唯一的(不只是结点内唯一)。752     unsigned long node_present_pages; /* total number of physical pages */ //结点中页帧的数目;753     unsigned long node_spanned_pages; /* total size of physical page  range, including holes *///该结点以页帧为单位计算的长度,包含内存空洞。                        755     int node_id;//全局结点ID,系统中的NUMA结点都从0开始编号;756     wait_queue_head_t kswapd_wait;//交换守护进程的等待队列,在将页帧换出结点时会用到。757     wait_queue_head_t pfmemalloc_wait;758     struct task_struct *kswapd; /* Protected by759                        mem_hotplug_begin/end() *///指向负责该结点的交换守护进程的task_struct。760     int kswapd_max_order;//定义需要释放的区域的长度。761     enum zone_type classzone_idx;762 #ifdef CONFIG_NUMA_BALANCING...771 #endif772 } pg_data_t;

  每个节点的内存会被分为几个块,我们称之为管理区(zone) ,一个管理区(zone)由struct zone结构体来描述;include/linux/mmzone.h;

 327 struct zone {331     unsigned long watermark[NR_WMARK];//当系统中可用内存很少的时候,系统进程kswapd被唤醒, 开始回收释放page, 水印这些参数(WMARK_MIN, WMARK_LOW, WMARK_HIGH)影响着这个代码的行为;341     long lowmem_reserve[MAX_NR_ZONES];//为了防止一些代码必须运行在低地址区域,所以事先保留一些低地址区域的内存;342 343 #ifdef CONFIG_NUMA344     int node;345 #endif351     unsigned int inactive_ratio;//不活动页的比例,很少使用或者大部分情况下是只读的字段;352 353     struct pglist_data  *zone_pgdat;//zone所在的节点;354     struct per_cpu_pageset __percpu *pageset;//每个CPU的热/冷页帧列表,有些页帧很可能在高速缓存中,可以快速访问,故称之为热的,反之为冷;360     unsigned long       dirty_balance_reserve;361 362 #ifndef CONFIG_SPARSEMEM367     unsigned long       *pageblock_flags;368 #endif /* CONFIG_SPARSEMEM */369 370 #ifdef CONFIG_NUMA374     unsigned long       min_unmapped_pages;375     unsigned long       min_slab_pages;376 #endif /* CONFIG_NUMA */377 378     /* zone_start_pfn == zone_start_paddr >> PAGE_SHIFT */379     unsigned long       zone_start_pfn;//内存域的第一个页帧;
422     unsigned long       managed_pages;423     unsigned long       spanned_pages;//总页数,包含空洞;424     unsigned long       present_pages;//可用页数,不包涵空洞;426     const char      *name;//指向管理区类型名字;432     int         nr_migrate_reserve_block;433 434 #ifdef CONFIG_MEMORY_ISOLATION440     unsigned long       nr_isolate_pageblock;441 #endif442 443 #ifdef CONFIG_MEMORY_HOTPLUG444     /* see spanned/present_pages for more description */445     seqlock_t       span_seqlock;446 #endif
472     wait_queue_head_t   *wait_table;//进程等待队列的散列表, 这些进程正在等待管理区中的某页;473     unsigned long       wait_table_hash_nr_entries;//等待队列散列表中的调度实体数目;474     unsigned long       wait_table_bits;//等待队列散列表数组大小, 值为2^order;475 476     ZONE_PADDING(_pad1_)477 478     /* Write-intensive fields used from the page allocator */479     spinlock_t      lock;//对zone并发访问的保护的自旋锁;480 481     /* free areas of different sizes */482     struct free_area    free_area[MAX_ORDER];//没个bit标识对应的page是否可以分配;483 484     /* zone flags, see below */485     unsigned long       flags;//zone flags, 描述当前内存的状态;486 487     ZONE_PADDING(_pad2_)492     spinlock_t      lru_lock;//LRU(最近最少使用算法)的自旋锁;493     struct lruvec       lruvec;494 495     /* Evictions & activations on the inactive file list */496     atomic_long_t       inactive_age;497 503     unsigned long percpu_drift_mark;504 505 #if defined CONFIG_COMPACTION || defined CONFIG_CMA506     /* pfn where co

这篇关于【Linux基础系列之】内存管理(1)-buddy和slub算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/812735

相关文章

基于Linux的ffmpeg python的关键帧抽取

《基于Linux的ffmpegpython的关键帧抽取》本文主要介绍了基于Linux的ffmpegpython的关键帧抽取,实现以按帧或时间间隔抽取关键帧,文中通过示例代码介绍的非常详细,对大家的学... 目录1.FFmpeg的环境配置1) 创建一个虚拟环境envjavascript2) ffmpeg-py

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

使用jenv工具管理多个JDK版本的方法步骤

《使用jenv工具管理多个JDK版本的方法步骤》jenv是一个开源的Java环境管理工具,旨在帮助开发者在同一台机器上轻松管理和切换多个Java版本,:本文主要介绍使用jenv工具管理多个JD... 目录一、jenv到底是干啥的?二、jenv的核心功能(一)管理多个Java版本(二)支持插件扩展(三)环境隔

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

Linux链表操作方式

《Linux链表操作方式》:本文主要介绍Linux链表操作方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、链表基础概念与内核链表优势二、内核链表结构与宏解析三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势六、典型应用场景七、调试技巧与

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Linux实现线程同步的多种方式汇总

《Linux实现线程同步的多种方式汇总》本文详细介绍了Linux下线程同步的多种方法,包括互斥锁、自旋锁、信号量以及它们的使用示例,通过这些同步机制,可以解决线程安全问题,防止资源竞争导致的错误,示例... 目录什么是线程同步?一、互斥锁(单人洗手间规则)适用场景:特点:二、条件变量(咖啡厅取餐系统)工作流