深入理解Linux线程(LWP):概念、结构与实现机制(1)

2024-02-29 23:12

本文主要是介绍深入理解Linux线程(LWP):概念、结构与实现机制(1),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

                                               🎬慕斯主页修仙—别有洞天

                                              ♈️今日夜电波:会いたい—Naomile

                                                                1:12━━━━━━️💟──────── 4:59
                                                                    🔄   ◀️   ⏸   ▶️    ☰  

                                      💗关注👍点赞🙌收藏您的每一次鼓励都是对我莫大的支持😍


 

目录

Linux线程的概念

定义

从进程理解线程

Linux线程的理解

局部性原理

概念

线程切换为什么效率高?


Linux线程的概念

定义

        课本上的定义:线程是比进程更轻量化的一种执行流,线程是在进程内部执行的一种执行流。大白话:线程是CPU调度的基本单位,进程是承担系统资源的基本实体。

        对于Linux线程详细的定义:在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列。一切进程至少都有一个执行线程。线程在进程内部运行,本质是在进程地址空间内运行。在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化。透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流 。

 

从进程理解线程

        我们都知道Linux中的一个进程是由对应的PCB、进程地址空间、页表组成的。

        大致的图示如下:

        从上面进程的大致示意图可见,如果我们要创建一个进程,还是挺麻烦的,它要创建对应的PCB来管理,要加载各种各样的数据,涉及到IO等等。可以发现成本是挺高的。进程在创建时需要做很多工作。而线程就是在进程创建完成后,只需再创建“PCB”指向该进程的地址空间,再将代码数据等等拆解成几部分,分别让这些“PCB”进行管理对应的部分,他无需再进行资源的申请等等操作,只需进行资源的分配即可。CPU在识别到这些“PCB”时,他就会执行该进程的一部分代码、一部分数据,我们把这种比传统的进程更轻的概念叫做“线程”。当然,由于线程访问的是同一块地址空间,那么他们是很容易实现某一部分代码、数据的共享的。

        而如果OS如果要支持线程,那么也是需要管理线程的,那么就需要按照六字真言:“先描述,在组织”来进行管理。对此OS中有两种管理线程的方法:方法一:按照像上述进程一样创建PCB,额外的像进程一样创建名为:TCB(Thread Control Block)来描述,再像进程一样创建调度队列、阻塞队列、运行队列、优先级等等等等。还需要对应的数据结构、算法等等来维护起来方法二:从方法一可以知道线程所需的属性跟进程是很相似的,我们可以“拿PCB来充当TCB”,可以直接复用进程的管理方法来管理线程。在Linux中,我们就是使用方法二来管理线程的,很明显方法二更简单,更加可靠,健壮性更,更好维护。Linux中线程也叫做:轻量级进程(LWP)(light weight process)大致图示如下:

        从上图可知,Linux中其实不存在实际意义上的线程,他只是利用进程的数据结构来模拟了线程,所以CPU在调度时,他不管进程还是线程,他看到一个PCB就会执行对应的方法,他们都可以被称为“轻量级进程”。因此,上面对应的线程的执行流<=进程的执行流。

Linux线程的理解

        通过代码来理解Linux线程(对于下面的一些线程相关函数后续详细介绍):

#include <iostream>
#include <unistd.h>
#include <pthread.h>
#include <sys/types.h>
#include <unistd.h>int gcnt = 100;// 新线程
void *ThreadRoutine(void *arg)
{const char *threadname = (const char *)arg;while (true){std::cout << "I am a new thread: " << threadname << ", pid: " << getpid() << "gcnt: " << gcnt << " &gcnt: " << &gcnt << std::endl;gcnt--;sleep(1);}
}int main()
{pthread_t tid;pthread_create(&tid, NULL, ThreadRoutine, (void *)"thread 1");//创建进程while (true){std::cout << "I am main thread"<< ", pid: " << getpid()  << "gcnt: " << gcnt << " &gcnt: " << &gcnt << std::endl;sleep(1);}return 0;
}

        如下图可知:我们创建了一个线程,在创建线程后,可以很明显的看到我们共享了全局变量。对于创建了一个线程前,我们可以理解为原来只有一个线程(也就是进程)。后来创建了一个线程后,我们就拥有了两个线程,通过传入对应的函数即可区分两个进程,他们还可以共享同一段代码(全局变量)

        我们可以通过以下代码查看线程:

ps -aL 

局部性原理

概念

        局部性原理是指在程序执行期间,无论是指令还是数据的访问都倾向于聚集在一个较小的连续区域中。它主要分为两种类型:

  • 时间局部性:如果一个指令或数据刚刚被访问过,那么它将很可能在不久的将来再次被访问。这种现象是由于程序中存在循环和迭代等结构,导致相同的指令或数据被重复使用。
  • 空间局部性:如果一个指令或数据被访问,那么与其相邻的指令或数据也很可能即将被访问。这是因为程序往往是顺序执行的,指令和数据在内存中的位置通常是连续的,因此访问也是连续的。

        局部性原理是计算机体系结构中的一个重要概念,它直接影响了CPU缓存的设计和操作系统的内存管理策略。了解和利用局部性原理,可以帮助开发者编写更高效的程序,同时也指导硬件设计者优化处理器性能。

线程切换为什么效率高?

        CUP中存在着一个硬件叫做cache,他通常用于用于存储最近访问的数据和指令以提高计算机性能

        局部性原理给预加载机制提供了理论基础,预加载机制可以将一部分代码预先加载到缓冲区里,如果CPU正在访问第10行代码,以后很大概率会访问附近的代码,所以一旦访问到第10行就会把10行附近的数据和代码全部加载到内存中或者CPU的cache中。保存在cache中的数据叫做热数据。cache在缓存时是以线程为单位的,线程间切换不需要切换cache,因为他们同属于一个进程,而进程间切换需要切换cache,重新预加载。为什么线程切换为什么比进程高?因为:1、寄存器少。2、不需要重新更新cache。

 


                       感谢你耐心的看到这里ღ( ´・ᴗ・` )比心,如有哪里有错误请踢一脚作者o(╥﹏╥)o! 

                                       

                                                                        给个三连再走嘛~  

这篇关于深入理解Linux线程(LWP):概念、结构与实现机制(1)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/760411

相关文章

C#借助Spire.XLS for .NET实现在Excel中添加文档属性

《C#借助Spire.XLSfor.NET实现在Excel中添加文档属性》在日常的数据处理和项目管理中,Excel文档扮演着举足轻重的角色,本文将深入探讨如何在C#中借助强大的第三方库Spire.... 目录为什么需要程序化添加Excel文档属性使用Spire.XLS for .NET库实现文档属性管理Sp

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

Linux镜像文件制作方式

《Linux镜像文件制作方式》本文介绍了Linux镜像文件制作的过程,包括确定磁盘空间布局、制作空白镜像文件、分区与格式化、复制引导分区和其他分区... 目录1.确定磁盘空间布局2.制作空白镜像文件3.分区与格式化1) 分区2) 格式化4.复制引导分区5.复制其它分区1) 挂载2) 复制bootfs分区3)

Java数组动态扩容的实现示例

《Java数组动态扩容的实现示例》本文主要介绍了Java数组动态扩容的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1 问题2 方法3 结语1 问题实现动态的给数组添加元素效果,实现对数组扩容,原始数组使用静态分配

Python实现快速扫描目标主机的开放端口和服务

《Python实现快速扫描目标主机的开放端口和服务》这篇文章主要为大家详细介绍了如何使用Python编写一个功能强大的端口扫描器脚本,实现快速扫描目标主机的开放端口和服务,感兴趣的小伙伴可以了解下... 目录功能介绍场景应用1. 网络安全审计2. 系统管理维护3. 网络故障排查4. 合规性检查报错处理1.

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程

Python轻松实现Word到Markdown的转换

《Python轻松实现Word到Markdown的转换》在文档管理、内容发布等场景中,将Word转换为Markdown格式是常见需求,本文将介绍如何使用FreeSpire.DocforPython实现... 目录一、工具简介二、核心转换实现1. 基础单文件转换2. 批量转换Word文件三、工具特性分析优点局

Springboot3统一返回类设计全过程(从问题到实现)

《Springboot3统一返回类设计全过程(从问题到实现)》文章介绍了如何在SpringBoot3中设计一个统一返回类,以实现前后端接口返回格式的一致性,该类包含状态码、描述信息、业务数据和时间戳,... 目录Spring Boot 3 统一返回类设计:从问题到实现一、核心需求:统一返回类要解决什么问题?

Java使用Spire.Doc for Java实现Word自动化插入图片

《Java使用Spire.DocforJava实现Word自动化插入图片》在日常工作中,Word文档是不可或缺的工具,而图片作为信息传达的重要载体,其在文档中的插入与布局显得尤为关键,下面我们就来... 目录1. Spire.Doc for Java库介绍与安装2. 使用特定的环绕方式插入图片3. 在指定位